Tags
2 个页面
LLM
显卡推理速度测试的常用指标具体含义:FA、pp512、tg128、Q4_0 都是什么意思
大模型常见张量类型入门:FP32、FP16、BF16、TF32 与 FP8