陈少文的网站Recent content on 陈少文的网站马上订阅 陈少文的网站 RSS 更新: https://www.chenshaowen.com/atom.xml什么是模型量化微信公众号2025年9月6日 08:00博文模型量化优化1. 什么是模型量化 模型量化是将高精度的模型(通常为 32 位浮点数 FP32 或 16 位浮点数 FP16 )的权重和激活值转换为低精度模型(如 8 位整数 INT8)的过程。 FP32 的值范围为 -3.4*10^38 到 3.4*10^38,有 40 亿个值。而对于 INT8,我们只能看到可能值集内的 256 个值,值范围为查看完整文章