陈少文的网站

Recent content on 陈少文的网站

马上订阅 陈少文的网站 RSS 更新: https://www.chenshaowen.com/atom.xml

什么是模型量化

微信公众号
2025年9月6日 08:00
博文模型量化优化
1. 什么是模型量化 模型量化是将高精度的模型(通常为 32 位浮点数 FP32 或 16 位浮点数 FP16 )的权重和激活值转换为低精度模型(如 8 位整数 INT8)的过程。 FP32 的值范围为 -3.4*10^38 到 3.4*10^38,有 40 亿个值。而对于 INT8,我们只能看到可能值集内的 256 个值,值范围为