相关内容简体繁体

pytorch的三种量化方式详解

本文转载自查看原文 2021-11-23 12:03 3172 pytorch

pytorch的三种量化方式详解

这篇博客详细介绍了pytorch官方教程提到的三种量化方式的原理，详细解释了三种量化方式的区别；

1. 静态量化：torch.quantize_per_tensor

scale （标度）和 zero_point（零点位置）需要自定义。量化后的模型，不能训练（不能反向传播），也不能推理，需要解量化后，才能进行运算
详细的解释，参考这篇博客：静态量化

2. 动态量化： torch.quantization.quantize_dynamic

系统自动选择最合适的scale （标度）和 zero_point（零点位置），不需要自定义。量化后的模型，可以推理运算，但不能训练（不能反向传播）
详细的解释，参考这篇博客：动态量化

3. 量化意识训练

系统自动选择最合适的scale （标度）和 zero_point（零点位置），不需要自定义。但这是一种伪量化，量化后的模型权重仍然是32位浮点数，但大小和8位定点数权重的大小相同。伪量化后的模型可以进行训练。虽然是以32位浮点数进行的训练，但结果与8位定点数的结果一致。
示例程序：量化意识训练

pytorch量化官方教程：

中文教程
 English Tutorial

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 Selenium：三种等待方式详解线程的三种实现方式详解 Spring事务之详解--三种实现方式 js this详解，事件的三种绑定方式 Selenium 三种等待方式详解 EF三种编程方式图文详解 Python selenium 三种等待方式详解 selenium 三种等待方式详解基于JavaScript 声明全局变量的三种方式详解详解Tensorflow数据读取有三种方式（next_batch）

粤ICP备18138465号 © 2018-2026 CODEPRJ.COM