本文首发于公众号 之前写过一系列网络量化相关的文章,它们都出自 Google 在 2018 年发表的一篇论文,目前也是 tflite 和 pytorch 等框架中通用的量化标准。不过,最近有读者在后 ...
本文首发于公众号 之前写过一系列网络量化相关的文章,它们都出自 Google 在 2018 年发表的一篇论文,目前也是 tflite 和 pytorch 等框架中通用的量化标准。不过,最近有读者在后 ...
(本文首发于公众号,没事来逛逛) Pytorch1.8 发布后,官方推出一个 torch.fx 的工具包,可以动态地对 forward 流程进行跟踪,并构建出模型的图结构。这个新特性能带来什么功能呢 ...
(本文首发于公众号,没事来逛逛) 这篇文章简单聊聊后训练量化的一些常规操作。 一些基础知识 在此之前,还是需要先了解一下后训练量化 (下面简称 PTQ,Post-training Quantiz ...
(本文首发于公众号,没事来逛逛) 之前写的关于网络量化的文章都是基于 per-layer 实现的,最近有小伙伴询问关于 per-channel 量化的问题,我发现有些同学对这个东西存在一些误解,包括 ...
(本文首发于公众号,没事来逛逛) 前面介绍了一些后训练量化的基本方法,从这篇文章开始我们来学习一些高阶操作。 首先登场的是高通提出的一篇论文:Data-Free Quantization Thro ...