深度學習模型優化方法總結

本文轉載自查看原文 2020-02-17 15:54 3260 機器學習

深度學習模型優化方法有：
（1）模型壓縮：模型權重量化、模型權重稀疏、模型通道剪枝
（2）優化推理引擎：TVM、tensorRT、OpenVINO

模型壓縮

（1）quantization：模型權重量化
（2）sparsification：模型權重稀疏
（3）channel pruning：模型通道剪枝

https://www.jiqizhixin.com/articles/2019-08-07-3
https://zhuanlan.zhihu.com/p/77275130
https://blog.csdn.net/shentanyue/article/details/83539359
（4）Distilling：模型蒸餾
先訓練好一個大網絡，在最后的softmax層使用合適的溫度參數T，最后訓練得到的概率稱為“軟目標”。以這個軟目標和真實標簽作為目標，去訓練一個比較小的網絡，訓練的時候也使用在大模型中確定的溫度參數T
https://zhuanlan.zhihu.com/p/39945855
https://www.cnblogs.com/liaohuiqiang/p/9170582.html

weights quantization 和 sparsification 屬於非結構化的壓縮，需要推理引擎和硬件的優化才能實現推理加速。

（1）Intel 的 OpenVINO
（2）NVIDA 的 tensorRT
（3）ARM 的 Tengine：https://github.com/OAID/Tengine
（4）Tencent 針對移動端應用推出 NCNN
（5）TVM
（6）XLA 方案？

L1正則化可以產生稀疏權值矩陣，即產生一個稀疏模型，可以用於特征選擇
L2正則化可以防止模型過擬合（overfitting）；一定程度上，L1也可以防止過擬合
https://blog.csdn.net/jinping_shi/article/details/52433975

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 關於深度學習的優化方法深度學習優化方法深度學習網絡壓縮模型方法總結(model compression) 深度學習最全優化方法總結比較及在tensorflow實現常見深度學習模型總結深度學習的模型是怎么訓練/優化出來的 NVIDIA GPUs上深度學習推薦模型的優化深度學習中的優化方法（二）深度學習中的優化方法（一）深度學習模型調參總結