原文:移动端 CPU 的深度学习模型推理性能优化——NCHW44 和 Record 原理方法详解

用户实践系列,将收录 MegEngine 用户在框架实践过程中的心得体会文章,希望能够帮助有同样使用场景的小伙伴,更好地了解和使用 MegEngine 作者:王雷 旷视科技 研发工程师 背景 随着人工智能技术的发展及应用领域的不断扩大,算力较弱的移动设备成为模型推理的重要运算载体,优化其推理性能因此成为重要的工程问题。一般认为,让模型运行于 GPU 上会比运行于 CPU 上具有较大的优势,取得可 ...

2021-08-17 15:24 0 171 推荐指数:

查看详情

深度学习推理性能优化

深度学习推理性能优化 推理性能优化: 一个越来越重要的话题 一些初期的探索和经验 推理优化四部曲 算子优化 ...

Tue Jun 23 22:05:00 CST 2020 2 1278
移动深度学习推理框架总结

移动深度学习推理框架 框架 公司 支持硬件 特性 相关资源 TensorFlow Lite Google 2017 CPU GPU: android基于OpenGL, IOS ...

Wed Mar 10 02:15:00 CST 2021 0 512
深度学习模型优化方法总结

深度学习模型优化方法有: (1)模型压缩:模型权重量化、模型权重稀疏、模型通道剪枝 (2)优化推理引擎:TVM、tensorRT、OpenVINO 模型压缩 (1)quantization:模型权重量化 (2)sparsification:模型权重稀疏 (3)channel pruning ...

Mon Feb 17 23:54:00 CST 2020 0 3260
深度学习模型移植的移动框架总结

公司这边使用自己开发的CNN库,下面列出各大公司使用的CNN库。 之前调研过NCNN和FeatureCNN   1. ncnn 是一个为手机极致优化的高性能神经网络前向计算框架   2. ncnn 从设计之初深刻考虑手机的部署和使用   3. 无第三方依赖,跨平台、手机Cpu ...

Thu Jun 27 22:53:00 CST 2019 0 800
深度学习推理框架

深度学习框架直接得到的模型太重,在移动CPU上直接部署不合适,因此将训练出的模型通过推理框架部署. 推理框架包括:模型优化器和推理引擎两部分. 推理框架选择: 带GPU的桌面系统,用TensorRt. nvidia自家的,还有量化 手机上选择,Tvm ,ncnn等arm ...

Thu Nov 05 04:01:00 CST 2020 0 1231
关于深度学习优化方法

关于深度学习优化方法(On Optimization Methods for Deep Learning) 摘要 在训练深度学习时我们的主要方法是随机梯度下降法(stochastic gradient descent methods , SGDs)。尽管它易于实现,但SGDs调整困难 ...

Sat Nov 04 06:27:00 CST 2017 0 2829
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM