标签【MegEngine】 - 码上欢乐

CUDA 矩阵乘法终极优化指南

作者：马骏 | 旷视 MegEngine 架构师前言单精度矩阵乘法（SGEMM）几乎是每一位学习 CUDA 的同学绕不开的案例，这个经典的计算密集型案例可以很好地展示 GPU 编程中 ...

作者：章晓 | 旷视 MegEngine 架构师一、前言 2020 年 5 月 Nvidia 发布了新一代的 GPU 架构安培（Ampere）。其中和深度学习关系最密切的莫过于性能强劲的第三代的 ...

作者：褚超群 | 旷视科技 MegEngine 架构师背景介绍在算法研究的过程中，算法同学们可能经常会尝试定义各种新的神经网络层（neural network layer），比如 L ...

用户实践系列，将收录 MegEngine 用户在框架实践过程中的心得体会文章，希望能够帮助有同样使用场景的小伙伴，更好地了解和使用 MegEngine ~ 作者：王雷 | 旷视科技研发工 ...

作者：王博文 | 旷视 MegEngine 架构师一、背景对于深度学习框架来说，网络的训练/推理时间是用户非常看中的。在实际生产条件下，用户设计的 NN 网络是千差万别，即使是同一类数学计算， ...

作者：陈振寰 | 旷视科技 MegEngine 架构师背景近年来，自动混合精度（Auto Mixed-Precision，AMP）技术在各大深度学习训练框架中作为一种使用简单、代价低 ...

Cadence DSP 算子开发上手指南

作者：洪超 | 旷视科技 MegEngine 架构师前言 Cadence 的 Vision P6/Q6/Q7 系列 DSP 在很多的 ISP (“Image Signal Proces ...