ARM平台Neon優化資源整理


筆者在日前工作當中接觸了NEON優化等內容,現將網絡上搜集到的資料整理如下,以供參考。如有侵權,盡請告知,即刻刪除。

1.官方鏈接

NEON匯編指令官方文檔:http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.dui0473j/dom1361289959991.html

NEON Intrinsics官方文檔:http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.dui0491h/Badcdfad.html

快速查找NEON Intrinsics:https://developer.arm.com/technologies/neon/intrinsics

A57優化指南(包含指令Timing(Execution Latancy & Throughput)等信息):http://infocenter.arm.com/help/topic/com.arm.doc.uan0015b/Cortex_A57_Software_Optimization_Guide_external.pdf

2.開源庫

Arm Compute library:https://github.com/ARM-software/ComputeLibrary

Ne10:http://projectne10.github.io/Ne10/

ncnn: https://github.com/Tencent/ncnn

3.中文博客

【入門】

NEON指令詳解:http://blog.csdn.net/chshplp_liaoping/article/details/12752749

NEON Intrinsics命名方式參考:http://blog.throneclay.com/2015/12/30/armneon/

優化技巧概述:

http://zyddora.github.io/2016/02/28/neon_1/

http://zyddora.github.io/2016/03/16/neon_2/

A64匯編基本語法:https://blog.csdn.net/scarecrow_byr/article/details/79676401

A64 neon匯編常用指令解析:https://jzwdsb.github.io/2018/07/neon_frequently_use/

內嵌匯編調試:https://blog.csdn.net/u012058778/article/details/54564936

【進階】

匯編代碼優化細節:http://blog.csdn.net/yang_qi168/article/details/23935141

4.Tips

4.1 關於定點除法實現的討論,涉及到牛頓迭代法等:https://community.arm.com/tools/f/discussions/930/division-with-neon

4.2 Linux環境下確認處理器是否支持NEON:

cat /proc/cpuinfo | grep neon

看是否有如下內容

Features : swp half thumb fastmult vfp edsp neon vfpv3 tlsvfpv4 idiva idivt


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM