ARMCC和GCC編譯ARM代碼的軟浮點和硬浮點問題【轉】

本文轉載自查看原文 2020-07-28 11:10 511 【linux內核】

轉自：https://blog.csdn.net/hunanchenxingyu/article/details/47003279

本文介紹了ARM代碼編譯時的軟浮點(soft-float)和硬浮點(hard-float)的編譯以及鏈接實現時的不同。從VFP浮點單元的引入到軟浮點(soft-float)和硬浮點(hard-float)的概念，然后是在GCC和ARMCC RVCT工具鏈下的具體編譯參數。

VFP (vector floating-point)

從ARMv5開始，就有可選的 Vector Floating Point (VFP)模塊，當然最新的如 Cortex-A8, Cortex-A9 和 Cortex-A5 可以配置成不帶VFP的模式供芯片廠商選擇。VFP經過若干年的發展，有VFPv2 (一些 ARM9 / ARM11)、 VFPv3-D16（只使用16個浮點寄存器，默認為32個）和VFPv3+NEON (如大多數的Cortex-A8芯片)。對於包含NEON的ARM芯片，NEON一般和VFP公用寄存器。

硬浮點Hard-float

編譯器將代碼直接編譯成發射給硬件浮點協處理器（浮點運算單元FPU）去執行。FPU通常有一套額外的寄存器來完成浮點參數傳遞和運算。使用實際的硬件浮點運算單元FPU當然會帶來性能的提升。因為往往一個浮點的函數調用需要幾個或者幾十個時鍾周期。

軟浮點 Soft-float

編譯器把浮點運算轉換成浮點運算的函數調用和庫函數調用，沒有FPU的指令調用，也沒有浮點寄存器的參數傳遞。浮點參數的傳遞也是通過ARM寄存器或者堆棧完成。現在的Linux系統默認編譯選擇使用hard-float，即使系統沒有任何浮點處理器單元，這就會產生非法指令和異常。因而一般的系統鏡像都采用軟浮點以兼容沒有VFP的處理器。

armel和armhf ABI
在armel中，關於浮點數計算的約定有三種。以gcc為例，對應的-mfloat-abi參數值有三個：soft,softfp,hard。soft是指所有浮點運算全部在軟件層實現，效率當然不高，會存在不必要的浮點到整數、整數到浮點的轉換，只適合於早期沒有浮點計算單元的ARM處理器；softfp是目前armel的默認設置，它將浮點計算交給FPU處理，但函數參數的傳遞使用通用的整型寄存器而不是FPU寄存器；hard則使用FPU浮點寄存器將函數參數傳遞給FPU處理。需要注意的是，在兼容性上，soft與后兩者是兼容的，但softfp和hard兩種模式不兼容。默認情況下，armel使用softfp，因此將hard模式的armel單獨作為一個abi，稱之為armhf。而使用hard模式，在每次浮點相關函數調用時，平均能節省20個CPU周期。對ARM這樣每個周期都很重要的體系結構來說，這樣的提升無疑是巨大的。在完全不改變源碼和配置的情況下，在一些應用程序上，使用armhf能得到20%——25%的性能提升。對一些嚴重依賴於浮點運算的程序，更是可以達到300%的性能提升。

Soft-float和hard-float的編譯選項

在CodeSourcery gcc的編譯參數上，使用-mfloat-abi=name來指定浮點運算處理方式。-mfpu=name來指定浮點協處理的類型。可選類型如fpa，fpe2，fpe3，maverick，vfp，vfpv3，vfpv3-fp16，vfpv3-d16，vfpv3-d16-fp16，vfpv3xd，vfpv3xd-fp16，neon，neon-fp16，vfpv4，vfpv4-d16，fpv4-sp-d16，neon-vfpv4等。使用-mfloat-abi=hard (等價於-mhard-float) -mfpu=vfp來選擇編譯成硬浮點。使用-mfloat-abi=softfp就能兼容帶VFP的硬件以及soft-float的軟件實現，運行時的連接器ld.so會在執行浮點運算時對於運算單元的選擇，是直接的硬件調用還是庫函數調用，是執行/lib還是/lib/vfp下的libm。-mfloat-abi=soft （等價於-msoft-float）直接調用軟浮點實現庫。

在ARM RVCT工具鏈下，定義fpu模式：

? --fpu softvfp
? --fpu softvfp+vfpv2
? --fpu softvfp+vfpv3
? --fpu softvfp+vfpv_fp16
? --fpu softvfp+vfpv_d16
? --fpu softvfp+vfpv_d16_fp16.

定義浮點運算類型

--fpmode ieee_full :所有單精度float和雙精度double的精度都要和IEEE標准一致，具體的模式可以在運行時動態指定；

--fpmode ieee_fixed：舍入到最接近的實現的IEEE標准，不帶不精確的異常；

--fpmode ieee_no_fenv：舍入到最接近的實現的IEEE標准，不帶異常；

--fpmode std：非規格數flush到0、舍入到最接近的實現的IEEE標准，不帶異常；

--fpmode fast：更積極的優化，可能會有一點精度損失。

一個浮點軟鏈接實現的匯編例子

IMPORT __softfp_cos

BL __softfp_cos

ARMCC fplib浮點運算庫

__aeabi_dadd 浮點double類型數據的加法，__aeabi_fdiv 單精度浮點除法。

附錄：常見的芯片和VFP配置

Partial reference of SoC and supported ISAs

Manufacturer http://houh-1984.blog.163.com/	SoC	architecture	VFP	SIMD	Notes
Freescale	iMX5x	armv7	VFPv3	NEON	Cortex-A8; NEON only reliable in Tape-Out 3 or above
Nvidia	Tegra2	armv7	VFPv3 D16	none
Marvell	Dove	armv7	VFPv3 D16	iwMMXt
Texas Instruments	OMAP3xxx	armv7	VFPv3	NEON	Cortex-A8
Texas Instruments	OMAP4xxx	armv7	VFPv3	NEON	Cortex-A9
Texas Instruments	OMAP5xxx	armv7	VFPv4	NEON	Cortex-A15 (ARMv7-A) + Cortex-M4 (ARMv7-ME)
Qualcomm	Snapdragon	armv7	VFPv3	NEON[1]	Qualcomm "Scorpion" core
Samsung	S5PC100	armv7	VFPv3	NEON	Cortex-A8
Allwinner	A1x	armv7	VFPv3	NEON	Cortex-A8

Reference

http://houh-1984.blog.163.com/

http://wiki.debian.org/ArmHardFloatPort

http://www.claudxiao.net/2012/02/armhf/

http://armin762.wordpress.com/2010/12/09/arm-hardfloat-and-gentoo/

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 ARMCC和GCC編譯ARM代碼的軟浮點和硬浮點問題【轉】 Linux下開發stm32（一） | 使用gcc-arm-none-eabi工具鏈編譯（轉） RUST 交叉編譯 arm64 的浮點函數問題 GCC KEIL ARM編譯器交叉編譯環境(arm-himix200-linux-gcc)碰到的問題 gcc編譯問題 gcc編譯選項--轉硬浮點 VFP [轉]keil編譯鏈接過程以及ARMCC、ARMASM、FROMELF、ARMLINK、ARMAR的使用軟AP和硬AP