ARM 處理器 MIPS/DMIPS/MFLOPS 理解


現在隨着計算機使用了多級流水線結構,取指、譯碼、執行等並行方式,單純使用頻率確定性能不太合理,所以采用計算性能來測定cpu性能比較合理,主要有MIPS,DMIPS和FLOPS三個主要概念,

MIPS(Million Instructions Per Second):字面理解為百萬條指令/秒,即每秒執行百萬級指令數。這是衡量CPU速度的一個指標。像是一個Intel 80386 電腦可以每秒處理3百萬到5百萬機器語言指令,既我們可以說80386是3到5MIPS的CPU。MIPS只是衡量CPU性能的指標。

DMIPS(Dhrystone Million Instructions executed Per Second):Dhrystone是測量處理器運算能力的最常見基准程序之一,常用於處理器的整型運算性能的測量。Dhrystone是一種整數運算測試程序。

FLOPS:Floating-point Operations Per Second, 表示CPU的每秒執行的浮點運算次數,主要用於衡量計算機的浮點運算能力。

  • 1 MFLOPS = 10^6 FLOPS
  • 1 GFLOPS = 10^9 FLOPS
  • 1 TFLOPS = 10^12 FLOPS
  • 1 PFLOPS = 10^15 FLOPS

TOPS: Tera Operations Per Second, 處理器每秒鍾可進行10^12操作,包括整數的運算和浮點數運算,和FLOPS有一定差別。
例如 NVIDIA T4顯卡性能 :https://www.nvidia.com/en-us/data-center/tesla-t4/
說明了FP32的浮點運算為 8.1TFLOPS,但是用INT4的整數運算時,可達到 260 TOPS

參數 數值
TURING TENSOR CORES 320
NVIDIA CUDA® CORES 2,560
SINGLE PRECISION PERFORMANCE 8.1 FP32 TFLOPS
MIXED PRECISION (FP16/FP32) 65 FP16 TFLOPS
INT8 PRECISION 130 INT8 TOPS
INT4 PRECISION 260 INT4 TOPS

例如 TFLOPS比較

產品 性能
谷歌 Cloud TPU v3 420 TFLOPS
華為昇騰910 256 TFLOPS
Groq TSP 250 TFLOPS
NVIDIA Tesla V100 GPU 125 TFLOPS
Intel Movidius 100 GFLOPS
Intel 10代酷睿 1.12 (FP32)TFLOPS
2.25(FP16)TFLOPS
地平線 Sunrise 4 TOPS
高通驍龍865 15 TOPS
高通驍龍855 7 TOPS

ARM處理器比較

Cortex-A系列

Core Architecture bits I-Cache D-Cache DMIPS/MHz
ARM11 v7-A 32 4-64K 4-64K 1.25
Cortex-A5 ARMv7-A 32 4-64K 4-64K 1.57
Cortex-A7 ARMv7-A 32 8-64K 8-64K 1.9
Cortex-A8 ARMv7-A 32 16-32K 16-32K 2.0
Cortex-A9 ARMv7-A 32 16-64K 16-64K 2.5
Cortex-A12 ARMv7-A 32 - - 3.5
Cortex-A15 ARMv7-A 32 32K 32K 3.4
Cortex-A17 ARMv7-A 32 32-64K 32K 3.2
Cortex-A32 ARMv8-A 32 8-64K 8-64K 2.3
Cortex-A35 ARMv8-A 32/64 8-64K 8-64K 2.5
Cortex-A53 ARMv8-A 32/64 8-64K 8-64K 2.3
Cortex-A55 ARMv8.2-A 32/64 64K 64K 2.7
Cortex-A57 ARMv8-A 32/64 48K 32K 4.1
Cortex-A72 ARMv8-A 32/64 48K 32K 4.7
Cortex-A73 ARMv8-A 32/64 64K 32-64k 4.8
Cortex-A75 ARMv8.2-A 32/64 64K 64k 5.2
Cortex-A76 ARMv8.2-A 32/64 64K 64k -

Cortex-M系列

Core Architecture bits DMIPS/MHz DSP
Cortex-M0 ARMv6M 32 0.9~0.99
Cortex-M3 ARMv6M 32 1.25~1.5
Cortex-M4 ARMv6M 32 1.25~1.52 8/16 SMID 單精度FPU
Cortex-M7 ARMv7-M 32 2.14/2.55/3.23 8/16 SMID 雙精度FPU

參考


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM