芯片即王道,微軟新DC虛機性能大揭秘
本文介紹分為以下幾個部分:
l 未開啟FPGA,東區同一VNET下,兩台VM網絡性能和延遲測試
l 開啟FPGA,東區同一VNET下,兩台VM網絡性能和延遲測試
VM都是使用(CentOS-7.4標准 E64_v3 (64 vcpu,432 GB 內存))
一. Background:
根據之前博客介紹,已經測試目前Azure Region上開啟FPGA的性能測試,包括相同情況下,是否開啟FPGA對CPU利用率的影響,具體可以參考之前的blog鏈接:http://www.cnblogs.com/wangsongshare/p/8746356.html,因為Azure在北京和上海還有增加兩個Region,在新Region下虛擬機的類型也變的更多,新增加了Dv3和Ev3兩種使用超線程技術的機器,一些客戶想做嵌套虛擬化的可以選用,同時Ev3的最大可以提供64 core,432GB內存, 對於CPU密集型或內存密集型需求的客戶業務,提供更多選擇,可以支撐SAP等Workload搬上Azure。
新Azure Region在為客戶提供了極大的選擇做高可用雙活架構,可選擇的VM也更加廣泛,這篇blog為大家測試新Region網絡的性能和FPGA對性能的影響。
在此,我們選取E64_v3最大size機器,因為網絡帶寬性能都跟機器的size有關系,具體可以參考:https://docs.microsoft.com/zh-cn/azure/virtual-machines/linux/sizes-memory,可以看到E64_v3最大網絡帶寬可以到30Gbps。
本篇采用NTTTCP工具測試吞吐量,qperf測試延遲,因為qperf可以測試精度到微秒級別,所以可以看到開啟FPGA對延遲的優化,一般的ping命令,需要通過tcpdump看時間戳進行區分。
NTTTCP安裝:https://docs.azure.cn/zh-cn/virtual-network/virtual-network-bandwidth-testing
qperf安裝:yum
二. 未開啟FPGA,東區同一VNET下,兩台VM網絡性能測試
1. qperf延遲測試,取了大概的平均值
2. NTTTCP測試帶寬吞吐量
三. 開啟FPGA,東區兩台VM網絡性能測試
1. qperf測試延遲
2. NTTTCP測試帶寬吞吐量:
四. 總結:同一VNET下 E64v3 Centos7.4測試
Tool |
FPGA Disabled |
FPGA Enabled |
NTTTCP Network |
20.87Gbps |
30.42Gbps |
qperf Latency |
0.142ms |
0.027ms |
1. 吞吐量提升:開啟FPGA可以達到官網的標稱值30Gbps,比未開啟狀態吞吐量提高50%,所以針對於大機器可以通過開啟FPGA看到吞吐量的差異;
2. 延遲優化:開啟FPGA,延遲優化將近5倍,這是一個非常高的提升,這僅僅是測試工具上看到的優化,針對於客戶特定的應用場景,還會有更大的提升。