大家好,我是痞子衡,是正經搞技術的痞子。今天痞子衡給大家介紹的是i.MXRT1010上的普通GPIO與高速GPIO極限翻轉頻率。
上一篇文章 《聊聊i.MXRT1xxx上的普通GPIO與高速GPIO差異及其用法》,痞子衡從原理上介紹了 i.MXRT1xxx 系列里普通 GPIO 和 HSGPIO 差異,今天我們就來實測它們的極限翻轉頻率,看看它們實際表現差別到底有多大。本次選擇的測試芯片是 i.MXRT1010,這顆芯片從功能上來說是目前 i.MXRT1xxx 系列里的小兄弟,但別小看它,因為是后面推出的型號,恩智浦的設計團隊為它在某些方面做了特殊的性能優化,包括 HSGPIO 性能。話不多說,開測:
一、測試准備工作
1.1 測試板卡及測試點
選定的板卡是恩智浦官方 MIMXRT1010-EVK,板卡上連接 LED 燈的是 GPIO_11,翻看芯片參考手冊,這個 PAD 既可以配到普通 GPIO(GPIO1[11]) 也可以配到 HSGPIO(GPIO2[11]),正是理想的 PAD,我們就選擇這個 PAD 做測試。此外,最終 I/O 輸出波形形態跟外圍驅動電路也有關聯,所以這里也有必要交待清楚:
- Note: 所用示波器型號是 Tektronix MDO3024, 帶寬 200MHz, 采樣率 2.5GS/s
1.2 I/O 翻轉測試代碼
測試工程我們可以直接在 \SDK_2.11.0_EVK-MIMXRT1010\boards\evkmimxrt1010\driver_examples\gpio\led_output 例程上修改,為了盡力展示 GPIO 極限性能,不受其他瓶頸因素干擾,這里選擇代碼執行性能最高的工程 build(即代碼段在 ITCM 里,數據段在 DTCM 里)。
I/O 初始化代碼很簡單,在 《普通GPIO與高速GPIO差異及其用法》 文章里都介紹清楚了。這里僅有一點注意,為了統一最終 I/O 輸出效果,不管是用於普通 GPIO 還是 HSGPIO,我們都直接將測試 PAD 配置到最快的 200MHz 運行頻率(PAD 支持的 50/100/150/200MHz 運行頻率配置不同主要是對信號幅值響應表現有影響,不過痞子衡實測這四種速度配置對於 100MHz 的 I/O 翻轉信號輸出效果是一樣的(僅示波器端觀測波形角度而言),看到的都是標准幅度的正弦波):
void io_test_init(bool useNormalGpio)
{
gpio_pin_config_t led_config = {kGPIO_DigitalOutput, 0, kGPIO_NoIntmode};
CLOCK_EnableClock(kCLOCK_Iomuxc);
IOMUXC_SetPinMux(IOMUXC_GPIO_11_GPIOMUX_IO11, 0U);
// Fast Slew Rate, R0/7, 200MHz
IOMUXC_SetPinConfig(IOMUXC_GPIO_11_GPIOMUX_IO11, 0x70F9U);
if (useNormalGpio)
{
// GPIO1
IOMUXC_GPR->GPR26 &= ~(1u << 11);
GPIO_PinInit(GPIO1, 11, &led_config);
}
else
{
// GPIO2
IOMUXC_GPR->GPR26 |= (1u << 11);
GPIO_PinInit(GPIO2, 11, &led_config);
}
}
在 GPIO 模塊里跟電平輸出控制相關的寄存器有兩個,一個是 DR 寄存器,另一個是 DR_TOGGLE 寄存器,都可用於實現輸出電平翻轉。有如下代碼所示的三種常見電平翻轉方法,在低翻轉頻率情況下,這三種方法是等效的,但是在極限翻轉頻率情況下,這三種方法表現不完全一致,下一節實測結果會告訴你:
void io_test_run(void)
{
io_test_init(false);
while (1)
{
// 電平翻轉方法一:異或位操作
//GPIO2->DR ^= 0x800;
// 電平翻轉方法二:直接賦值切換位
//GPIO2->DR = 0x800;
//GPIO2->DR = 0x000;
// 電平翻轉方法三:利用 TOGGLE 位
GPIO2->DR_TOGGLE = 0x800;
}
}
1.3 芯片系統時鍾配置
《普通GPIO與高速GPIO差異及其用法》 一文里講了,普通 GPIO 時鍾源是 IPG Bus,而 HSGPIO 時鍾源是 AHB Bus,因此測試工程里 AHB/IPG 時鍾配置會影響最終 I/O 翻轉極限頻率。下圖是 i.MXRT1010 內核結構里的 HSGPIO 通路,它和 i.MXRT1060/1170 內核結構里 HSGPIO 通路其實有點小區別,這也是 i.MXRT1010 上的優化之處。
led_output 例程里的默認系統時鍾配置,AHB/Core 時鍾來自於 PLL6 - 500MHz,AHB_PODF 設 0 (即不分頻),而 IPG Bus 時鍾源固定來自於 AHB/Core,且只能在其基礎上做 1/2/3/4 分頻,我們知道 IPG Bus 最高僅支持 150MHz,因此在這種情況下 IPG_PODF 只能設 3(四分頻),IPG 時鍾實際是 125MHz,顯然 HSGPIO 訪問可以得到最優性能,但普通 GPIO 達不到最優性能。
PLL6, CCM_ANALOG->PLL_ENET[ENET_500M_REF_EN] = 1'b1,固定 500MHz
CCM->CBCMR[PRE_PERIPH_CLK_SEL] = 2'b11,derive clock from PLL6
CCM->CBCDR[PERIPH_CLK_SEL] = 1'b0,derive clock selected by CCM->CBCMR[PRE_PERIPH_CLK_SEL]
CCM->CBCDR[AHB_PODF] = 3'b000,divide by 1
CCM->CBCDR[IPG_PODF] = 2'b11,divide by 4
為了測試普通 GPIO 的最優性能,我們需要同時再測試一種新的系統時鍾配置,AHB/Core 時鍾源選用 PLL2_PFD3,將這個源配置為 452.6 MHz,AHB_PODF 依舊設 0,這樣 IPG_PODF 設 2(三分頻)可以得到 150.8MHz 的 IPG 時鍾,這時普通 GPIO 訪問可以得到最優性能,不過 HSGPIO 訪問就要損失點性能了。
PLL2,CCM_ANALOG->PFD_528[PFD3_FRAC] = 21,即 528MHz*18/PFD3_FRAC = 452.57MHz
CCM->CBCMR[PRE_PERIPH_CLK_SEL] = 2'b10,derive clock from PLL2 PFD3
CCM->CBCDR[PERIPH_CLK_SEL] = 1'b0,derive clock selected by CCM->CBCMR[PRE_PERIPH_CLK_SEL]
CCM->CBCDR[AHB_PODF] = 3'b000,divide by 1
CCM->CBCDR[IPG_PODF] = 2'b10,divide by 3
二、測試波形結果
准備工作都做完了,現在就是示波器連上板卡開始實測了,根據組合,一共有時鍾配置(x2)* I/O 類型(x2)* 翻轉方法(x3)總計 12 個結果,這里僅貼出 HSGPIO 在 500MHz AHB/Core 時鍾頻率下的三種翻轉方法所得到的波形結果,全部測試結果見最后一節。
首先是 GPIO->DR 寄存器異或位操作得到的波形結果,為了減少 while(1) 的執行對翻轉頻率的影響(畢竟這一句 B.N 跳轉指令也是要消耗 CPU 周期的),我們在 while(1) 里加十次翻轉代碼,統計結果時取 5/10 個波形周期求平均,最終得到翻轉頻率為 22.946 MHz,效果似乎一般。匯編窗口來看,這句 C 代碼異或操作被翻譯成了三條指令,先 LDR 指令讀出 GPIO->DR 寄存器當前值,然后 EOR 指令做異或操作,最后再 STR 指令寫入 GPIO->DR 寄存器,應該是 LDR 回讀指令耗時較長。
再來看 GPIO->DR_TOGGLE 置位操作和 GPIO->DR 的直接寫入操作結果,實測下來發現這兩種方法得到的翻轉頻率是一樣的(從匯編窗口來看兩種翻轉方法都是僅一條 STR 指令搞定),都是 250MHz,效果雖好,但有點過頭,因為波形里看到的不是標准幅值 3.3V 的方波(暫不確定是不是 200MHz 帶寬的示波器瓶頸),而是減半幅值(約 1.6V )的正弦波,也不排除 PAD 最大運行速度是 200MHz,它只能保證在低於 200MHz 的情況下有很好的電壓幅值響應表現(包括翻轉斜率),超過這個頻率,波形頻率值不受影響,但電壓幅值響應表現不能保證。
為了驗證是不是示波器瓶頸,痞子衡找了台更高性能的 Tektronix MSO5204(帶寬 2GHz, 采樣率 10GS/s),復測了一下這個 250MHz 的信號,得到結果略有改善,但幅度一樣有衰減(2.34V),還是 PAD 本身限制。
三、完整結果統計
現在我們來看一下全部的結果,因為三種 I/O 翻轉方法里有兩種效果是一樣的,所以我們省略了 GPIO->DR 直接寫入這種方法的結果,最終得到了 8 個結果。根據實測結果,我們得到了如下結論:
- 總結1: PAD配置里的運行頻率並不限制最終輸出翻轉頻率,只是無法保證超過設置頻率后的波形幅值響應表現(包括翻轉斜率)
- 總結2: 置位 GPIO->DR_TOGGLE 寄存器可獲得最佳 I/O 翻轉性能
- 總結3: 普通 GPIO 翻轉頻率約是時鍾源 IPG Bus 的 1/7.5,極限翻轉頻率是 20.614MHz
- 總結4: HSGPIO 翻轉頻率約是時鍾源 AHB Bus 的 1/2,極限翻轉頻率是 250MHz
AHB/Core時鍾頻率 | IPG總線時鍾頻率 | I/O PAD配置 | I/O翻轉方法 | 普通GPIO極限翻轉頻率 | 高速GPIO極限翻轉頻率 |
---|---|---|---|---|---|
500MHz | 125MHz | Fast Slew, 200MHz | 異或GPIO->DR | 5.214MHz 標准幅度方波 |
22.946MHz 標准幅度方波 |
500MHz | 125MHz | Fast Slew, 200MHz | 置位GPIO->DR_TOGGLE | 15.533MHz 標准幅度方波 |
250MHz 減半幅度正弦波 |
452.6MHz | 150.8MHz | Fast Slew, 200MHz | 異或GPIO->DR | 6.309MHz 標准幅度方波 |
18.864MHz 標准幅度方波 |
452.6MHz | 150.8MHz | Fast Slew, 200MHz | 置位GPIO->DR_TOGGLE | 20.614MHz 標准幅度方波 |
226.244MHz 減半幅度正弦波 |
四、一個有趣的問題
最后再留一個開放問題,在痞子衡舊文 《以GPIO模塊為例談談中斷處理函數(IRQHandler)的標准流程》 里提到過 ARM Errata 838869 ,即在 Cortex-M4/7 上,如果 CPU 執行速度遠遠高於 GPIO 外設寄存器寫入速度,如果代碼邏輯里涉及 GPIO 寄存器回讀,一般需要在 GPIO 寄存器寫入操作后額外插入 DSB 指令來保證同步。
我們現在在 500MHz AHB/Core 時鍾頻率下 HSGPIO 翻轉代碼里額外插入 DSB 指令,看看有什么影響,結果翻轉頻率從 250MHz 一下子降到了 35.8MHz。
至此,i.MXRT1010上的普通GPIO與高速GPIO極限翻轉頻率痞子衡便介紹完畢了,掌聲在哪里~~~
歡迎訂閱
文章會同時發布到我的 博客園主頁、CSDN主頁、知乎主頁、微信公眾號 平台上。
微信搜索"痞子衡嵌入式"或者掃描下面二維碼,就可以在手機上第一時間看了哦。