USB URB的status及其代表的意義
平時在處理客戶問題時,經常需要分析出現問題時抓取的usbmon log,這個log中有一個字段非常重要:URB Status word,這個字段就是struct urb結構體中的status成員變量。
通過這個status的值,可以分析出模塊端和HOST端usb的一些狀態,有利於定位到問題點。
Linux內核中對該成員變量的注釋如下:
表明該字段僅僅表示批量傳輸、控制傳輸和中斷傳輸的URB狀態,等時傳輸不在其中,不過我們的模組也沒有等時傳輸的端點。
在講解URB的status之前先看下linux中URB的處理流程,如下圖所示:
① 使用usb_alloc_urb()創建一個URB結構體
② 對於不同的傳輸方式,分別使用相應的函數初始化URB,中斷傳輸使用usb_fill_int_urb(),批量傳輸使用usb_fill_bulk_urb(),控制傳輸使用usb_fill_control_urb(),等時傳輸比較特殊需要手動初始化URB。
③ 使用usb_submit_urb()向usb控制器提交上一步初始化完成的URB,提交成功函數返回0,提交失敗函數返回一個負數。當提交失敗時,usbmon log中的Event Type字段就為 E(submission error)。
④ URB被提交到了usb控制器中,這個URB將來會有三種命運,而這三種URB的結束方式就對應到URB的status。
第一種:成功完成傳輸
第二種:傳輸發生了錯誤
第三種:URB從usb控制器中"unlinked"
⑤ 當URB結束時,會調用之前注冊的complete回調函數
URB成功傳輸的情況
在這種情況下,URB被成功發送給設備,並且設備返回正確的確認。對於一個輸出URB,表示數據被成功發送;對於一個輸入URB,成功獲取請求的數據。此時,urb->status = 0;
下面是一條qmi消息成功交互的過程:
ffff8800b7d91740 1791319201 S Ii:3:008:9 -115:256 8 < // 這里的-115(EINPROGRESS)僅僅表示URB被提交給usb控制器去處理了
ffff8800b7d90600 1791319354 S Co:3:008:0 s 21 00 0000 0004 000c 12 = 010b0000 00000001 27000000
ffff8800b7d90600 1791320572 C Co:3:008:0 0 12 > // 這里urb status為0,表示qmi request消息成功發送給模塊了
ffff8800b7d91740 1791329515 C Ii:3:008:9 0:256 8 = a1010000 04000000 // 這里Ti的urb status為0,表明可以讀取qmi的response信息了
ffff8800b7d915c0 1791329530 S Ci:3:008:0 s a1 01 0000 0004 1000 4096 <
ffff8800b7d91740 1791329570 S Ii:3:008:9 -115:256 8 <
ffff8800b7d915c0 1791331992 C Ci:3:008:0 0 19 = 01120080 00000101 27000700 02040000 000000 // 這里返回0,表示HOST端成功的讀取了模塊的qmi response
再看一下AT指令的交互過程:
ffff8800b1480f00 2819829981 S Bo:3:008:3 -115 1 = 61
ffff8800b1480f00 2819830240 C Bo:3:008:3 0 1 > // 成功向模塊發送了 A
ffff8800b1480f00 2819926000 S Bo:3:008:3 -115 1 = 74
ffff8800b1480f00 2819926105 C Bo:3:008:3 0 1 > // 成功向模塊發送了T
ffff8800b1480f00 2821094084 S Bo:3:008:3 -115 1 = 0d
ffff8800b1480f00 2821094267 C Bo:3:008:3 0 1 > // 成功向模塊發送了換行
ffff8800b1481e00 2821094738 C Bi:3:008:4 0 6 = 0d0a4f4b 0d0a
ffff8800b1481e00 2821094752 S Bi:3:008:4 -115 4096 <
ffff8800b1481b00 2821097257 C Ii:3:008:5 0:256 10 = a1200000 02000200 0000 // 成功讀取模塊的AT Response ==> OK
URB傳輸異常
urb傳輸異常就有很多種了,下面列舉一下常見的錯誤對應的status:
注:下面的usb status狀態碼在 linux-x.x.x/Documentation/usb/error-codes.txt 這個文件中有詳細的說明,可以參考一下。
-EINPROGRESS (-115)
這個字段前面已經說過了,它出現在URB submission的時候,表示這個URB的控制權交給了usb控制器,將由usb控制器處理,這個並不是真正的錯誤。
-EPROTO (-71)
有兩種原因會導致這個錯誤:
-
- A bitstuff error happened during the transfer
- No response packet was received in time by the hardware
這個錯誤經常發生在usb設備枚舉失敗時,下圖就是EC25模塊在客戶樹莓派上枚舉失敗對應的log,URB的status字段為-71
-EILSEQ (-84)
這個錯誤不太常見,具體可以參考error-codes.txt
-ECOMM (-70)
對於IN URB,在數據傳輸中,接收USB設備數據的速度 > 將數據寫入內存中的速度
-ENOSR (-63)
在OUT URB數據傳輸中,數據不能從系統內存中獲取的足夠快,以便可以跟上請求的usb的數據速率
-EPIPE (-32)
這個表明usb管道"不通",批量端點可能會設置了halt條件,設置了這種條件的端點必然會堵塞管道,可以使用usb_clear_halt()清除halt
-EOVERFLOW (-75)
當發送給端點的數據包長度大於端點特定的數據包長度時會出現這個錯誤,從錯誤碼也能看出來,數據“溢出了“
ENODEV (-19)
usb設備已經從系統中移除,但是hub沒有及時檢測到usb設備的斷開,驅動仍然提交URB,就會導致這個錯誤發生。
Note: -EPROTO、-EILSEQ、-EOVERFLOW一般是由於usb設備、設備固件或usb數據線出問題導致的。
URB從usb控制器中"unlinked"
"unlinked"發生下下面的場景下:
(1)驅動中調用 usb_unlink_urb( ) 或 usb_kill_urb( ) 主動取消一個已經提交給usb控制器的URB
調用 usb_unlink_urb( ) 之后,URB的status值為-104(ECONNRESET)
調用 usb_kill_urb( ) 之后,URB的status值為-2(ENOENT)
(2)當URB已經提交給某個usb設備,但該設備被remove了,硬件斷開了,比如將模塊從主機上拔掉,這種情況下URB的status字段就為-108(ESHUTDOWN)
下面舉幾個例子:
使用 busybox microcom /dev/ttyUSB2 命令打開模塊的AT口(open /dev/ttyUSB2),什么都不輸入,然后 ctrl+x 退出 microcom(close /dev/ttyUSB2),相應的usbmon log如下:
可以看到,當主動退出microcom時,相應的URB的status字段值為-2,對應到串口驅動中就是調用了usb_wwan_close()中的usb_kill_urb()
對應的E(submission error)是在回調函數重新提交URB產生的,此時串口已經close,再去提交就產生了錯誤。
后面URB的status字段為-1(EPERM),這里分析 usb_submit_urb() 的代碼,可以看到-1是 usb_submit_urb() 的返回值
usb_submit_urb
return usb_hcd_submit_urb;
同樣使用 busybox microcom /dev/ttyUSB2 命令打開模塊的AT口,然后此時拔掉EVB板,斷開usb設備,對應的usbmon log如下,可以比較和前面的區別:
-108(ESHUTDOWN)是usb物理層斷開URB對應的status
下面再看一下模塊autosuspend過程中的usbmon log:
echo auto > /sys/bus/usb/devices/3-2.1/power/control 使用模塊的autosuspend
ffff8800ba722240 2220899617 S Ci:3:009:0 s 80 00 0000 0000 0002 2 <
ffff8800ba722240 2220901604 C Ci:3:009:0 0 2 = 0000
ffff8800b7da3a40 2220901706 S Ii:3:009:5 -115:256 10 <
ffff8800b7da2180 2220901759 S Bi:3:009:4 -115 4096 <
ffff8800b7da2240 2220901798 S Bi:3:009:4 -115 4096 <
ffff8800b7da2f00 2220901824 S Bi:3:009:4 -115 4096 <
ffff8800b7da2d80 2220901850 S Bi:3:009:4 -115 4096 <
ffff8800ba722240 2220901891 S Co:3:009:0 s 21 22 0003 0002 0000 0
ffff8800ba722240 2220902834 C Co:3:009:0 0 0
ffff8800b7da3a40 2220905343 C Ii:3:009:5 0:256 10 = a1200000 02000200 0000
ffff8800b7da3a40 2220905360 S Ii:3:009:5 -115:256 10 <
ffff8800b7da2180 2223569116 C Bi:3:009:4 -2 0 // ① 這里等待了2s(2223, 569116 - 2220, 905360),然后進入了autosuspend ② -2是這個URB在suspend函數中被usb_kill_urb()取消了
ffff8800b7da2180 2223569160 S Bi:3:009:4 -115 4096 <
ffff8800b7da2180 2223569172 E Bi:3:009:4 -1 0 // 這里和前面出現的原因相同,模塊已經進入autosuspend,回調函數中又去提交這個URB
ffff8800b7da2240 2223569519 C Bi:3:009:4 -2 0
ffff8800b7da2240 2223569523 S Bi:3:009:4 -115 4096 <
ffff8800b7da2240 2223569528 E Bi:3:009:4 -1 0
ffff8800b7da2f00 2223569776 C Bi:3:009:4 -2 0
ffff8800b7da2f00 2223569810 S Bi:3:009:4 -115 4096 <
ffff8800b7da2f00 2223569815 E Bi:3:009:4 -1 0
ffff8800b7da2d80 2223570119 C Bi:3:009:4 -2 0
ffff8800b7da2d80 2223570159 S Bi:3:009:4 -115 4096 <
ffff8800b7da2d80 2223570167 E Bi:3:009:4 -1 0
ffff8800b7da3a40 2223571635 C Ii:3:009:5 -2:256 0
ffff8800ba722540 2223571783 S Co:3:009:0 s 00 03 0001 0000 0000 0
ffff8800ba722540 2223572943 C Co:3:009:0 0 0
ffff8800ba722540 2223573179 S Co:3:003:0 s 23 03 0002 0001 0000 0 // 這里是hub發出的,Port1:PORT_SUSPEND
ffff8800ba722540 2223574608 C Co:3:003:0 0 0