最近調試支付接口的時候,遇到了一個奇怪的問題:我按照支付接口文檔,對接支付通道,當消費業務正常后,調試查余和沖正的時候,支付通道的對接技術告訴我,系統沒有我們支付系統的請求報文,數據庫和日志中都沒有,我查看我們系統已經將報文想消費報文那樣發給同一台服務器。后來想了想是不是他們的服務器是集群服務,業務處理不在一台服務器上,或者防火牆包過濾掉了,后來經過確認排除這些原因。
靜下心想一想,數據無非經歷了計算機網絡的5層:應用層,傳輸層,網絡層,數據鏈路,物理層。我想到了抓包工具tcpdump。經過抓包發現,我們系統確實和支付系統經歷的三次握手建立了鏈接,並發送了報文數據,可是對接技術一直找不到問題所在。我告訴他,問題應該還是在應用層,只是錯誤應該出現在沒有開始記錄到日志文件的地方。最后,確實是這樣。
下邊詳細描述一下tcpdump:
概述:tcpdump是一個用於截取網絡分組,並輸出分組內容的抓包工具,類似於window下的wireshark。tcpdump憑借強大的功能和靈活的截取策略,使其成為類UNIX系統下用於網絡分析和問題排查的首選工具。 tcpdump存在於基本的Linux系統中,由於它需要將網絡界面設置為混雜模式,普通用戶不能正常執行,但具備root權限的用戶可以直接執行它來獲取網絡上的信息。使用whereis命令查找是否安裝tcpdump,並找到其命令的位置。
原理:tcpdump工作原理是將網絡中傳送的數據包的“頭”完全截獲下來提供分析,類似防火牆的包過濾。它支持針對網絡層、協議、主機、網絡或端口的過濾,並提供and、or、not等邏輯語句來幫助你去掉無用的信息。注意:不帶參數的tcpdump會收集網絡中所有的信息包頭,數據量巨大,必須過濾。
選項介紹:
-A 以ASCII格式打印出所有分組,並將鏈路層的頭最小化。 -c 在收到指定的數量的分組后,tcpdump就會停止。 -C 在將一個原始分組寫入文件之前,檢查文件當前的大小是否超過了參數file_size 中指定的大小。如果超過了指定大小,則關閉當前文件,然后在打開一個新的文件。參數 file_size 的單位是兆字節(是1,000,000字節,而不是1,048,576字節)。 -d 將匹配信息包的代碼以人們能夠理解的匯編格式給出。 -dd 將匹配信息包的代碼以c語言程序段的格式給出。 -ddd 將匹配信息包的代碼以十進制的形式給出。 -D 打印出系統中所有可以用tcpdump截包的網絡接口。 -e 在輸出行打印出數據鏈路層的頭部信息。 -E 用spi@ipaddr algo:secret解密那些以addr作為地址,並且包含了安全參數索引值spi的IPsec ESP分組。 -f 將外部的Internet地址以數字的形式打印出來。 -F 從指定的文件中讀取表達式,忽略命令行中給出的表達式。 -i 指定監聽的網絡接口。 -l 使標准輸出變為緩沖行形式,可以把數據導出到文件。 -L 列出網絡接口的已知數據鏈路。 -m 從文件module中導入SMI MIB模塊定義。該參數可以被使用多次,以導入多個MIB模塊。 -M 如果tcp報文中存在TCP-MD5選項,則需要用secret作為共享的驗證碼用於驗證TCP-MD5選選項摘要(詳情可參考RFC 2385)。 -b 在數據-鏈路層上選擇協議,包括ip、arp、rarp、ipx都是這一層的。 -n 不把網絡地址轉換成名字。 -nn 不進行端口名稱的轉換。 -N 不輸出主機名中的域名部分。例如,‘nic.ddn.mil‘只輸出’nic‘。 -t 在輸出的每一行不打印時間戳。 -O 不運行分組分組匹配(packet-matching)代碼優化程序。 -P 不將網絡接口設置成混雜模式。 -q 快速輸出。只輸出較少的協議信息。 -r 從指定的文件中讀取包(這些包一般通過-w選項產生)。 -S 將tcp的序列號以絕對值形式輸出,而不是相對值。 -s 從每個分組中讀取最開始的snaplen個字節,而不是默認的68個字節。 -T 將監聽到的包直接解釋為指定的類型的報文,常見的類型有rpc遠程過程調用)和snmp(簡單網絡管理協議;)。 -t 不在每一行中輸出時間戳。 -tt 在每一行中輸出非格式化的時間戳。 -ttt 輸出本行和前面一行之間的時間差。 -tttt 在每一行中輸出由date處理的默認格式的時間戳。 -u 輸出未解碼的NFS句柄。 -v 輸出一個稍微詳細的信息,例如在ip包中可以包括ttl和服務類型的信息。 -vv 輸出詳細的報文信息。 -w 直接將分組寫入文件中,而不是不分析並打印出來。
過濾表達式:tcpdump利用它作為過濾報文的條件,如果一個報文滿足表 達式的條件,則這個報文將會被捕獲。如果沒有給出任何條件,則網絡上所有的信息包 將會被截獲。 分為一下幾種類型:
①類型,主要包括host,net,port,例如 host 210.27.48.2, 指明 210.27.48.2是一台主機,net 202.0.0.0指明202.0.0.0是一個網絡地址,port 23 指明端口號是23。如果沒有指定類型,缺省的類型是host。
②確定傳輸方向,主要包括src,dst,dst or src,dst and src, 這些關鍵字指明了傳輸的方向。舉例說明,src 210.27.48.2 ,指明ip包中源地址是 210.27.48.2 , dst net 202.0.0.0 指明目的網絡地址是202.0.0.0。如果沒有指明 方向關鍵字,則缺省是src or dst關鍵字。 注意:實際使用中,因為很多服務器都是NAT的,所以注意過濾的ip地址。
③協議,主要包括fddi,ip,arp,rarp,tcp,udp等類型。Fddi指明是在FDDI (分布式光纖數據接口網絡)上的特定的網絡協議,實際上它是”ether”的別名,fddi和ether 具有類似的源地址和目的地址,所以可以將fddi協議包當作ether的包進行處理和分析。 其他的幾個關鍵字就是指明了監聽的包的協議內容。如果沒有指定任何協議,則tcpdump 將會 監聽所有協議的信息包。
除了這三種類型的關鍵字之外,其他重要的關鍵字如下:gateway, broadcast,less, greater, 還有三種邏輯運算,取非運算是 ‘not ' '! ‘, 與運算是’and’,’&&';或運算是’or’ ,’||’; 這些關鍵字可以組合起來構成強大的組合條件來滿足人們的需要。
補充:@20170918
1 # Flags are some combination of S (SYN), F (FIN), P (PUSH), R (RST), U (URG), W (ECN CWR), E (ECN-Echo) or `.' (ACK), or `none' 2 3 # SYN表示建立連接; 4 # FIN表示關閉連接; 5 # ACK表示響應; 6 # PSH表示有 DATA數據傳輸; 7 # RST表示連接重置。 8 9 //三次握手 10 10:06:51.850445 IP 172.16.13.73.54400 > 172.16.13.21.80: Flags [S], seq 3728728114, win 65535, options [mss 1460,nop,wscale 5,nop,nop,TS val 1153519508 ecr 0,sackOK,eol], length 0 11 10:06:51.853275 IP 172.16.13.21.80 > 172.16.13.73.54400: Flags [S.], seq 1563530223, ack 3728728115, win 14480, options [mss 1460,sackOK,TS val 2232830629 ecr 1153519508,nop,wscale 7], length 0 12 10:06:51.853303 IP 172.16.13.73.54400 > 172.16.13.21.80: Flags [.], ack 1, win 4117, options [nop,nop,TS val 1153519510 ecr 2232830629], length 0 13 14 15 //通信 16 10:07:06.761370 IP 172.16.13.73.54400 > 172.16.13.21.80: Flags [P.], seq 1:5, ack 1, win 4117, options [nop,nop,TS val 1153534364 ecr 2232830629], length 4: HTTP 17 10:07:06.763993 IP 172.16.13.21.80 > 172.16.13.73.54400: Flags [.], ack 5, win 114, options [nop,nop,TS val 2232845541 ecr 1153534364], length 0 18 10:07:06.765269 IP 172.16.13.21.80 > 172.16.13.73.54400: Flags [P.], seq 1:312, ack 5, win 114, options [nop,nop,TS val 2232845541 ecr 1153534364], length 311: HTTP: HTTP/1.1 400 Bad Request 19 20 21 22 //四次揮手 23 10:07:06.765271 IP 172.16.13.21.80 > 172.16.13.73.54400: Flags [F.], seq 312, ack 5, win 114, options [nop,nop,TS val 2232845541 ecr 1153534364], length 0 24 10:07:06.765283 IP 172.16.13.73.54400 > 172.16.13.21.80: Flags [.], ack 312, win 4108, options [nop,nop,TS val 1153534367 ecr 2232845541], length 0 25 10:07:06.765291 IP 172.16.13.73.54400 > 172.16.13.21.80: Flags [.], ack 313, win 4108, options [nop,nop,TS val 1153534367 ecr 2232845541], length 0 26 10:07:06.765444 IP 172.16.13.73.54400 > 172.16.13.21.80: Flags [F.], seq 5, ack 313, win 4108, options [nop,nop,TS val 1153534367 ecr 2232845541], length 0 27 10:07:06.767870 IP 172.16.13.21.80 > 172.16.13.73.54400: Flags [.], ack 6, win 114, options [nop,nop,TS val 2232845544 ecr 1153534367], length 0
