作為一個后端程序員,網絡連接這塊是一個繞不過的砍,當你在做服務器優化的時候,網絡優化也是其中一環,那么作為網絡連接中最基礎的部分-TCP連接
你了解嗎?今天我們來仔細看看這個部分。
TCP建立連接-三次握手
詳解
- 客戶端和服務器還未建立連接,但服務器一般處於
listen
狀態 - 客戶端主動建立連接,向服務器發送SYN報文,客戶端變為
SYN_SENT
狀態 - 服務器收到客戶端發送的報文,也回了一個SYN報文,包含了一個ack。此時,服務器變為
SYN_RCVD
狀態 - 客戶端收到了服務器發送的SYN報文,確認了ack,它將向服務器發送一個ACK報文。此時,客戶端變為
ESTABLISHED
- 服務器收到客戶端的ACK報文,確認了ack。此時,服務器也變為
ESTABLISHED
- 服務器和客戶端可以正常通信了
其中步驟2~4就是三次握手,那么為什么需要三次握手呢?為什么不是一次或者兩次握手呢?
首先,我們需要知道,只有當服務器和客戶端都能確保自己能夠發消息和接收消息,這次網絡通信才算成功的。
步驟2的作用是讓服務器知道了自己是可以接收消息的。
步驟3的作用是讓客戶端知道自己發送消息和接收消息的功能是OK的,發送消息的能力是通過服務器返回的ack=x+1
確認的,因為這個值基於當初客戶端發送的消息seq=x
。接收消息的能力是因為收到了服務器的返回。
步驟4的作用是讓服務器端知道自己發送消息的能力是OK的(和步驟3類似)。
linux查看
linux服務器可以利用netstat -anp | grep tcp
命令,查看服務器上各個端口和應用的連接狀態。
你還可以通過修改linux的配置文件/etc/sysctl.conf
,調整各個狀態的數量
SYN_SENT
狀態相關
- 主動建立連接時,發SYN(步驟2)的重試次數
nct.ipv4.tcp_syn_rctries = 6
- 建立連接時的本地端口可用范圍
net.ipv4.ip_local_port_range = 32768 60999
SYN_RCVD
狀態相關
SYN_RCVD
狀態連接的最大個數
net.ipv4.tcp_max_syn_backlog
- 被動建立連接時,發SYN/ACK(步驟3)重試次數
net.ipv4.tcp_synack_retries
說完了TCP建立連接,接下來,我們再來看看TCP正常斷開連接的過程
TCP斷開連接-四次揮手
詳解
- 客戶端與服務器端正常傳輸數據
- 客戶端主動斷開連接,向服務器端發送FIN報文,客戶端變為
FIN_WAIT1
狀態 - 服務器收到客戶端的FIN后,向客戶端發送ACK報文,服務器變為
CLOSE_WAIT
狀態 - 客戶端收到服務器的ACK報文后,客戶端變為
FIN_WAIT2
狀態 - 服務器向客戶端發送FIN報文,服務器變為
LAST_ACK
狀態 - 客戶端收到服務器發送的FIN報文后,向服務器發送ACK報文,客戶端變為
TIME_WAIT
狀態 - 服務器收到客戶端的ACK報文后,服務器變為
CLOSED
狀態 - 客戶端經過2MSL(max segment lifetime,報文最大生存時間)時間后,也變為
CLOSED
狀態
其中,步驟2、3、5、6即為4次揮手。
TIME_WAIT
狀態及其優化
看完之后,大家想必會有一個疑問,為什么TIME_WAIT
狀態需要保持2MSL?因為這可以保證至少一次報文的往返時間內,端口是不可復用的。
假設TIME_WAIT
狀態的持續時間很短,我們來模擬下面這種場景:
- 客戶端向服務器端發送了三條報文,其中第3條報文卡在網絡中,服務器只收到了前兩條,向客戶單發送ACK=2,客戶端重新發送第三條報文。
- 服務器主動發送FIN報文,客戶端收到后發送FIN、ACK,服務器端收到后發送ACK並進入
TIME_WAIT
狀態(假設這個狀態很短)。 - 現在服務器又再次和客戶端建立連接,三次握手之后開始發送正常數據,結果之前卡住的第三條報文,現在終於發送到服務器,但服務器也不知道該如何處理這條報文。
因此這也是TIME_WAIT
狀態需要保持2MSL的原因,如果這么長時間也沒有收到報文,即使有正確的報文從客戶端發出,也已經過期了,因此不會影響到之后的通信。
但這同樣也會帶來一個問題,TIME_WAIT
狀態保持的時間較長,假設服務器端有大量TIME_WAIT
狀態的TCP連接,就相當於白白浪費掉大量的服務器資源(端口)。此時,我們可以通過修改以下配置進行服務器調優:
net.ipv4.tcp_tw_reuse = 1
- 開啟后,作為客戶端時新連接可以使用仍然處於
TIME_WAIT
狀態的端口 - 由於timestamp的存在,操作系統可以拒絕遲到的報文(例如上面說的第三條報文),可以利用以下配置:
net.ipv4.tcp_timestamps = 1
其他狀態的優化
CLOSE_WAIT
狀態
如果服務器端有大量CLOSE_WAIT
狀態的連接,很有可能是應用進程出現bug,沒有及時關閉連接。
FIN_WAIT1
狀態
調整發送FIN報文的重試次數,0相當於8
net.ipv4.tcp_orphan_retries = 0
FIN_WAIT2
狀態
調整保持在FIN_WAIT2
狀態的時間
net.ipv4.tcp_fin_timeout = 60
總結
看到這里,想必你應該對TCP連接有了一個大致的了解。現在服務器大多都用了nginx做了負載均衡,因此,我們可能需要在此基礎上了解一些nginx相關的配置原理,這樣應該會對我們的服務器性能調優會有更大的幫助。有興趣的同學不妨可以去了解一下,如果有什么新發現想和作者探討的,歡迎在下方留言。
有興趣的話可以關注我的公眾號,說不定會有意外的驚喜。