PS: 這個實現對於某些特定情況未必是最佳實現,可以用數組來代替隊列來實現
參照TCP/IP詳解第二卷24~29章,詳細論述了TCP協議的實現,大概總結一下TCP如何向應用層保證數據包的正確性、可靠性,即TCP如何實現對數據報文的重組。
首先要設計兩個報文隊列,一個存放正常來到的報文,一個存放失序到來的報文。
比如正常報文隊列最后一個報文數據如下:
報文數據段第一字節的序號 數據報長度
seq1=100 |
len1=100 |
下一個來到的報文可能有多種情況,現依次分析如下:
1)正常報文
seq2=200 |
len2=200 |
seq2 = seq1+len1
由此報文的seq可知,這個報文攜帶數據序號200~399,正是上一個報文的預期后續報文,將此報文追加到正常報文隊列。
2)完全重復報文
seq2=100 |
len2=100 |
seq2 ==seq1 而且len2==len1
這個報文攜帶數據序號100~199,與上一個報文攜帶的數據序號100~199完全一樣,即完全重復,所以應該丟棄這個報文。
3)重復子報文
seq2=100 |
len2=50 |
seq2 ==seq1 而且len2<len1
這個報文攜帶數據序號100~149,說明這是上一個報文的一部分,所以應該丟棄這個報文。
注:第二、三這兩種情況可以合並,即seq2 ==seq1 而且len2<=len1,這里分別列出只是為了說明各種不同情況。
4)部分重復報文情況一
seq2=150 |
len2=30 |
seq2>seq1而且seq2<seq1+len1而且seq2+len2<=seq1+len1
即這個報文攜帶序號150~179,這個序號段被包含在上一個報文段中(100~199),
所以應該丟棄這個報文。
5)部分重復報文情況二
seq2=150 |
len2=100 |
seq2>seq1而且seq2<seq1+len1而且seq2+len2>seq1+len1
即這個報文攜帶序號150~249,這個序號段前一部分150~199被包含在上一個報文段(100~199)中,后一部分200~249是新的數據,此時應該對這個報文作如下處理:
A. 計算重復字節數
(seq1+len1) - Seq2= 100+100-150 = 50
即這個報文段前50個字節是重復的。
B. 截取報文段新數據
丟棄這個報文段的前50字節,截取后面的新數據,即只保留字節序號段200~249。
C. 重新設置這個報文段的seq
seq2 = seq2+50 = 150+50 = 200
D. 重新設置這個報文段的數據長度
len2 = len2-50 =100-50=50
E. 重新設置后報文段如下
seq2=200 |
len2=50 |
即現在這個報文段攜帶數據序號200~249,正好是上一個報文的后續報文,現在可以將其作為正常報文追加到正常報文隊列。
6)提前到達的報文
seq2=300 |
len2=100 |
seq2>seq1+len1
這個報文段攜帶序號300~399的數據,即不是上一個報文100~199的后續報文,而是提前到來的報文,此時應該將這個報文放置到失序報文隊列存儲起來,以備后續重組使用。
這樣直到tcp斷開這個socket的鏈接(FIN=1),此時將正常報文隊列和失序報文隊列中的數據合並起來,完成重組。取出正常報文隊列最后一個報文 的seq和len,在失序報文隊列中查找屬於它的后續報文,該報文是否可以作為正常報文隊列的后續報文處理過程同前面1)~5)的分析。