C#中TCP粘包問題的解決方法
一、TCP粘包產生的原理
1.TCP粘包是指發送方發送的若干包數據到接收方接收時粘成一包,從接收緩沖區看,后一包數據的頭緊接着前一包數據的尾。出現粘包現象的原因是多方面的,它既可能由發送方造成,也可能由接收方造成。
2.發送方引起的粘包是由TCP協議本身造成的,TCP為提高傳輸效率,發送方往往要收集到足夠多的數據后才發送一包數據。若連續幾次發送的數據都很少,通常TCP會根據優化算法把這些數據合成一包后一次發送出去,這樣接收方就收到了粘包數據。接收方引起的粘包是由於接收方用戶進程不及時接收數據,從而導致粘包現象。
3.這是因為接收方先把收到的數據放在系統接收緩沖區,用戶進程從該緩沖區取數據,若下一包數據到達時前一包數據尚未被用戶進程取走,則下一包數據放到系統接收緩沖區時就接到前一包數據之后,而用戶進程根據預先設定的緩沖區大小從系統接收緩沖區取數據,這樣就一次取到了多包數據。、
二、解決原理及代碼實現
1.采用包頭(固定長度,里面存着包體的長度,發送時動態獲取)+包體的傳輸機制。如圖
HeaderSize 存放着包體的長度,其HeaderSize本身是定長4字節;
一個完整的數據包(L)=HeaderSize+BodySize;
2.分包算法
其基本思路是首先將待處理的接收數據流即系統緩沖區數據(長度設為M)強行轉換成預定的結構數據形式,並從中取出結構數據長度字段L,而后根據包頭計算得到第一包數據長度。
M=系統緩沖區大小;L=用戶發送的數據包=HeaderSize+BodySize;
1)若L<M,則表明數據流包含多包數據,從其頭部截取若干個字節存入臨時緩沖區,剩余部分數據依此繼續循環處理,直至結束。
2)若L=M,則表明數據流內容恰好是一完整結構數據(即用戶自定義緩沖區等於系統接收緩沖區大小),直接將其存入臨時緩沖區即可。
3)若L>M,則表明數據流內容尚不夠構成一完整結構數據,需留待與下一包數據合並后再行處理。
4)下面是代碼代碼實現(HP-SOCKET框架的服務器端來接收數據)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
|
int
headSize = 4;
//包頭長度 固定4
byte
[] surplusBuffer =
null
;
//不完整的數據包,即用戶自定義緩沖區
/// <summary>
/// 接收客戶端發來的數據
/// </summary>
/// <param name="connId">每個客戶的會話ID</param>
/// <param name="bytes">緩沖區數據</param>
/// <returns></returns>
private
HandleResult OnReceive(IntPtr connId,
byte
[] bytes)
{
//bytes 為系統緩沖區數據
//bytesRead為系統緩沖區長度
int
bytesRead = bytes.Length;
if
(bytesRead > 0)
{
if
(surplusBuffer ==
null
)
//判斷是不是第一次接收,為空說是第一次
surplusBuffer = bytes;
//把系統緩沖區數據放在自定義緩沖區里面
else
surplusBuffer = surplusBuffer.Concat(bytes).ToArray();
//拼接上一次剩余的包
//已經完成讀取每個數據包長度
int
haveRead = 0;
//這里totalLen的長度有可能大於緩沖區大小的(因為 這里的surplusBuffer 是系統緩沖區+不完整的數據包)
int
totalLen = surplusBuffer.Length;
while
(haveRead <= totalLen)
{
//如果在N此拆解后剩余的數據包連一個包頭的長度都不夠
//說明是上次讀取N個完整數據包后,剩下的最后一個非完整的數據包
if
(totalLen - haveRead < headSize)
{
byte
[] byteSub =
new
byte
[totalLen - haveRead];
//把剩下不夠一個完整的數據包存起來
Buffer.BlockCopy(surplusBuffer, haveRead, byteSub, 0, totalLen - haveRead);
surplusBuffer = byteSub;
totalLen = 0;
break
;
}
//如果夠了一個完整包,則讀取包頭的數據
byte
[] headByte =
new
byte
[headSize];
Buffer.BlockCopy(surplusBuffer, haveRead, headByte, 0, headSize);
//從緩沖區里讀取包頭的字節
int
bodySize = BitConverter.ToInt32(headByte, 0);
//從包頭里面分析出包體的長度
//這里的 haveRead=等於N個數據包的長度 從0開始;0,1,2,3....N
//如果自定義緩沖區拆解N個包后的長度 大於 總長度,說最后一段數據不夠一個完整的包了,拆出來保存
if
(haveRead + headSize + bodySize > totalLen)
{
byte
[] byteSub =
new
byte
[totalLen - haveRead];
Buffer.BlockCopy(surplusBuffer, haveRead, byteSub, 0, totalLen - haveRead);
surplusBuffer = byteSub;
break
;
}
else
{
//挨個分解每個包,解析成實際文字
String strc = Encoding.UTF8.GetString(surplusBuffer, haveRead + headSize, bodySize);
//AddMsg(string.Format(" > [OnReceive] -> {0}", strc));
//依次累加當前的數據包的長度
haveRead = haveRead + headSize + bodySize;
if
(headSize + bodySize == bytesRead)
//如果當前接收的數據包長度正好等於緩沖區長度,則待拼接的不規則數據長度歸0
{
surplusBuffer =
null
;
//設置空 回到原始狀態
totalLen = 0;
//清0
}
}
}
}
return
HandleResult.Ok;
}
|
值此完成拆包解析文字工作。但實際上還沒完成,如果這段代碼是客戶端接收來自服務器的數據的話就沒問題了。
仔細看IntPtr connId 每個連接的會話ID
private HandleResult OnReceive(IntPtr connId, byte[] bytes)
{
}
但是服務器端還要分辨出 每個數據包是哪個會話產生的,因為服務器端是多線程,多用戶的模式,第一個數據包和第二個可能來自不同會話的數據,所以上面的代碼只適用於單會話模式。
下面我要解決這個問題。
采用c#安全的ConcurrentDictionary,具體參考 https://msdn.microsoft.com/zh-cn/library/dd287191(v=vs.110).aspx
最新的代碼
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
|
//線程安全的字典
ConcurrentDictionary<IntPtr,
byte
[]> dic =
new
ConcurrentDictionary<IntPtr,
byte
[]>();
int
headSize = 4;
//包頭長度 固定4
/// <summary>
/// 接收客戶端發來的數據
/// </summary>
/// <param name="connId">每個客戶的會話ID</param>
/// <param name="bytes">緩沖區數據</param>
/// <returns></returns>
private
HandleResult OnReceive(IntPtr connId,
byte
[] bytes)
{
//bytes 為系統緩沖區數據
//bytesRead為系統緩沖區長度
int
bytesRead = bytes.Length;
if
(bytesRead > 0)
{
byte
[] surplusBuffer =
null
;
if
(dic.TryGetValue(connId,
out
surplusBuffer))
{
byte
[] curBuffer = surplusBuffer.Concat(bytes).ToArray();
//拼接上一次剩余的包
//更新會話ID 的最新字節
dic.TryUpdate(connId, curBuffer, surplusBuffer);
surplusBuffer = curBuffer;
//同步
}
else
{
//添加會話ID的bytes
dic.TryAdd(connId, bytes);
surplusBuffer = bytes;
//同步
}
//已經完成讀取每個數據包長度
int
haveRead = 0;
//這里totalLen的長度有可能大於緩沖區大小的(因為 這里的surplusBuffer 是系統緩沖區+不完整的數據包)
int
totalLen = surplusBuffer.Length;
while
(haveRead <= totalLen)
{
//如果在N此拆解后剩余的數據包連一個包頭的長度都不夠
//說明是上次讀取N個完整數據包后,剩下的最后一個非完整的數據包
if
(totalLen - haveRead < headSize)
{
byte
[] byteSub =
new
byte
[totalLen - haveRead];
//把剩下不夠一個完整的數據包存起來
Buffer.BlockCopy(surplusBuffer, haveRead, byteSub, 0, totalLen - haveRead);
dic.TryUpdate(connId, byteSub, surplusBuffer);
surplusBuffer = byteSub;
totalLen = 0;
break
;
}
//如果夠了一個完整包,則讀取包頭的數據
byte
[] headByte =
new
byte
[headSize];
Buffer.BlockCopy(surplusBuffer, haveRead, headByte, 0, headSize);
//從緩沖區里讀取包頭的字節
int
bodySize = BitConverter.ToInt32(headByte, 0);
//從包頭里面分析出包體的長度
//這里的 haveRead=等於N個數據包的長度 從0開始;0,1,2,3....N
//如果自定義緩沖區拆解N個包后的長度 大於 總長度,說最后一段數據不夠一個完整的包了,拆出來保存
if
(haveRead + headSize + bodySize > totalLen)
{
byte
[] byteSub =
new
byte
[totalLen - haveRead];
Buffer.BlockCopy(surplusBuffer, haveRead, byteSub, 0, totalLen - haveRead);
dic.TryUpdate(connId, byteSub, surplusBuffer);
surplusBuffer = byteSub;
break
;
}
else
{
//挨個分解每個包,解析成實際文字
String strc = Encoding.UTF8.GetString(surplusBuffer, haveRead + headSize, bodySize);
AddMsg(
string
.Format(
" > {0}[OnReceive] -> {1}"
, connId, strc));
//依次累加當前的數據包的長度
haveRead = haveRead + headSize + bodySize;
if
(headSize + bodySize == bytesRead)
//如果當前接收的數據包長度正好等於緩沖區長度,則待拼接的不規則數據長度歸0
{
byte
[] xbtye=
null
;
dic.TryRemove(connId,
out
xbtye);
surplusBuffer =
null
;
//設置空 回到原始狀態
totalLen = 0;
//清0
}
}
}
}
return
HandleResult.Ok;
}
|
這樣就解決了,多客戶端會話造成的接收混亂。至此所有工作完成。以上代碼就是為了參考學習,如果實在不想這么麻煩。可以直接使用HP-SOCKET通信框架的PACK模型,里面自動實現了解決粘包的問題。
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。