一、TCP粘包產(chǎn)生的原理
1.TCP粘包是指發(fā)送方發(fā)送的若干包數(shù)據(jù)到接收方接收時(shí)粘成一包,從接收緩沖區(qū)看,后一包數(shù)據(jù)的頭緊接著前一包數(shù)據(jù)的尾。出現(xiàn)粘包現(xiàn)象的原因是多方面的,它既可能由發(fā)送方造成,也可能由接收方造成。
2.發(fā)送方引起的粘包是由TCP協(xié)議本身造成的,TCP為提高傳輸效率,發(fā)送方往往要收集到足夠多的數(shù)據(jù)后才發(fā)送一包數(shù)據(jù)。若連續(xù)幾次發(fā)送的數(shù)據(jù)都很少,通常TCP會(huì)根據(jù)優(yōu)化算法把這些數(shù)據(jù)合成一包后一次發(fā)送出去,這樣接收方就收到了粘包數(shù)據(jù)。接收方引起的粘包是由于接收方用戶進(jìn)程不及時(shí)接收數(shù)據(jù),從而導(dǎo)致粘包現(xiàn)象。
3.這是因?yàn)榻邮辗较劝咽盏降臄?shù)據(jù)放在系統(tǒng)接收緩沖區(qū),用戶進(jìn)程從該緩沖區(qū)取數(shù)據(jù),若下一包數(shù)據(jù)到達(dá)時(shí)前一包數(shù)據(jù)尚未被用戶進(jìn)程取走,則下一包數(shù)據(jù)放到系統(tǒng)接收緩沖區(qū)時(shí)就接到前一包數(shù)據(jù)之后,而用戶進(jìn)程根據(jù)預(yù)先設(shè)定的緩沖區(qū)大小從系統(tǒng)接收緩沖區(qū)取數(shù)據(jù),這樣就一次取到了多包數(shù)據(jù)。、
二、解決原理及代碼實(shí)現(xiàn)
1.采用包頭(固定長(zhǎng)度,里面存著包體的長(zhǎng)度,發(fā)送時(shí)動(dòng)態(tài)獲取)+包體的傳輸機(jī)制。如圖
HeaderSize 存放著包體的長(zhǎng)度,其HeaderSize本身是定長(zhǎng)4字節(jié);
一個(gè)完整的數(shù)據(jù)包(L)=HeaderSize+BodySize;
2.分包算法
其基本思路是首先將待處理的接收數(shù)據(jù)流即系統(tǒng)緩沖區(qū)數(shù)據(jù)(長(zhǎng)度設(shè)為M)強(qiáng)行轉(zhuǎn)換成預(yù)定的結(jié)構(gòu)數(shù)據(jù)形式,并從中取出結(jié)構(gòu)數(shù)據(jù)長(zhǎng)度字段L,而后根據(jù)包頭計(jì)算得到第一包數(shù)據(jù)長(zhǎng)度。
M=系統(tǒng)緩沖區(qū)大小;L=用戶發(fā)送的數(shù)據(jù)包=HeaderSize+BodySize;
1)若L<M,則表明數(shù)據(jù)流包含多包數(shù)據(jù),從其頭部截取若干個(gè)字節(jié)存入臨時(shí)緩沖區(qū),剩余部分?jǐn)?shù)據(jù)依此繼續(xù)循環(huán)處理,直至結(jié)束。
2)若L=M,則表明數(shù)據(jù)流內(nèi)容恰好是一完整結(jié)構(gòu)數(shù)據(jù)(即用戶自定義緩沖區(qū)等于系統(tǒng)接收緩沖區(qū)大小),直接將其存入臨時(shí)緩沖區(qū)即可。
3)若L>M,則表明數(shù)據(jù)流內(nèi)容尚不夠構(gòu)成一完整結(jié)構(gòu)數(shù)據(jù),需留待與下一包數(shù)據(jù)合并后再行處理。
4)下面是代碼代碼實(shí)現(xiàn)(HP-SOCKET框架的服務(wù)器端來接收數(shù)據(jù))
int headSize = 4;//包頭長(zhǎng)度 固定4
byte[] surplusBuffer = null;//不完整的數(shù)據(jù)包,即用戶自定義緩沖區(qū)
/// <summary>
/// 接收客戶端發(fā)來的數(shù)據(jù)
/// </summary>
/// <param name="connId">每個(gè)客戶的會(huì)話ID</param>
/// <param name="bytes">緩沖區(qū)數(shù)據(jù)</param>
/// <returns></returns>
private HandleResult OnReceive(IntPtr connId, byte[] bytes)
{
//bytes 為系統(tǒng)緩沖區(qū)數(shù)據(jù)
//bytesRead為系統(tǒng)緩沖區(qū)長(zhǎng)度
int bytesRead = bytes.Length;
if (bytesRead > 0)
{
if (surplusBuffer == null)//判斷是不是第一次接收,為空說是第一次
surplusBuffer = bytes;//把系統(tǒng)緩沖區(qū)數(shù)據(jù)放在自定義緩沖區(qū)里面
else
surplusBuffer = surplusBuffer.Concat(bytes).ToArray();//拼接上一次剩余的包
//已經(jīng)完成讀取每個(gè)數(shù)據(jù)包長(zhǎng)度
int haveRead = 0;
//這里totalLen的長(zhǎng)度有可能大于緩沖區(qū)大小的(因?yàn)?這里的surplusBuffer 是系統(tǒng)緩沖區(qū)+不完整的數(shù)據(jù)包)
int totalLen = surplusBuffer.Length;
while (haveRead <= totalLen)
{
//如果在N此拆解后剩余的數(shù)據(jù)包連一個(gè)包頭的長(zhǎng)度都不夠
//說明是上次讀取N個(gè)完整數(shù)據(jù)包后,剩下的最后一個(gè)非完整的數(shù)據(jù)包
if (totalLen - haveRead < headSize)
{
byte[] byteSub = new byte[totalLen - haveRead];
//把剩下不夠一個(gè)完整的數(shù)據(jù)包存起來
Buffer.BlockCopy(surplusBuffer, haveRead, byteSub, 0, totalLen - haveRead);
surplusBuffer = byteSub;
totalLen = 0;
break;
}
//如果夠了一個(gè)完整包,則讀取包頭的數(shù)據(jù)
byte[] headByte = new byte[headSize];
Buffer.BlockCopy(surplusBuffer, haveRead, headByte, 0, headSize);//從緩沖區(qū)里讀取包頭的字節(jié)
int bodySize = BitConverter.ToInt32(headByte, 0);//從包頭里面分析出包體的長(zhǎng)度
//這里的 haveRead=等于N個(gè)數(shù)據(jù)包的長(zhǎng)度 從0開始;0,1,2,3....N
//如果自定義緩沖區(qū)拆解N個(gè)包后的長(zhǎng)度 大于 總長(zhǎng)度,說最后一段數(shù)據(jù)不夠一個(gè)完整的包了,拆出來保存
if (haveRead + headSize + bodySize > totalLen)
{
byte[] byteSub = new byte[totalLen - haveRead];
Buffer.BlockCopy(surplusBuffer, haveRead, byteSub, 0, totalLen - haveRead);
surplusBuffer = byteSub;
break;
}
else
{
//挨個(gè)分解每個(gè)包,解析成實(shí)際文字
String strc = Encoding.UTF8.GetString(surplusBuffer, haveRead + headSize, bodySize);
//AddMsg(string.Format(" > [OnReceive] -> {0}", strc));
//依次累加當(dāng)前的數(shù)據(jù)包的長(zhǎng)度
haveRead = haveRead + headSize + bodySize;
if (headSize + bodySize == bytesRead)//如果當(dāng)前接收的數(shù)據(jù)包長(zhǎng)度正好等于緩沖區(qū)長(zhǎng)度,則待拼接的不規(guī)則數(shù)據(jù)長(zhǎng)度歸0
{
surplusBuffer = null;//設(shè)置空 回到原始狀態(tài)
totalLen = 0;//清0
}
}
}
}
return HandleResult.Ok;
}
值此完成拆包解析文字工作。但實(shí)際上還沒完成,如果這段代碼是客戶端接收來自服務(wù)器的數(shù)據(jù)的話就沒問題了。
仔細(xì)看IntPtr connId 每個(gè)連接的會(huì)話ID
private HandleResult OnReceive(IntPtr connId, byte[] bytes)
{
}
但是服務(wù)器端還要分辨出 每個(gè)數(shù)據(jù)包是哪個(gè)會(huì)話產(chǎn)生的,因?yàn)榉?wù)器端是多線程,多用戶的模式,第一個(gè)數(shù)據(jù)包和第二個(gè)可能來自不同會(huì)話的數(shù)據(jù),所以上面的代碼只適用于單會(huì)話模式。
下面我要解決這個(gè)問題。
采用c#安全的ConcurrentDictionary,具體參考 https://msdn.microsoft.com/zh-cn/library/dd287191(v=vs.110).aspx
最新的代碼
//線程安全的字典
ConcurrentDictionary<IntPtr, byte[]> dic = new ConcurrentDictionary<IntPtr, byte[]>();
int headSize = 4;//包頭長(zhǎng)度 固定4
/// <summary>
/// 接收客戶端發(fā)來的數(shù)據(jù)
/// </summary>
/// <param name="connId">每個(gè)客戶的會(huì)話ID</param>
/// <param name="bytes">緩沖區(qū)數(shù)據(jù)</param>
/// <returns></returns>
private HandleResult OnReceive(IntPtr connId, byte[] bytes)
{
//bytes 為系統(tǒng)緩沖區(qū)數(shù)據(jù)
//bytesRead為系統(tǒng)緩沖區(qū)長(zhǎng)度
int bytesRead = bytes.Length;
if (bytesRead > 0)
{
byte[] surplusBuffer = null;
if (dic.TryGetValue(connId, out surplusBuffer))
{
byte[] curBuffer = surplusBuffer.Concat(bytes).ToArray();//拼接上一次剩余的包
//更新會(huì)話ID 的最新字節(jié)
dic.TryUpdate(connId, curBuffer, surplusBuffer);
surplusBuffer = curBuffer;//同步
}
else
{
//添加會(huì)話ID的bytes
dic.TryAdd(connId, bytes);
surplusBuffer = bytes;//同步
}
//已經(jīng)完成讀取每個(gè)數(shù)據(jù)包長(zhǎng)度
int haveRead = 0;
//這里totalLen的長(zhǎng)度有可能大于緩沖區(qū)大小的(因?yàn)?這里的surplusBuffer 是系統(tǒng)緩沖區(qū)+不完整的數(shù)據(jù)包)
int totalLen = surplusBuffer.Length;
while (haveRead <= totalLen)
{
//如果在N此拆解后剩余的數(shù)據(jù)包連一個(gè)包頭的長(zhǎng)度都不夠
//說明是上次讀取N個(gè)完整數(shù)據(jù)包后,剩下的最后一個(gè)非完整的數(shù)據(jù)包
if (totalLen - haveRead < headSize)
{
byte[] byteSub = new byte[totalLen - haveRead];
//把剩下不夠一個(gè)完整的數(shù)據(jù)包存起來
Buffer.BlockCopy(surplusBuffer, haveRead, byteSub, 0, totalLen - haveRead);
dic.TryUpdate(connId, byteSub, surplusBuffer);
surplusBuffer = byteSub;
totalLen = 0;
break;
}
//如果夠了一個(gè)完整包,則讀取包頭的數(shù)據(jù)
byte[] headByte = new byte[headSize];
Buffer.BlockCopy(surplusBuffer, haveRead, headByte, 0, headSize);//從緩沖區(qū)里讀取包頭的字節(jié)
int bodySize = BitConverter.ToInt32(headByte, 0);//從包頭里面分析出包體的長(zhǎng)度
//這里的 haveRead=等于N個(gè)數(shù)據(jù)包的長(zhǎng)度 從0開始;0,1,2,3....N
//如果自定義緩沖區(qū)拆解N個(gè)包后的長(zhǎng)度 大于 總長(zhǎng)度,說最后一段數(shù)據(jù)不夠一個(gè)完整的包了,拆出來保存
if (haveRead + headSize + bodySize > totalLen)
{
byte[] byteSub = new byte[totalLen - haveRead];
Buffer.BlockCopy(surplusBuffer, haveRead, byteSub, 0, totalLen - haveRead);
dic.TryUpdate(connId, byteSub, surplusBuffer);
surplusBuffer = byteSub;
break;
}
else
{
//挨個(gè)分解每個(gè)包,解析成實(shí)際文字
String strc = Encoding.UTF8.GetString(surplusBuffer, haveRead + headSize, bodySize);
AddMsg(string.Format(" > {0}[OnReceive] -> {1}", connId, strc));
//依次累加當(dāng)前的數(shù)據(jù)包的長(zhǎng)度
haveRead = haveRead + headSize + bodySize;
if (headSize + bodySize == bytesRead)//如果當(dāng)前接收的數(shù)據(jù)包長(zhǎng)度正好等于緩沖區(qū)長(zhǎng)度,則待拼接的不規(guī)則數(shù)據(jù)長(zhǎng)度歸0
{
byte[] xbtye=null;
dic.TryRemove(connId, out xbtye);
surplusBuffer = null;//設(shè)置空 回到原始狀態(tài)
totalLen = 0;//清0
}
}
}
}
return HandleResult.Ok;
}
這樣就解決了,多客戶端會(huì)話造成的接收混亂。至此所有工作完成。以上代碼就是為了參考學(xué)習(xí),如果實(shí)在不想這么麻煩。可以直接使用HP-SOCKET通信框架的PACK模型,里面自動(dòng)實(shí)現(xiàn)了解決粘包的問題。
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持html5模板網(wǎng)。