Golang Go语言处理TCP长连接丢失数据原因是什么
Golang Go语言处理TCP长连接丢失数据原因是什么
直接上代码
listen, err := net.Listen("tcp", cfg.Network.IpP)
if err != nil {
panic("can't listen port!")
}
for {
conn, err := listen.Accept()
if err != nil {
fmt.Println(err)
continue
}
go func(cn net.Conn) {
buffer := make([]byte, 1448)
for {
n, err := cn.Read(buffer)
if err != nil {
fmt.Println("tcp read error\t", err)
continue
}
//丢数据问题待解决
dataChanel <- buffer[:n]
}
}(conn)
使用 tcpdump 抓取报文有 200 条,但是程序只收到 190 条左右,丢数据的原因是什么,目前我怀疑是接收性能不足,在向通道传数据的过程中第二条数据就过来了,导致第二条数据直接被丢弃
更多关于Golang Go语言处理TCP长连接丢失数据原因是什么的实战系列教程也可以访问 https://www.itying.com/category-94-b0.html
你的想法是错误的,OS 会把未读的数据放在缓冲区
此外,没懂你的「 tcpdump 抓取报文有 200 条」是什么意思,建议把另一端的代码也放出来
err == EOF n != 0 的情况处理了么
请提供完整可复现的代码
你的 buffer 是 1448 。
所以有可能一个 tcp 段由 2 个 ip 片承载。
建议先了解一下基本网络原理,再考虑抓包之类的事情。
写网络的化建议先从简单的问题开始。
不要看包數量,看字節數,tcp 每一個數據包大小都不是固定的。
用的都是同一段 buf 接收數據並通過 chan 轉發我記得是有問題的。
用 gnet 吧 https://github.com/panjf2000/gnet
你复用了 buffer,新数据过来之后老的 buffer 就被覆盖了。拷贝一份 buffer 发送到 channel 里面。
这个不需要的 复用 buffer 是可以的
不懂 go,但是 tcpdump 的数据 200 条,是在网卡抓取的数据,和应用层的数据并不是完全对应的。
程序收到的是协议栈处理完全后的程序,而 tcpdump 里可能有未被丢弃的超时重传包、未被合并的分包等等其他数据包。
建议算字节数,应用层接收的字节数,理论上等于最后一个 tcp 的 seq - 第一个 tcp 包的 seq + 最后一个 tcp 的 datalen
如果是在一个局域网的话:
1. 网卡 mtu 是多少
2. 发送的数据是多少 (mtu 一般为 1500 tcp payload 一般为 66byte 后 payload 大于(mtu - (66-12) = payload 最大值) 如果超过 payload 最大值就会自动分片为下一个 packet)
如果就在本机测试那没有 1500 的限制,lo MTU 为 65535
+1 特别需要注意这点
buffer 的内容被覆盖了
改成这样:<br> go func(cn net.Conn) {<br> for {<br> buffer := make([]byte, 1448)<br> n, err := cn.Read(buffer)<br> if err != nil {<br> fmt.Println("tcp read error\t", err)<br> continue<br> }<br> //丢数据问题待解决<br> dataChanel <- buffer[:n]<br> }<br> }(conn)<br><br>
不知道是练手的 demo 还是给企业用。这代码不全,而且看起来问题很多。
tcpdump 检测的是 os 层级的接收写入到 tcp rec buffer window 的操作,实际上 cn.Read(buffer) 作为应用层代码,这种代码是从 tcp rec buffer window 读取数据。两者不一致是可能的。
“目前我怀疑是接收性能不足,在向通道传数据的过程中第二条数据就过来了,导致第二条数据直接被丢弃”
你这个说法表明你没有理解网络。个人建议你先看看计算机网络卷 1
发送方可以在一秒钟内发 10 次数据,总共发几千字节,而你这边可以用 cn.Read(buffer) 一次全部读出来,只要 buffer 足够大,你不读,数据也在 tcp rec buffer window 里面了。
dataChanel <- buffer[:n]
这行代码,看起来,dataChanel 里面保存的 buffer 地址指向的数据会被后面的数据覆盖。你需要重新 new 一个切片再丢进 channel 。大半年没写 go 了,有些遗忘,最好测试一下我这个说法。
ps ,你的 chanel 拼写是错的。
功底有点差。是学生?
不是学生,第一次写,感谢您的解答
感谢大家的回复!我再去学习学习
你对 tcpdump 使用的也有问题。tcpdump 这类工具不是给你数报文条数的。
你应该逐 bit 分析通信协议代码是否有 bug,tcpdump 保存数据到 wireshark 分析,或者直接用 wireshark 。发收方的 tcpdump 的数据串是一致的,通常有一方代码有 bug,应用层处理出错了。
也在学习 go 语言。
目前来看 lz 主要的问题是直接把数据缓存完之后直接传了个 slice 。
而 slice 本质就是一个指针,后续还进行了并发操作,导致指针引用的对象变化了。
可以了解一下深拷贝浅拷贝的概念。
tcp 是基于字节流、而不是基于消息包的协议。比如 tcpdump 抓到两个 IP 包,包含两个 tcp 数据,但是这两个数据可以在运输层被一次性 copy 到应用层。
在Golang中处理TCP长连接时,数据丢失的原因可能涉及多个方面,以下是一些主要原因及简要分析:
- 网络不稳定:TCP虽然提供了可靠的传输层协议,但网络本身的不稳定性仍可能导致数据包丢失。这包括网络拥塞、设备故障等。
- 程序逻辑错误:在发送或接收数据时,如果程序逻辑存在错误(如多线程同步问题、缓冲区溢出等),可能导致数据包未能正确发送或接收,从而造成数据丢失。
- TCP粘包与拆包:TCP是一个“流”协议,可能会将多个数据包拆分成多个部分发送,或者将多个小的数据包封装成一个大的数据包发送。如果接收端没有正确处理这种情况,就可能导致数据丢失或乱序。
- 心跳包维护不当:在长连接中,为了维持连接状态,需要定时发送心跳包。如果心跳包发送或接收失败,可能导致连接被错误地关闭,从而造成数据丢失。
- 资源限制:服务器资源(如内存、CPU等)不足时,可能无法及时处理或存储所有数据包,从而导致数据丢失。
为了解决这些问题,可以采取一系列措施,如优化程序逻辑、使用带缓冲的通道、正确处理TCP粘包与拆包、定期发送心跳包以及确保服务器资源充足等。