Nodejs socket.io 内存泄漏问题
Nodejs socket.io 内存泄漏问题
-
最近用 nodejs+socket.io(socket 版本 1.7.2)做了一个手游的服务端,最近这几天做小规模的线上测试的时候发现有内测泄露的问题(内存有减少,但减少的速度远远小于增长的速度),同时 CPU 也在不断的增长
-
具体表现就是大概 100 多人同时在在线的时候大概 5 个小时左右内存就到了 1G 了(服务器是双核 4G 的配置,只跑了这一个进程),这个是用 PM2 看 loop delay 到了 20ms 的样子, 大概内存涨到 1.5G 的时候,已经明显感觉到游戏里面各种卡、延迟。所以现在临时解决方案是内存到了 1G 的时候重启一下 node 进程
-
服务端这边没有任何密集型的运算,就只用 socket 做了一些数据的转发(即一个客户端发上来数据,我再把这个数据广播给其他人),广播的数量也不是很大,一般也最多 6 个人
-
socket 这边用户连上来的时候我把用户的一些数据保存在内存里,同时把当前用户的 socket 的对象也保存在内存里,当用户断开连接的时候删除前面保存的数据 用户从连上到断开一般在 3 分钟左右的时间(因为一局游戏时长是 3 分钟)
1.怀疑是不是 TCP 连接未释放的问题,但是在测试中发现新上来一个连接和断开之后,在 Linux 服务器上看到对应端口的连接数是有相应的变化的
2.因为游戏中有很多和时间相关的东西,所以用到了node-schedule这个库,怀疑是不是这个库造成的 但是我在代码里每次创建一个 task 的时候我都赋值给一个变量,当 task 执行后我都是先 cancel 然后在 delete 这个变量(逻辑上应该没问题)
对这块比较小白,还请给为老司机给点建议,如何下手
TCP 半开连接很正常,感觉很大几率是 TCP 未释放,通常长连接都要在应用层做心跳,你可以写个监控,实时看一下内存中的用户信息数量
netstat -nat|grep -i “port”|wc -l 我用这个命令查看了对应端口 TCP 是实时释放的, 应该是代码问题,debug 难度大啊
单纯泄漏未必会导致慢,而你体验到了慢,这是一个线索。有没有什么 eventemitter 忘记释放的?
debug 难度虽然大但是你经历过之后将会是宝贵的经验,没有什么神秘的,很有可能就是缺一行代码。我上次游戏内存泄漏整整两个月都不知道原因在哪里,差点想换另一种语言重写。后来解决以后游戏连续运行两个月都没有问题。当然,也有可能你这个问题更隐蔽。
大概率是你代码的问题
闭包这个东西用不好内存泄露不要太正常
主要是 js 这东西你很难管理内存. 虽然 c 艹 整天被黑内存泄漏.
但是说实话, 只要把生命周期独立管理起来, 想内存泄漏还是很难的.
https://www.v2ex.com/t/395867
看看这个有没有帮助?
关于Node.js中使用socket.io可能遇到的内存泄漏问题,这通常是由于资源管理不当或未正确处理事件监听器、连接等导致的。以下是一些可能的解决方法和代码示例,以帮助你诊断和修复内存泄漏问题。
-
确保正确断开连接: 在客户端断开连接时,确保服务器端也正确地销毁了相关资源。
io.on('connection', (socket) => { console.log('a user connected'); socket.on('disconnect', () => { console.log('user disconnected'); // 清理与socket相关的资源 }); });
-
避免事件监听器内存泄漏: 确保不会为每个连接或事件添加无限多的监听器。
let eventCount = 0; socket.on('someEvent', (data) => { // 确保不会为每个事件添加新的监听器 if (eventCount < 10) { socket.on('anotherEvent', () => { console.log('Handling anotherEvent'); }); eventCount++; } // 处理事件 });
-
使用内存分析工具: 使用如Node.js的
--inspect
标志、Chrome DevTools或专门的内存分析工具(如heapdump和Memwatch)来分析和定位内存泄漏。 -
定期重启服务器: 虽然这不是解决问题的根本方法,但在某些情况下,定期重启Node.js服务器可以作为一种临时解决方案来避免内存泄漏导致的崩溃。
总之,内存泄漏问题通常涉及复杂的资源管理,需要仔细检查和调试代码。希望这些建议能帮助你解决问题。