问一个关于 Nodejs CPU 核心利用的问题

发布于 1周前 作者 yuanlaile 来自 nodejs/Nestjs

经常被问到 nodejs 写的程序 cpu 利用率的问题

例如建立一个 TCP Server ,做一些数据处理,简单 demo 大约像下面这样。

问题:假设服务器是 4 核

  • 在没有使用 pm2 等第三方模块情况下直接启动,最多用到了几个核?
  • 是否要显式的使用 cluster 模块,才真正用到多核 ?
const net = require('net')

const server = net.createServer()

server.on(‘connection’, (socket) => { socket.on(‘data’, (data) => { // 这里做一些任务处理 }) })

server.listen(3000, ‘0.0.0.0’)


问一个关于 Nodejs CPU 核心利用的问题

18 回复

一个进程只能单核把


现跑一个不就完了。。。
ab -n1000000 -c100 -t20 --lantency "http://127.0.0.1:3000/"
一个

那线程池是干啥用的。。。多线程就已经能利用多核了

取决于你的多核语境是以下哪一个

1.任务处理是否用到了多核

server.on(‘connection’, (socket) => {
socket.on(‘data’, (data) => {
//① 这里做一些任务处理
})
})

对于①处代码,除非显示调用其他相关的库,否则就是单纯的单线程执行

2. 整个程序是否用到了多核

node.js 内部依赖 libuv 来做网络链接相关的事情,libuv 内部维护一个线程池来处理文件、网络调用。线程池上的线程基本上可以认为会在多核上均匀调度。

#3 这是在 nodejs 语境下的说法,况且 op 也没用 Workers 开其他线程…

前面套个 nginx 负载均衡,开 4 个进程和端口。docker compose 很容易配置。

不用多进程,不用 Worker threads ,就只能吃满一个核,你直接写个 while(true)看 cpu 占用就知道了,很多脚本语言都是这样设计,包括 php 、python (有 GIL 的版本)、ruby 。

借用楼主的帖子发问:发送网络请求时记录请求时间会因为服务器压力,导致时间记录不准吗?

没 gil 也只是 native 层扩展的角度有区别,python 本身并没有支持扩展到不同线程,即使现在去掉了 gil ,也只是解放了多线程 native 代码操作 python 对象的锁,python 本身还是只能用一个线程
即使用多解释器方案,那玩意也无法共享对象

在建立连接 io 这些操作的时候 会用到其他的核心,但是我建议你开多个进程,然后前置 haproxy 负载均衡,这样能充分的利用多个核心

单个线程的情况下 在同一个时刻只会运行在一个 CPU 核心上,理论上在一段时间内是有可能会被调度到不同的 CPU 核心的,但是同一时刻只会在一个核心上运行。

想象一下一个核心在跑别的程序已经占用很高的情况,这个时候 CPU 如何决定让哪个核心来运行新的任务线程呢,这个涉及到 CPU 的调度算法了,所以 CPU 空闲的时候 的确会出现好像一段时间上这个线程只会跑在一个核心的现象 所以说个人觉得只用到了几个核这种问题其实不太严谨

#13 这种问题插入 CPU 调度就没必要了,一个线程细粒化到微指令时确实会在不同的核中执行,就如你说的同一时刻只能在一个核中运行,在考虑只是资源利用的情况下,确实就是只利用到了一个核的资源,至于是哪个核其实并不重要。题主这个问法自动帮他归纳为核的利用上,而不是使用上,不用揪他那几个字的意思

进程只有一个主线程,就只能利用到单核的资源,而 node 的线程池是用作异步 io 的,可以理解为只是等待 io 的处理结果,缓解 cpu 与存储介质的速度鸿沟,这部分线程池对 CPU 的利用率极其低。可以在代码中搞个同步的操作,例如无限循环,你就会发现只有一个核被利用上,且进程被卡住,如果是网络服务就无法接受其他的请求

Node.js 默认不使用多进程、多线程 API 的话就是一个单线程的主进程,然后 IO 会由特定的接口管理的单独的进程跑。

你要想利用多核,可以把服务无状态化,然后跑核心数量个服务,用 Nginx 之类的负载均衡,这样还能容灾和灰度发布什么的。

python3 -m http.server 单线程,单连接并且是同步 IO ,非常慢
http-server -p 8000 支持多连接,速度还不错

关于 Node.js 的 CPU 核心利用问题,主要涉及到如何有效地利用多核 CPU 来提升应用程序的性能。Node.js 本身是单线程的,但可以通过使用集群(cluster)模块来实现多进程,从而利用多核 CPU。

以下是一个简单的示例,展示如何使用 Node.js 的集群模块来创建多个工作进程,每个进程运行在同一个端口上,但由不同的 CPU 核心处理:

const cluster = require('cluster');
const http = require('http');
const numCPUs = require('os').cpus().length;

if (cluster.isMaster) {
  console.log(`Master ${process.pid} is running`);

  // Fork workers.
  for (let i = 0; i < numCPUs; i++) {
    cluster.fork();
  }

  cluster.on('exit', (worker, code, signal) => {
    console.log(`Worker ${worker.process.pid} died`);
  });

} else {
  // Workers can share any TCP connection
  // In this case, it is an HTTP server
  http.createServer((req, res) => {
    res.writeHead(200);
    res.end('Hello World\n');
  }).listen(8000);

  console.log(`Worker ${process.pid} started`);
}

在这个示例中,主进程(Master)会根据系统的 CPU 核心数来创建相应数量的工作进程(Worker)。每个工作进程都会监听同一个端口(8000),但由不同的 CPU 核心处理请求,从而实现了 CPU 核心的充分利用。

通过这种方式,你可以显著提升 Node.js 应用程序的性能,尤其是在处理大量并发请求时。

回到顶部