Nodejs中如何更爽的使用多线程
Nodejs中如何更爽的使用多线程
最近写多线程的时候遇到一个烦恼,就是用起来实在太麻烦,不管是 WebWorker 还是 worker_threads 库,用起来都实在太麻烦了。而且很多时候 IO 密集和 CPU 密集操作很多时候是交织的,有没有一种办法,可以直接在代码中方便的使用多线程呢?
以前我们使用 Worker 要怎么做?现在我们能怎么做?
之前的做法:
// ### 父进程代码
// 比如请求网络数据,IO 操作
const apiData = await request('/api/xxx');
// 为了不阻塞 eventloop 开启子线程,并拿到符合要求的格式
const goodApiData = await new Promise((resolve, reject) => {
const worker = new Worker('子进程文件名 xxx.js', {
workerData: apiData
});
worker.on('message', resolve);
worker.on('error', reject);
});
// ### 子线程代码
// 这里处理 data 数据,CPU 密集操作
doSomething(workerData)
// 再发送回父进程
parentPort.postMessage(data);
代码量这么大,还要写 2 个文件以上文件,数据发送过去再发送回来头都大了!!!费脑!!!
那有没有更好的方法呢?当然使用 ncpu 就能做到!
使用 ncpu 的做法:
import {NCPU} from 'ncpu'
// 比如请求网络数据,IO 操作
const apiData = await request('/api/xxx');
// 为了不阻塞 eventloop 开启子线程,并拿到符合要求的格式
const goodApiData = await NCPU.run((data)=>{
// 这里处理 data 数据,CPU 密集操作
doSomething(data)
return data;
}, [apiData]) //使用数组传参,这有点类似 apply
使用 ncpu 果然爽,一个回调函数就把 CPU 密集型计算搞定了。
爽是爽,但目前有两点强制限制:
- 回调函数不能共用上下文,因为 ncpu 是使用函数复制的方式来实现的,不会保留函数上下文,所以要求函数是强无副作用函数。
- 传入参数都是使用 HTML structured clone algorithm方式来进行克隆的,而非原值。
但正是这两点强制限制,使得线程更加安全了。因为但多个线程同时操作原值,会导致内存数据更新速度赶不上线程更新的速到,导致另一个线程读取数据不正确。而且我们要处理数据时,通常只需要将大循环和递归计算放入线程的回调函数中,所以这两点强制,反而不是坏事。
目前 ncpu 的两个版本
一个是ncpu专门为 node.js 环境设计,另一个是ncpu-web专门为浏览器环境设计。
同时ncpu需要的最低 node.js 版本是 12,而ncpu-web浏览器要求是谷歌浏览器至少 60 以上,火狐 57 以上即可。
在使用的时候要注意这些问题哦!
我最近写了一个多进程的工具。pambdajs
https://github.com/tim-hub/pambdajs
天呐!我们想到一块去了!棒!你文档比我写的好,但我多了个前端版本,哈哈
微软有个 js 的多线程运行时。
https://github.com/microsoft/napajs
我知道这个,但这个缺点也明显有 C++库依赖,而且已经很多年没维护了,高版本 node 都没法使用了
js 的 cpu 密集型。。能密集到哪去。。。
不用单独拆文件倒是挺不错的
前端可能就是渲染和画图会用到,大部分不需要,node.js 服务端多些。其实目的就只有一个防止阻塞 eventloop 。
之前 node.js 服务端都是用尽可能分片拆代码来实现拆解 CPU 密集运算,从而防止阻塞 eventloop,现在多了一种更方便的选择。
我就是基于原生多线程写的,就是觉得原生多线程麻烦要互相通讯
好奇怎么做到的,看了下源码才知道,学习了👍。
我理解的思路:将要在线程中执行的纯函数和参数序列化成字符串,通过环境产量传递给 fork 出的进程,进程中加载预定的 js 模板,解析环境变量中传入的纯函数和参数,拼接成函数通过 eval 执行,并返回结果给主进程,主进程聚合子进程结果后返回。最终实现了在主进程批量调用函数并返回结果,这些函数在子进程中执行。
如有不对,还请指教
哇!!!
前几天写个 webworker 搞得头痛,传来传去好麻烦。加上 webpack 打包更是好多坑,最加上 worker-lplugin 才勉强用起来。
对的,我最后是用了 BlobURL 实现在 webpack 打包的
你说得完全正确。
还没来得及仔细读你的代码?还不知道你的具体实现方式是?
不好意思回复错了,还以为你是题主。后边的问题是问题主的
是啊,child_process 不在 browser 工作
其实我的实现方式有点类似。已添加友情链。
https://github.com/zy445566/ncpu
https://github.com/zy445566/ncpu-web
只用多线程不用 wasm 感觉没多大意义………
在Node.js中,由于JavaScript的单线程模型,传统上并不直接支持多线程。然而,Node.js 10.5.0版本引入了worker_threads
模块,使得多线程编程成为可能。以下是使用worker_threads
模块更爽地进行多线程编程的一些建议及示例代码:
-
创建并启动Worker线程:
const { Worker, isMainThread, parentPort, workerData } = require('worker_threads'); if (isMainThread) { // 主线程 const worker = new Worker(__filename, { workerData: { someKey: 'someValue' } }); worker.on('message', (message) => { console.log('Received:', message); }); worker.on('error', (error) => { console.error('Worker error:', error); }); worker.on('exit', (code) => { if (code !== 0) console.error(`Worker stopped with exit code ${code}`); }); } else { // Worker线程 console.log('Worker data:', workerData); // 执行一些计算或IO密集型任务 const result = { success: true, data: 'some result' }; parentPort.postMessage(result); }
-
利用线程池: 可以使用
worker_threads
结合第三方库如threads
或thread-pool
来管理线程池,提高资源利用率和任务调度效率。 -
注意线程间通信: 使用
parentPort.postMessage()
和worker.on('message')
进行线程间通信,确保数据传递的效率和安全性。
通过上述方法,你可以在Node.js中更高效地利用多线程,提升程序性能。