nodejs子進(jìn)程child_process和cluster模塊深入解析
簡介
node遵循的是單線程單進(jìn)程的模式,node的單線程是指js的引擎只有一個實(shí)例,且在nodejs的主線程中執(zhí)行,同時node以事件驅(qū)動的方式處理IO等異步操作。node的單線程模式,只維持一個主線程,大大減少了線程間切換的開銷。
但是node的單線程使得在主線程不能進(jìn)行CPU密集型操作,否則會阻塞主線程。對于CPU密集型操作,在node中通過child_process可以創(chuàng)建獨(dú)立的子進(jìn)程,父子進(jìn)程通過IPC通信,子進(jìn)程可以是外部應(yīng)用也可以是node子程序,子進(jìn)程執(zhí)行后可以將結(jié)果返回給父進(jìn)程。
此外,node的單線程,以單一進(jìn)程運(yùn)行,因此無法利用多核CPU以及其他資源,為了調(diào)度多核CPU等資源,node還提供了cluster模塊,利用多核CPU的資源,使得可以通過一串node子進(jìn)程去處理負(fù)載任務(wù),同時保證一定的負(fù)載均衡型。
本文的結(jié)構(gòu)安排如下:
- node中的單線程和單進(jìn)程
- node中的child_process模塊實(shí)現(xiàn)多進(jìn)程
- node中的cluster模塊
- 總結(jié)
原文的地址,在我的博客中:https://github.com/forthealll...
如有幫助,您的star是對我最好的鼓勵~
一、node中的單線程和單進(jìn)程
首先要理解的概念是,node的單線程和單進(jìn)程的模式。node的單線程于其他語言的多線程模式相比,減小了線程間切換的開銷,以及在寫node代碼的時候不用考慮鎖以及線程池的問題。node宣稱的單線程模式,比其他語言更加適合IO密集型操作。那么一個經(jīng)典的問題是:
node是真的單線程的嗎?
提到node,我們就可以立刻想到單線程、異步IO、事件驅(qū)動等字眼。首先要明確的是node真的是單線程的嗎,如果是單線程的,那么異步IO,以及定時事件(setTimeout、setInterval等)又是在哪里被執(zhí)行的。
嚴(yán)格來說,node并不是單線程的。node中存在著多種線程,包括:
- js引擎執(zhí)行的線程
- 定時器線程(setTimeout, setInterval)
- 異步http線程(ajax)
....
我們平時所說的單線程是指node中只有一個js引擎在主線程上運(yùn)行。其他異步IO和事件驅(qū)動相關(guān)的線程通過libuv來實(shí)現(xiàn)內(nèi)部的線程池和線程調(diào)度。libv中存在了一個Event Loop,通過Event Loop來切換實(shí)現(xiàn)類似于多線程的效果。簡單的來講Event Loop就是維持一個執(zhí)行棧和一個事件隊(duì)列,當(dāng)前執(zhí)行棧中的如果發(fā)現(xiàn)異步IO以及定時器等函數(shù),就會把這些異步回調(diào)函數(shù)放入到事件隊(duì)列中。當(dāng)前執(zhí)行棧執(zhí)行完成后,從事件隊(duì)列中,按照一定的順序執(zhí)行事件隊(duì)列中的異步回調(diào)函數(shù)。
上圖中從執(zhí)行棧,到事件隊(duì)列,最后事件隊(duì)列中按照一定的順序執(zhí)行回調(diào)函數(shù),整個過程就是一個簡化版的Event Loop。此外回調(diào)函數(shù)執(zhí)行時,同樣會生成一個執(zhí)行棧,在回調(diào)函數(shù)里面還有可能嵌套異步的函數(shù),也就是說執(zhí)行棧存在著嵌套。
也就是說node中的單線程是指js引擎只在唯一的主線程上運(yùn)行,其他的異步操作,也是有獨(dú)立的線程去執(zhí)行,通過libv的Event Loop實(shí)現(xiàn)了類似于多線程的上下文切換以及線程池調(diào)度。線程是最小的進(jìn)程,因此node也是單進(jìn)程的。這樣就解釋了為什么node是單線程和單進(jìn)程的。
二、node中的child_process模塊實(shí)現(xiàn)多進(jìn)程
node是單進(jìn)程的,必然存在一個問題,就是無法充分利用cpu等資源。node提供了child_process模塊來實(shí)現(xiàn)子進(jìn)程,從而實(shí)現(xiàn)一個廣義上的多進(jìn)程的模式。通過child_process模塊,可以實(shí)現(xiàn)1個主進(jìn)程,多個子進(jìn)程的模式,主進(jìn)程稱為master進(jìn)程,子進(jìn)程又稱工作進(jìn)程。在子進(jìn)程中不僅可以調(diào)用其他node程序,也可以執(zhí)行非node程序以及shell命令等等,執(zhí)行完子進(jìn)程后,以流或者回調(diào)的形式返回。
1、child_process模塊提供的API
child_process提供了4個方法,用于新建子進(jìn)程,這4個方法分別為spawn、execFile、exec和fork。所有的方法都是異步的,可以用一張圖來描述這4個方法的區(qū)別。
上圖可以展示出這4個方法的區(qū)別,我們也可以簡要介紹這4中方法的不同。
- spawn : 子進(jìn)程中執(zhí)行的是非node程序,提供一組參數(shù)后,執(zhí)行的結(jié)果以流的形式返回。
- execFile:子進(jìn)程中執(zhí)行的是非node程序,提供一組參數(shù)后,執(zhí)行的結(jié)果以回調(diào)的形式返回。
- exec:子進(jìn)程執(zhí)行的是非node程序,傳入一串shell命令,執(zhí)行后結(jié)果以回調(diào)的形式返回,與execFile
不同的是exec可以直接執(zhí)行一串shell命令。 - fork:子進(jìn)程執(zhí)行的是node程序,提供一組參數(shù)后,執(zhí)行的結(jié)果以流的形式返回,與spawn不同,fork生成的子進(jìn)程只能執(zhí)行node應(yīng)用。接下來的小節(jié)將具體的介紹這一些方法。
2、execFile和exec
我們首先比較execFile和exec的區(qū)別,這兩個方法的相同點(diǎn):
執(zhí)行的是非node應(yīng)用,且執(zhí)行后的結(jié)果以回調(diào)函數(shù)的形式返回。
不同點(diǎn)是:
exec是直接執(zhí)行的一段shell命令,而execFile是執(zhí)行的一個應(yīng)用
舉例來說,echo是UNIX系統(tǒng)的一個自帶命令,我們直接可以在命令行執(zhí)行:
echo hello world
結(jié)果,在命令行中會打印出hello world.
(1) 通過exec來實(shí)現(xiàn)
新建一個main.js文件中,如果要使用exec方法,那么則在該文件中寫入:
let cp=require('child_process'); cp.exec('echo hello world',function(err,stdout){ console.log(stdout); });
執(zhí)行這個main.js,結(jié)果會輸出hello world。我們發(fā)現(xiàn)exec的第一個參數(shù),跟shell命令完全相似。
(2)通過execFile來實(shí)現(xiàn)
let cp=require('child_process'); cp.execFile('echo',['hello','world'],function(err,stdout){ console.log(stdout); });
execFile類似于執(zhí)行了名為echo的應(yīng)用,然后傳入?yún)?shù)。execFlie會在process.env.PATH的路徑中依次尋找是否有名為'echo'的應(yīng)用,找到后就會執(zhí)行。默認(rèn)的process.env.PATH路徑中包含了'usr/local/bin',而這個'usr/local/bin'目錄中就存在了這個名為'echo'的程序,傳入hello和world兩個參數(shù),執(zhí)行后返回。
(3)安全性分析
像exec那樣,可以直接執(zhí)行一段shell是極為不安全的,比如有這么一段shell:
echo hello world;rm -rf
通過exec是可以直接執(zhí)行的,rm -rf會刪除當(dāng)前目錄下的文件。exec正如命令行一樣,執(zhí)行的等級很高,執(zhí)行后會出現(xiàn)安全性的問題,而execFile不同:
execFile('echo',['hello','world',';rm -rf'])
在傳入?yún)?shù)的同時,會檢測傳入實(shí)參執(zhí)行的安全性,如果存在安全性問題,會拋出異常。除了execFile外,spawn和fork也都不能直接執(zhí)行shell,因此安全性較高。
3、spawn
spawn同樣是用于執(zhí)行非node應(yīng)用,且不能直接執(zhí)行shell,與execFile相比,spawn執(zhí)行應(yīng)用后的結(jié)果并不是執(zhí)行完成后,一次性的輸出的,而是以流的形式輸出。對于大批量的數(shù)據(jù)輸出,通過流的形式可以介紹內(nèi)存的使用。
我們用一個文件的排序和去重來舉例:
上述圖片示意圖中,首先讀取的input.txt文件中有acba未經(jīng)排序的文字,通過sort程序后可以實(shí)現(xiàn)排序功能,輸出為aabc,最后通過uniq程序可以去重,得到abc。我們可以用spawn流形式的輸入輸出來實(shí)現(xiàn)上述功能:
let cp=require('child_process'); let cat=cp.spawn('cat',['input.txt']); let sort=cp.spawn('sort'); let uniq=cp.spawn('uniq'); cat.stdout.pipe(sort.stdin); sort.stdout.pipe(uniq.stdin); uniq.stdout.pipe(process.stdout); console.log(process.stdout);
執(zhí)行后,最后的結(jié)果將輸入到process.stdout中。如果input.txt這個文件較大,那么以流的形式輸入輸出可以明顯減小內(nèi)存的占用,通過設(shè)置緩沖區(qū)的形式,減小內(nèi)存占用的同時也可以提高輸入輸出的效率。
4、fork
在javascript中,在處理大量計算的任務(wù)方面,HTML里面通過web work來實(shí)現(xiàn),使得任務(wù)脫離了主線程。在node中使用了一種內(nèi)置于父進(jìn)程和子進(jìn)程之間的通信來處理該問題,降低了大數(shù)據(jù)運(yùn)行的壓力。node中提供了fork方法,通過fork方法在單獨(dú)的進(jìn)程中執(zhí)行node程序,并且通過父子間的通信,子進(jìn)程接受父進(jìn)程的信息,并將執(zhí)行后的結(jié)果返回給父進(jìn)程。
使用fork方法,可以在父進(jìn)程和子進(jìn)程之間開放一個IPC通道,使得不同的node進(jìn)程間可以進(jìn)行消息通信。
在子進(jìn)程中:
通過process.on('message')和process.send()的機(jī)制來接收和發(fā)送消息。
在父進(jìn)程中:
通過child.on('message')和process.send()的機(jī)制來接收和發(fā)送消息。
具體例子,在child.js中:
process.on('message',function(msg){ process.send(msg) })
在parent.js中:
let cp=require('child_process'); let child=cp.fork('./child'); child.on('message',function(msg){ console.log('got a message is',msg); }); child.send('hello world');
執(zhí)行parent.js會在命令行輸出:
got a message is hello world
中斷父子間通信的方式,可以通過在父進(jìn)程中調(diào)用:
child.disconnect()
來實(shí)現(xiàn)斷開父子間IPC通信。
5、同步執(zhí)行的子進(jìn)程
exec、execFile、spawn和fork執(zhí)行的子進(jìn)程都是默認(rèn)異步的,子進(jìn)程的運(yùn)行不會阻塞主進(jìn)程。除此之外,child_process模塊同樣也提供了execFileSync、spawnSync和execSync來實(shí)現(xiàn)同步的方式執(zhí)行子進(jìn)程。
三、node中的cluster模塊
cluster意為集成,集成了兩個方面,第一個方面就是集成了child_process.fork方法創(chuàng)建node子進(jìn)程的方式,第二個方面就是集成了根據(jù)多核CPU創(chuàng)建子進(jìn)程后,自動控制負(fù)載均衡的方式。
我們從官網(wǎng)的例子來看:
const cluster = require('cluster'); const http = require('http'); const numCPUs = require('os').cpus().length; if (cluster.isMaster) { console.log(`主進(jìn)程 ${process.pid} 正在運(yùn)行`); // 衍生工作進(jìn)程。 for (let i = 0; i < numCPUs; i++) { cluster.fork(); } cluster.on('exit', (worker, code, signal) => { console.log(`工作進(jìn)程 ${worker.process.pid} 已退出`); }); } else { // 工作進(jìn)程可以共享任何 TCP 連接。 // 在本例子中,共享的是一個 HTTP 服務(wù)器。 http.createServer((req, res) => { res.writeHead(200); res.end('你好世界\n'); }).listen(8000); console.log(`工作進(jìn)程 ${process.pid} 已啟動`); }
最后輸出的結(jié)果為:
$ node server.js
主進(jìn)程 3596 正在運(yùn)行
工作進(jìn)程 4324 已啟動
工作進(jìn)程 4520 已啟動
工作進(jìn)程 6056 已啟動
工作進(jìn)程 5644 已啟動
我們將master稱為主進(jìn)程,而worker進(jìn)程稱為工作進(jìn)程,利用cluster模塊,使用node封裝好的API、IPC通道和調(diào)度機(jī)可以非常簡單的創(chuàng)建包括一個master進(jìn)程下HTTP代理服務(wù)器 + 多個worker進(jìn)程多個HTTP應(yīng)用服務(wù)器的架構(gòu)。
總結(jié)
本文首先介紹了node的單線程和單進(jìn)程模式,接著從單線程的缺陷觸發(fā),介紹了node中如何實(shí)現(xiàn)子進(jìn)程的方法,對比了child_process模塊中幾種不同的子進(jìn)程生成方案,最后簡單介紹了內(nèi)置的可以實(shí)現(xiàn)子進(jìn)程以及CPU進(jìn)程負(fù)載均衡的內(nèi)置集成模塊cluster。
更多關(guān)于nodejs子進(jìn)程child_process cluster的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
express框架,報錯:“Cannot set headers after t
這篇文章主要介紹了express框架,報錯:“Cannot set headers after they are sent to the client”,解決方法,結(jié)合實(shí)例形式總結(jié)分析了常見的問題原因與對應(yīng)的解決方案,需要的朋友可以參考下2023-05-05用C/C++來實(shí)現(xiàn) Node.js 的模塊(一)
這篇文章的主要內(nèi)容其實(shí)簡而言之就是——用C/C++來實(shí)現(xiàn) Node.js 的模塊,非常的不錯,有需要的朋友可以參考下2014-09-09Nodejs使用dgram模塊創(chuàng)建UDP服務(wù)詳解
這篇文章主要為大家介紹了Nodejs使用dgram模塊創(chuàng)建UDP服務(wù)詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-10-10node.js中TCP Socket多進(jìn)程間的消息推送示例詳解
這篇文章主要給大家介紹了關(guān)于node.js中TCP Socket多進(jìn)程間的消息推送的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2018-07-07關(guān)于npm install過程失敗的幾種處理方式
這篇文章主要介紹了關(guān)于npm install過程失敗的幾種處理方式,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2023-06-06Node.js學(xué)習(xí)之查詢字符串解析querystring詳解
這篇文章主要給大家介紹了關(guān)于Node.js查詢字符串解析querystring的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對大家學(xué)習(xí)或者使用node.js具有一定的參考學(xué)習(xí)價值,需要的朋友們下面來一起看看吧。2017-09-09Node使用Puppeteer監(jiān)聽并打印網(wǎng)頁的接口請求
Puppeteer 是一個 Node 庫,它提供了高級的 API 來通過 DevTools 協(xié)議控制 Chrome 或 Chromium,本文我們就來看看如何使用Puppeteer監(jiān)聽并打印網(wǎng)頁的接口請求吧2025-04-04