快捷導(dǎo)航

nodejs中使用多線程編程的方法實例

更新時間：2015年03月24日 10:16:41 投稿：junjie

這篇文章主要介紹了nodejs中使用多線程編程的方法實例,本文使用nodejs addon借助c/c++的能力擴(kuò)展nodejs多線程編程,需要的朋友可以參考下

在以前的博文別說不可能，nodejs中實現(xiàn)sleep中，我向大家介紹了nodejs addon的用法。今天的主題還是addon，繼續(xù)挖掘c/c++的能力，彌補(bǔ)nodejs的弱點。

我曾多次提到過nodejs的性能問題。其實就語言本身而言，nodejs的性能還是很高的，雖然不及大多部靜態(tài)語言，但差距也并不大；相對其他動態(tài)語言而言，速度優(yōu)勢非常明顯。但為什么我們常常說nodejs不能勝任CPU密集型場景呢？因為由于其單線程特性，對于CPU密集型場景，它并不能充分利用CPU。計算機(jī)科學(xué)中有一個著名的Amdahl定律：

假設(shè)總工作量W，可以分解為兩個部分：只能串行計算的Ws和允許并行計算的Wp。那么，在p個CPU并行計算的情況下，性能上能夠帶來speedup倍的提升。Amdahl定律描述了并行能做到的和不能做到的。它是一種理想情況，實際情況會復(fù)雜得多。比如并發(fā)很可能會引起資源的爭奪，需要增加各種鎖，從而常常讓并行處于等待狀態(tài)；并發(fā)還會額外帶來操作系統(tǒng)對線程調(diào)度切換的時間開銷，增加Ws。不過，當(dāng)一項任務(wù)中，Wp比Ws大得多，并且有多個CPU核心可供使用時，并行帶來的性能提升是相當(dāng)可觀的。

好，回到nodejs上。我們設(shè)想一個計算場景：計算4000000內(nèi)的質(zhì)數(shù)數(shù)目。這個場景編程實現(xiàn)的時候，以除法運算為主，不涉及內(nèi)存、對象等操作，理論上能夠確保讓nodejs以相對較快的速度運行，不會落后c太多，便于對比。

javascript尋找質(zhì)數(shù)的方法已經(jīng)在這篇博客中提供了，直接抄過來：

復(fù)制代碼代碼如下:

function zhishu_js(num) {

    if (num == 1) {

        return false;

    }

    if (num == 2) {

        return true;

    }

    for (var i = 2; i <= Math.sqrt(num); i++) {

        if (num % i == 0) {

            return false;

        }

    }

    return true;

}

再寫一個c語言版本的：

復(fù)制代碼代碼如下:

#include <math.h>

bool zhishu(int num){
    if (num == 1) {
        return false;
    }
    if (num == 2) {
        return true;
    }
    for (int i = 2; i <= sqrt(num); i++) {
        if (num % i == 0) {
            return false;
        }
    }
    return true;
};

在nodejs中，我們用一個從1到4000000的循環(huán)來檢索質(zhì)數(shù)；c語言中，我們設(shè)置若干個線程，定義count為4000000，每個線程做如下操作要：如果count大于0，則取出count的值，并計算是否為質(zhì)數(shù)，同時將count減1。根據(jù)這個思路，javascript版本的很容易寫：

復(fù)制代碼代碼如下:

var count = 0;

for (j = 1; j < 4000000; j++) {
    if(zhishu(j)){
        count++;
    }
}

關(guān)鍵難點就是c語言的多線程編程。早期c/c++并沒有考慮并行計算的需求，所以標(biāo)準(zhǔn)庫中并沒有提供多線程支持。而不同的操作系統(tǒng)通常實現(xiàn)也是有區(qū)別的。為了避免這種麻煩，我們采用pthread來處理線程。

下載pthread最新版本。由于我對gyp不熟，link依賴lib搞了半天沒搞定，最后我的方式是，直接把pthread的源代碼放到了項目目錄下，并在binding.gyp中把pthread.c添加到源代碼列表中，在編譯項目的時候把pthread也編譯一次。修改后的binding.gyp是這樣的：

復(fù)制代碼代碼如下:

{

  "targets": [

    {

      "target_name": "hello",

      "sources": [ "hello.cc","pthreads/pthread.c" ],

      "include_dirs": [

        "<!(node -e \"require('nan')\")",

        "pthreads"

      ],

      "libraries": ["Ws2_32.lib"]

    }

  ]

}

當(dāng)然了，我這種方法很麻煩，如果你們只添加pthread中l(wèi)ib和include目錄的引用，并且不出現(xiàn)依賴問題，那是最好的，就沒有必要用我的方法來做。

那么接下來就進(jìn)入C/C++多線程的一切了，定義一個線程處理函數(shù)：

復(fù)制代碼代碼如下:

pthread_mutex_t lock;

void *thread_p(void *null){
    int num, x=0;
    do{
        pthread_mutex_lock(&lock);
        num=count--;
        pthread_mutex_unlock(&lock);
        if(num>0){
            if(zhishu(num))x++;
        }else{
            break;
        }
    }while(true);
    std::cout<<' '<<x<<' ';
    pthread_exit(NULL);
        return null;
}

在線程與線程之間，對于count這個變量是相互競爭的，我們需要確保同時只能有一個線程操作count變量。我們通過 pthread_mutex_t lock; 添加一個互斥鎖。當(dāng)執(zhí)行 pthread_mutex_lock(&lock); 時，線程檢查lock鎖的情況，如果已鎖定，則等待、重復(fù)檢查，阻塞后續(xù)代碼運行；如果鎖已釋放，則鎖定，并執(zhí)行后續(xù)代碼。相應(yīng)的， pthread_mutex_unlock(&lock); 就是解除鎖狀態(tài)。

由于編譯器在編譯的同時，進(jìn)行編譯優(yōu)化，如果一個語句沒有明確做什么事情，對其他語句的執(zhí)行也沒有影響時，會被編譯器優(yōu)化掉。在上面的代碼中，我加入了統(tǒng)計質(zhì)數(shù)數(shù)量的代碼，如果不加的話，像這樣的代碼：

復(fù)制代碼代碼如下:

for (int j = 0; j < 4000000; j++) {

    zhishu(j);

}

是會直接被編譯器跳過的，實際不會運行。

添加addon的寫法已經(jīng)介紹過了，我們實現(xiàn)從javascript接收一個參數(shù)，表示線程數(shù)，然后在c中創(chuàng)建指定數(shù)量的線程完成質(zhì)數(shù)檢索。完整代碼：

復(fù)制代碼代碼如下:

#include <nan.h>
#include <math.h>
#include <iostream>
#include "pthreads\pthread.h"
#define MAX_THREAD 100
using namespace v8;

int count=4000000;
pthread_t tid[MAX_THREAD];
pthread_mutex_t lock;

void *thread_p(void *null){
    int num, x=0;
    do{
        pthread_mutex_lock(&lock);
        num=count--;
        pthread_mutex_unlock(&lock);
        if(num>0){
            if(zhishu(num))x++;
        }else{
            break;
        }
    }while(true);
    std::cout<<' '<<x<<' ';
    pthread_exit(NULL);
    return null;
}

NAN_METHOD(Zhishu){
    NanScope();
    pthread_mutex_init(&lock,NULL);
    double arg0=args[0]->NumberValue();
    int c=0;
    for (int j = 0; j < arg0 && j<MAX_THREAD; j++) {
        pthread_create(&tid[j],NULL,thread_p,NULL);
    }
    for (int j = 0; j < arg0 && j<MAX_THREAD; j++) {
        pthread_join(tid[j],NULL);
    }
    NanReturnUndefined();
}

void Init(Handle<Object> exports){
exports->Set(NanSymbol("zhishu"), FunctionTemplate::New(Zhishu)->GetFunction());
}

NODE_MODULE(hello, Init);

phread_create可以創(chuàng)建線程，默認(rèn)是joinable的，這個時候子線程受制于主線程；phread_join阻塞住主線程，等待子線程join，直到子線程退出。如果子線程已退出，則phread_join不會做任何事。所以對所有的線程都執(zhí)行thread_join，可以保證所有的線程退出后才會例主線程繼續(xù)進(jìn)行。

完善一下nodejs腳本：

復(fù)制代碼代碼如下:

console.time("c");
zhishu_c(100);
console.timeEnd("c");

console.time("js");
var count=0;
for (j = 1; j < 4000000; j++) {
    if(zhishu(j)){
        count++;
    }
}
console.log(count);
console.timeEnd("js");

看一下測試結(jié)果：

單線程時，雖然C/C++的運行速度是nodejs的181%，但這個成績我們認(rèn)為在動態(tài)語言中，還是非常不錯的。雙線程時速度提升最明顯，那是因為我的電腦是雙核四線程CPU，這個時候已經(jīng)可能在使用兩個核心在進(jìn)行處理。4線程時速度達(dá)到最大，此時應(yīng)該是雙核四線程能達(dá)到的極限，當(dāng)線程再增加時，并不能再提升速度了。上述Amdahl定律中，p已達(dá)上限4。再增加線程，會增加操作系統(tǒng)進(jìn)程調(diào)度的時間，增加鎖的時間，盡管同時也能增加對CPU時間的競爭，但總體而言，Ws的增加更加明顯，性能是下降的。如果在一臺空閑的機(jī)器上做這個實驗，數(shù)據(jù)應(yīng)該會更好一點。

從這個實驗中，我們可以得出這樣的結(jié)論，對于CPU密集型的運算，交給靜態(tài)語言去做，效率會提高很多，如果計算中較多涉及內(nèi)存、字符串、數(shù)組、遞歸等操作（以后再驗證），性能提升更為驚人。同時，合理地利用多線程能有效地提高處理效率，但并不是線程越多越好，要根據(jù)機(jī)器的情況合理配置。

對于nodejs本身，的確是不擅長處理CPU密集的任務(wù)，但有了本文的經(jīng)驗，我想，想克服這個障礙，并非什么不可能的事情。

您可能感興趣的文章: