快捷導(dǎo)航

C++ 對多線程/并發(fā)的支持(上)

更新時間：2021年10月12日 14:29:30 作者：Zijian/TENG

這篇文章主要介紹的是C++ 對多線程/并發(fā)的支持，并發(fā)，即同時執(zhí)行多個任務(wù)，常用來提高吞吐量或者改善響應(yīng)性，下面我們就來看文章詳細(xì)介紹C++ 對多線程并發(fā)的支持相關(guān)資料的內(nèi)容吧

本文翻譯自 C++ 之父 Bjarne Stroustrup 的 C++ 之旅（ A Tour of C++ ）一書的第 13 章 Concurrency。作者用短短數(shù)十頁，帶你一窺現(xiàn)代 C++ 對并發(fā)/多線程的支持。原文地址：現(xiàn)代 C++ 對多線程/并發(fā)的支持（上） -- 節(jié)選自 C++ 之父的《 A Tour of C++ 》水平有限，有條件的建議直接閱讀原版書籍。

1、并發(fā)介紹

并發(fā)，即同時執(zhí)行多個任務(wù)，常用來提高吞吐量（通過利用多處理器進(jìn)行同一個計算）或者改善響應(yīng)性（等待回復(fù)的時候，允許程序的其他部分繼續(xù)執(zhí)行）。所有現(xiàn)代語言都支持并發(fā)。C++ 標(biāo)準(zhǔn)庫提供了可移植、類型安全的并發(fā)支持，經(jīng)過 20 多年的發(fā)展，幾乎被所有現(xiàn)代硬件所支持。標(biāo)準(zhǔn)庫提供的主要是系統(tǒng)級的并發(fā)支持，而非復(fù)雜的、更高層次的并發(fā)模型；其他庫可以基于標(biāo)準(zhǔn)庫，提供更高級別的并發(fā)支持。

C++ 提供了適當(dāng)?shù)膬?nèi)存模型（memory model）和一組原子操作（atomic operation），以支持在同一地址空間內(nèi)并發(fā)執(zhí)行多個線程。原子操作使得無鎖編程成為可能。內(nèi)存模型保證了在避免數(shù)據(jù)競爭（data races，不受控地同時訪問可變數(shù)據(jù)）的前提下，一切按照預(yù)期工作。

本章將給出標(biāo)準(zhǔn)庫對并發(fā)的主要支持示例：thread、mutex、lock() 、packaged_task 以及 future。這些特征直接基于操作系統(tǒng)構(gòu)建，相較于操作系統(tǒng)原生支持，不會帶來性能損失，也不保證會有顯著的性能提升。

那為什么要用標(biāo)準(zhǔn)庫而非操作系統(tǒng)的并發(fā)？可移植性。

不要把并發(fā)當(dāng)作靈丹妙藥：如果順序執(zhí)行可以搞定，通常順序會比并發(fā)更簡單、更快速！

2、任務(wù)和線程

如果一個計算有可能（potentially）和另一個計算并發(fā)執(zhí)行，我們稱之為任務(wù)（task）。線程是任務(wù)的系統(tǒng)級表示。任務(wù)可以通過構(gòu)造一個 std::thread 來啟動，任務(wù)作為參數(shù)。

任務(wù)是一個函數(shù)或者函數(shù)對象。
任務(wù)是一個函數(shù)或者函數(shù)對象。
任務(wù)是一個函數(shù)或者函數(shù)對象。

void f();              // 函數(shù)

struct F {             // 函數(shù)對象
    void operator()()  // F 的調(diào)用操作符
};

void user()
{
    thread t1 {f};     // f() 在另一個線程中執(zhí)行
    thread t2 {F()};   // F()() 在另一個線程中執(zhí)行

    t1.join();  // 等待 t1
    t2.join();  // 等待 t2
}

join() 確保線程完成后才退出 user() ，“join 線程”的意思是“等待線程結(jié)束”。

一個程序的線程共享同一地址空間。線程不同于進(jìn)程，進(jìn)程通常不直接共享數(shù)據(jù)。線程間可以通過共享對象（shared object）通信，這類通信一般用鎖或其他機(jī)制控制，以避免數(shù)據(jù)競爭。

編寫并發(fā)任務(wù)可能會非常棘手，假如上述例子中的 f 和 F 實現(xiàn)如下：

void f() {cout << "Hello ";}

struct F {
    void operator()() {cout << "Parallel World!\n";}
};

這里有個嚴(yán)重的錯誤：f 和 F() 都用到了 cout 對象，卻沒有任何形式的同步。這會導(dǎo)致輸出的結(jié)果不可預(yù)測，多次執(zhí)行的結(jié)果可能會得到不同的結(jié)果：因為兩個任務(wù)的執(zhí)行順序是未定義的。程序可能產(chǎn)生詭異的輸出，比如：

PaHerallllel o World!

定義一個并發(fā)程序中的任務(wù)時，我們的目標(biāo)是保持任務(wù)之間完全獨立。最簡單的方法就是把并發(fā)任務(wù)看作是一個恰巧可以和調(diào)用者同時運行的函數(shù)：我們只要傳遞參數(shù)、取回結(jié)果，保證該過程中沒有使用共享數(shù)據(jù)（沒有數(shù)據(jù)競爭）即可。

3、傳遞參數(shù)

一般來說，任務(wù)需要處理一些數(shù)據(jù)。我們可以通過參數(shù)傳遞數(shù)據(jù)（或者數(shù)據(jù)的指針或引用）。

void f(vector<double>& v); // 處理 v 的函數(shù)

struct F {                 // 處理 v 的函數(shù)對象
    vector<double>& v;
    F(vector<double>& vv) : v(vv) {}
    void operator()();
};

int main()
{
    vector<double> some_vec{1,2,3,4,5,6,7,8,9};
    vector<double> vec2{10,11,12,13,14};

    thread t1{f,ref(some_vec)}; // f(some_vec) 在另一個線程中執(zhí)行
    thread t2{F{vec2}};         // F{vec2}() 在另一個線程中執(zhí)行

    t1.join();
    t2.join();
}

F{vec2} 在 F 中保存了參數(shù) vector 的引用。F 現(xiàn)在可以使用這個 vector。但愿在 F 執(zhí)行時，沒有其他任務(wù)訪問 vec2。如果通過值傳遞 vec2 則可以消除這個隱患。

t1 通過 {f,ref(some_vec)} 初始化，用到了 thread 的可變參數(shù)模板構(gòu)造，可以接受任意序列的參數(shù)。ref() 是來自 <functional> 的類型函數(shù)。為了讓可變參數(shù)模板把 some_vec 當(dāng)作一個引用而非對象，ref() 不能省略。編譯器檢查第一個參數(shù)可以通過其后面的參數(shù)調(diào)用，并構(gòu)建必要的函數(shù)對象，傳遞給線程。如果 F::operator()() 和 f() 執(zhí)行了相同的算法，兩個任務(wù)的處理幾乎是等同的：兩種情況下，都各自構(gòu)建了一個函數(shù)對象，讓 thread 去執(zhí)行。

可變參數(shù)模板需要用 ref()、cref() 傳遞引用

4、返回結(jié)果

3 的例子中，我傳了一個非 const 的引用。只有在希望任務(wù)修改引用數(shù)據(jù)時我才這么做。這是一種很常見的獲取返回結(jié)果的方式，但這么做并不能清晰、明確地向他人傳達(dá)你的意圖。稍好一點的方式是通過 const 引用傳遞輸入數(shù)據(jù)，通過另外單獨的參數(shù)傳遞儲存結(jié)果的指針。

void f(const vector<double>& v, double *res); // 從 v 獲取輸入; 結(jié)果存入 *res

class F {
public:
    F(const vector<double>& vv, double *p) : v(vv), res(p) {}
    void operator()();  // 結(jié)果保存到 *res

private:
    const vector<double>& v;  // 輸入源
    double *p;                // 輸出地址
};

int main()
{
    vector<double> some_vec;
    vector<double> vec2;

    double res1;
    double res2;

    thread t1{f,cref(some_vec),&res1}; // f(some_vec,&res1) 在另一個線程中執(zhí)行
    thread t2{F{vec2,&res2}};          // F{vec2,&res2}() 在另一個線程中執(zhí)行

    t1.join();
    t2.join();
}

這么做沒問題，也很常見。但我不覺得通過參數(shù)傳遞返回結(jié)果有多優(yōu)雅，我會在 13.7.1 節(jié)再次討論這個話題。

通過參數(shù)（出參）傳遞結(jié)果并不優(yōu)雅

5、共享數(shù)據(jù)

有時任務(wù)需要共享數(shù)據(jù)，這種情況下，對共享數(shù)據(jù)的訪問需要進(jìn)行同步，同一時刻只能有一個任務(wù)訪問數(shù)據(jù)（但是多任務(wù)同時讀取不變量是沒有問題的）。我們要考慮如何保證在同一時刻最多只有一個任務(wù)能夠訪問一組對象。

解決這個問題需要通過 mutex（mutual exclusion object，互斥對象）。thread 通過 lock() 獲取 mutex：

int shared_data;
mutex m;          // 用于控制 shared_data 的 mutex

void f()
{
    unique_lock<mutex> lck{m};  // 獲取 mutex
    shared_data += 7;           // 操作共享數(shù)據(jù)
}   // 離開 f() 作用域，隱式自動釋放 mutex

unique_lock 的構(gòu)造函數(shù)通過調(diào)用 m.lock() 獲取 mutex。如果另一個線程已經(jīng)獲取這個 mutex，當(dāng)前線程等待（阻塞）直到另一個線程（通過 m.unlock( ) ）釋放該 mutex。當(dāng) mutex 釋放，等待該 mutex 的線程恢復(fù)執(zhí)行（喚醒）?；コ?、鎖在 <mutex> 頭文件中。

共享數(shù)據(jù)和 mutex 之間的關(guān)聯(lián)需要自行約定：程序員需要知道哪個 mutex 對應(yīng)哪個數(shù)據(jù)。這樣很容易出錯，但是我們可以通過一些方式使得他們之間的關(guān)聯(lián)更清晰明確：

class Record {
public:
    mutex rm;
};

不難猜到，對于一個 Record 對象 rec，在訪問 rec 其他數(shù)據(jù)之前，你應(yīng)該先獲取 rec.rm。最好通過注釋或者良好的命名讓讀者清楚地知道 mutex 和數(shù)據(jù)的關(guān)聯(lián)。

有時執(zhí)行某些操作需要同時訪問多個資源，有可能導(dǎo)致死鎖。例如，thread1 已經(jīng)獲取了 mutex1，然后嘗試獲取 mutex2；與此同時，thread2 已經(jīng)獲取 mutex2，嘗試獲取 mutex1。在這種情況下，兩個任務(wù)都無法進(jìn)行下去。為解決這一問題，標(biāo)準(zhǔn)庫支持同時獲取多個鎖：

void f()
{
    unique_lock<mutex> lck1{m1,defer_lock};  // defer_lock：不立即獲取 mutex
    unique_lock<mutex> lck2{m2,defer_lock};
    unique_lock<mutex> lck3{m3,defer_lock};

    lock(lck1,lck2,lck3);                    // 嘗試獲取所有鎖
    // 操作共享數(shù)據(jù)
}   // 離開 f() 作用域，隱式自動釋放所有 mutexes

lock() 只有在獲取參數(shù)里所有的 mutex 之后才會繼續(xù)執(zhí)行，并且在其持有 mutex 期間，不會阻塞（go to sleep）。每個 unique_lock 的析構(gòu)會確保離開作用域時，自動釋放所有的 mutex。

通過共享數(shù)據(jù)通信是相對底層的操作。編程人員要設(shè)計一套機(jī)制，弄清楚哪些任務(wù)完成了哪些工作，還有哪些未完成。從這個角度看，使用共享數(shù)據(jù)不如直接調(diào)用函數(shù)、返回結(jié)果。另一方面，有些人認(rèn)為共享數(shù)據(jù)比拷貝參數(shù)和返回值效率更高。這個觀點可能在涉及大量數(shù)據(jù)的時候成立，但是 locking 和 unlocking 也是相對耗時的操作。不僅如此，現(xiàn)代計算機(jī)很擅長拷貝數(shù)據(jù)，尤其是像 vector 這種元素連續(xù)存儲的結(jié)構(gòu)。所以，不要僅僅因為“效率”而選用共享數(shù)據(jù)進(jìn)行通信，除非你真正實際測量過。

6、等待事件

有時線程需要等待外部事件，比如另一個線程完成了任務(wù)或者經(jīng)過了一段時間。最簡單的事件是時間。借助 <chrono>，可以寫出：

using namespace std::chrono;

auto t0 = high_resolution_clock::now();
this_thread::sleep_for(milliseconds{20});
auto t1 = high_resolution_clock::now();

cout << duration_cast<nanoseconds>(t1-t0).count() << " nanoseconds passed\n";

注意，我甚至沒有啟動一個線程；默認(rèn)情況下，this_thread 指當(dāng)前唯一的線程。我用 duration_cast 把時間單位轉(zhuǎn)成了我想要的 nanoseconds。

condition_variable 提供了對通過外部事件通信的支持，允許一個線程等待另一個線程，比如等待另一個線程（完成某個工作，然后）觸發(fā)一個事件/條件。

condition_variable 支持很多優(yōu)雅、高效的共享形式，但也可能會很棘手?？紤]一個經(jīng)典的生產(chǎn)者-消費者例子，兩個線程通過一個隊列傳遞消息：

class Message { /**/ }; // 通信的對象

queue<Message> q;       // 消息隊列
condition_variable cv;  // 傳遞事件的變量
mutex m;                // locking 機(jī)制
queue、condition_variable 以及 mutex 由標(biāo)準(zhǔn)庫提供。

消費者讀取并處理 Message

void consumer()
{
    while(true){
        unique_lock<mutex> lck{m}; // 獲取 mutex m
        cv.wait(lck);              // 先釋放 lck，等待事件/條件喚醒
                                   // 喚醒時再次重新獲得 lck
        auto m = q.front();        // 從隊列中取出 Message m
        q.pop();
        lck.unlock();              // 后續(xù)處理消息不再操作隊列 q，提前釋放 lck
        // 處理 m
    }
}

這里我顯式地用 unique_lock<mutex> 保護(hù) queue 和 condition_variable 上的操作。condition_variable 上的 cv.wait(lck) 會釋放參數(shù)中的鎖 lck，直到等待結(jié)束（隊列非空），然后再次獲取 lck。

相應(yīng)的生產(chǎn)者代碼：

void producer()
{
    while(true) {
        Message m;
        // 填充 m
        unique_lock<mutex> lck{m}; // 保護(hù)操作
        q.push(m);
        cv.notify_one();           // 通知/喚醒等待中的 condition_variable
    } // 作用域結(jié)束自動釋放鎖
}

到目前為止，不論是 thread、mutex、lock 還是 condition_variable，都還是低層次的抽象。接下來我們馬上就能看到 C++ 對并發(fā)的高級抽象支持。