腳本之家服務(wù)器常用軟件

快捷導(dǎo)航

Go語言CSP并發(fā)模型實現(xiàn)MPG

更新時間：2022年05月25日 16:03:02 作者：SUNSKY

這篇文章主要為大家介紹了Go語言CSP并發(fā)模型實現(xiàn)MPG圖文詳解，有需要的朋友可以借鑒參考下，希望能夠有所幫助，祝大家多多進(jìn)步，早日升職加薪

Golang調(diào)度機制

最近抽空研究、整理了一下Golang調(diào)度機制，學(xué)習(xí)了其他大牛的文章。把自己的理解寫下來。如有錯誤，請指正?。?！

golang的goroutine機制有點像線程池：

一、go 內(nèi)部有三個對象： P對象(processor) 代表上下文（或者可以認(rèn)為是cpu），M(work thread)代表工作線程，G對象（goroutine）.

二、正常情況下一個cpu對象啟一個工作線程對象，線程去檢查并執(zhí)行g(shù)oroutine對象。碰到goroutine對象阻塞的時候，會啟動一個新的工作線程，以充分利用cpu資源。所有有時候線程對象會比處理器對象多很多

我們用如下圖分別表示P、M、G

在單核情況下，所有g(shù)oroutine運行在同一個線程（M0）中，每一個線程維護(hù)一個上下文（P），任何時刻，一個上下文中只有一個goroutine，其他goroutine在runqueue中等待。一個goroutine運行完自己的時間片后，讓出上下文，自己回到runqueue中（如下圖左邊所示）。

當(dāng)正在運行的G0阻塞的時候（可以需要IO），會再創(chuàng)建一個線程（M1），P轉(zhuǎn)到新的線程中去運行。

當(dāng)M0返回時，它會嘗試從其他線程中“偷”一個上下文過來，如果沒有偷到，會把goroutine放到global runqueue中去，然后把自己放入線程緩存中。上下文會定時檢查global runqueue。

Go語言是為并發(fā)而生的語言，Go語言是為數(shù)不多的在語言層面實現(xiàn)并發(fā)的語言；也正是Go語言的并發(fā)特性，吸引了全球無數(shù)的開發(fā)者。

并發(fā)(concurrency)和并行(parallellism)

并發(fā)(concurrency)：兩個或兩個以上的任務(wù)在一段時間內(nèi)被執(zhí)行。我們不必care這些任務(wù)在某一個時間點是否是同時執(zhí)行，可能同時執(zhí)行，也可能不是，我們只關(guān)心在一段時間內(nèi)，哪怕是很短的時間（一秒或者兩秒）是否執(zhí)行解決了兩個或兩個以上任務(wù)。

并行(parallellism)：兩個或兩個以上的任務(wù)在同一時刻被同時執(zhí)行。

并發(fā)說的是邏輯上的概念，而并行，強調(diào)的是物理運行狀態(tài)。并發(fā)“包含”并行。

Go的CSP并發(fā)模型

Go實現(xiàn)了兩種并發(fā)形式。第一種是大家普遍認(rèn)知的：多線程共享內(nèi)存。其實就是Java或者C++等語言中的多線程開發(fā)。另外一種是Go語言特有的，也是Go語言推薦的：CSP（communicating sequential processes）并發(fā)模型。

CSP并發(fā)模型是在1970年左右提出的概念，屬于比較新的概念，不同于傳統(tǒng)的多線程通過共享內(nèi)存來通信，CSP講究的是“以通信的方式來共享內(nèi)存”。

請記住下面這句話：

Do not communicate by sharing memory; instead, share memory by communicating.

“不要以共享內(nèi)存的方式來通信，相反，要通過通信來共享內(nèi)存。”

普通的線程并發(fā)模型，就是像Java、C++、或者Python，他們線程間通信都是通過共享內(nèi)存的方式來進(jìn)行的。非常典型的方式就是，在訪問共享數(shù)據(jù)（例如數(shù)組、Map、或者某個結(jié)構(gòu)體或?qū)ο螅┑臅r候，通過鎖來訪問，因此，在很多時候，衍生出一種方便操作的數(shù)據(jù)結(jié)構(gòu)，叫做“線程安全的數(shù)據(jù)結(jié)構(gòu)”。例如Java提供的包”java.util.concurrent”中的數(shù)據(jù)結(jié)構(gòu)。Go中也實現(xiàn)了傳統(tǒng)的線程并發(fā)模型。

Go的CSP并發(fā)模型，是通過goroutine和channel來實現(xiàn)的。

goroutine是Go語言中并發(fā)的執(zhí)行單位。有點抽象，其實就是和傳統(tǒng)概念上的”線程“類似，可以理解為”線程“。

channel是Go語言中各個并發(fā)結(jié)構(gòu)體(goroutine)之前的通信機制。通俗的講，就是各個goroutine之間通信的”管道“，有點類似于Linux中的管道。

生成一個goroutine的方式非常的簡單：Go一下，就生成了。

go f();

通信機制channel也很方便，傳數(shù)據(jù)用channel <- data，取數(shù)據(jù)用<-channel。

在通信過程中，傳數(shù)據(jù)channel <- data和取數(shù)據(jù)<-channel必然會成對出現(xiàn)，因為這邊傳，那邊取，兩個goroutine之間才會實現(xiàn)通信。

而且不管傳還是取，必阻塞，直到另外的goroutine傳或者取為止。

有兩個goroutine，其中一個發(fā)起了向channel中發(fā)起了傳值操作。（goroutine為矩形，channel為箭頭）

左邊的goroutine開始阻塞，等待有人接收。

這時候，右邊的goroutine發(fā)起了接收操作。

右邊的goroutine也開始阻塞，等待別人傳送。

這時候，兩邊goroutine都發(fā)現(xiàn)了對方，于是兩個goroutine開始一傳，一收。

這便是Golang CSP并發(fā)模型最基本的形式。

Go并發(fā)模型的實現(xiàn)原理

我們先從線程講起，無論語言層面何種并發(fā)模型，到了操作系統(tǒng)層面，一定是以線程的形態(tài)存在的。而操作系統(tǒng)根據(jù)資源訪問權(quán)限的不同，體系架構(gòu)可分為用戶空間和內(nèi)核空間；內(nèi)核空間主要操作訪問CPU資源、I/O資源、內(nèi)存資源等硬件資源，為上層應(yīng)用程序提供最基本的基礎(chǔ)資源，用戶空間呢就是上層應(yīng)用程序的固定活動空間，用戶空間不可以直接訪問資源，必須通過“系統(tǒng)調(diào)用”、“庫函數(shù)”或“Shell腳本”來調(diào)用內(nèi)核空間提供的資源。

我們現(xiàn)在的計算機語言，可以狹義的認(rèn)為是一種“軟件”，它們中所謂的“線程”，往往是用戶態(tài)的線程，和操作系統(tǒng)本身內(nèi)核態(tài)的線程（簡稱KSE），還是有區(qū)別的。

線程模型的實現(xiàn)，可以分為以下幾種方式：

用戶級線程模型

如圖所示，多個用戶態(tài)的線程對應(yīng)著一個內(nèi)核線程，程序線程的創(chuàng)建、終止、切換或者同步等線程工作必須自身來完成。

內(nèi)核級線程模型

這種模型直接調(diào)用操作系統(tǒng)的內(nèi)核線程，所有線程的創(chuàng)建、終止、切換、同步等操作，都由內(nèi)核來完成。C++就是這種。

兩級線程模型

這種模型是介于用戶級線程模型和內(nèi)核級線程模型之間的一種線程模型。這種模型的實現(xiàn)非常復(fù)雜，和內(nèi)核級線程模型類似，一個進(jìn)程中可以對應(yīng)多個內(nèi)核級線程，但是進(jìn)程中的線程不和內(nèi)核線程一一對應(yīng)；這種線程模型會先創(chuàng)建多個內(nèi)核級線程，然后用自身的用戶級線程去對應(yīng)創(chuàng)建的多個內(nèi)核級線程，自身的用戶級線程需要本身程序去調(diào)度，內(nèi)核級的線程交給操作系統(tǒng)內(nèi)核去調(diào)度。

Go語言的線程模型就是一種特殊的兩級線程模型。暫且叫它“MPG”模型吧。

Go線程實現(xiàn)模型MPG

M指的是Machine，一個M直接關(guān)聯(lián)了一個內(nèi)核線程。P指的是”processor”，代表了M所需的上下文環(huán)境，也是處理用戶級代碼邏輯的處理器。G指的是Goroutine，其實本質(zhì)上也是一種輕量級的線程。

三者關(guān)系如下圖所示：

以上這個圖講的是兩個線程(內(nèi)核線程)的情況。一個M會對應(yīng)一個內(nèi)核線程，一個M也會連接一個上下文P，一個上下文P相當(dāng)于一個“處理器”，一個上下文連接一個或者多個Goroutine。P(Processor)的數(shù)量是在啟動時被設(shè)置為環(huán)境變量GOMAXPROCS的值，或者通過運行時調(diào)用函數(shù)runtime.GOMAXPROCS()進(jìn)行設(shè)置。Processor數(shù)量固定意味著任意時刻只有固定數(shù)量的線程在運行g(shù)o代碼。Goroutine中就是我們要執(zhí)行并發(fā)的代碼。圖中P正在執(zhí)行的Goroutine為藍(lán)色的；處于待執(zhí)行狀態(tài)的Goroutine為灰色的，灰色的Goroutine形成了一個隊列runqueues

三者關(guān)系的宏觀的圖為：

拋棄P(Processor)

你可能會想，為什么一定需要一個上下文，我們能不能直接除去上下文，讓Goroutine的runqueues掛到M上呢？答案是不行，需要上下文的目的，是讓我們可以直接放開其他線程，當(dāng)遇到內(nèi)核線程阻塞的時候。

一個很簡單的例子就是系統(tǒng)調(diào)用sysall，一個線程肯定不能同時執(zhí)行代碼和系統(tǒng)調(diào)用被阻塞，這個時候，此線程M需要放棄當(dāng)前的上下文環(huán)境P，以便可以讓其他的Goroutine被調(diào)度執(zhí)行。

如上圖左圖所示，M0中的G0執(zhí)行了syscall，然后就創(chuàng)建了一個M1(也有可能本身就存在，沒創(chuàng)建)，（轉(zhuǎn)向右圖）然后M0丟棄了P，等待syscall的返回值，M1接受了P，將·繼續(xù)執(zhí)行Goroutine隊列中的其他Goroutine。

當(dāng)系統(tǒng)調(diào)用syscall結(jié)束后，M0會“偷”一個上下文，如果不成功，M0就把它的Gouroutine G0放到一個全局的runqueue中，然后自己放到線程池或者轉(zhuǎn)入休眠狀態(tài)。全局runqueue是各個P在運行完自己的本地的Goroutine runqueue后用來拉取新goroutine的地方。P也會周期性的檢查這個全局runqueue上的goroutine，否則，全局runqueue上的goroutines可能得不到執(zhí)行而餓死。