C語言的fork函數(shù)在Linux中的進程操作及相關(guān)面試題講解
fork的意義
下圖為,C 程序的存儲空間布局(典型)
1.一個現(xiàn)有進程可以調(diào)用 fork 函數(shù)創(chuàng)建一個新進程。
2.fork 函數(shù)被調(diào)用一次,但返回兩次, 兩次返回的唯一區(qū)別是子進程的返回值是 0, 而父進程的返回值是新子進程的 PID。
3.子進程和父進程繼續(xù)執(zhí)行 fork 調(diào)用之后的指令。
在上圖的存儲空間布局中,父子進程只共享正文段,其余的都各自有獨立的副本 (通常使用 copy-on-write 的策略,速度比較快)。
fork 的兩種用法
1.父子進程同時執(zhí)行不同的代碼段
典型應(yīng)用:Web 服務(wù)器。
以下代碼是簡單的 fork 父子進程分別執(zhí)行不同的代碼:
#include <unistd.h> #include <stdlib.h> #include <stdio.h> #define err_sys(x) do { perror(x); exit(1); } while (0) void invoke_child(char ch) { printf("%c\n", ch); } int main(int argc, char *argv[]) { pid_t pid; int cnt = 3; char arg[] = "abc"; while(cnt--) { if ((pid = fork()) < 0) { err_sys("Fork error"); } else if (pid == 0) { invoke_child(arg[cnt]); exit(0); } } return 0; }
2.一個進程要執(zhí)行一個不同的程序
典型應(yīng)用:Shell。
這里就不舉例子了~
關(guān)于fork的一道面試題
題目:請問下面的程序一共輸出多少個“-”?
#include <stdio.h> #include <sys/types.h> #include <unistd.h> int main(void) { int i; for(i=0; i<2; i++){ fork(); printf("-"); } return 0; }
如果你對fork()的機制比較熟悉的話,這個題并不難,輸出應(yīng)該是6個“-”,但是,實際上這個程序會很tricky地輸出8個“-”。
要講清這個題,我們首先需要知道fork()系統(tǒng)調(diào)用的特性,
1.fork()系統(tǒng)調(diào)用是Unix下以自身進程創(chuàng)建子進程的系統(tǒng)調(diào)用,一次調(diào)用,兩次返回,如果返回是0,則是子進程,如果返回值>0,則是父進程(返回值是子進程的pid),這是眾為周知的。
2.還有一個很重要的東西是,在fork()的調(diào)用處,整個父進程空間會原模原樣地復(fù)制到子進程中,包括指令,變量值,程序調(diào)用棧,環(huán)境變量,緩沖區(qū),等等。
所以,上面的那個程序為什么會輸入8個“-”,這是因為printf(“-”);語句有buffer,所以,對于上述程序,printf(“-”);把“-”放到了緩存中,并沒有真正的輸出(參看《C語言的迷題》中的第一題),在fork的時候,緩存被復(fù)制到了子進程空間,所以,就多了兩個,就成了8個,而不是6個。
另外,多說一下,我們知道,Unix下的設(shè)備有“塊設(shè)備”和“字符設(shè)備”的概念,所謂塊設(shè)備,就是以一塊一塊的數(shù)據(jù)存取的設(shè)備,字符設(shè)備是一次存取一個字符的設(shè)備。磁盤、內(nèi)存都是塊設(shè)備,字符設(shè)備如鍵盤和串口。塊設(shè)備一般都有緩存,而字符設(shè)備一般都沒有緩存。
對于上面的問題,我們?nèi)绻薷囊幌律厦娴膒rintf的那條語句為:
printf("-n");
或是
printf("-"); fflush(stdout);
就沒有問題了(就是6個“-”了),因為程序遇到“n”,或是EOF,或是緩中區(qū)滿,或是文件描述符關(guān)閉,或是主動flush,或是程序退出,就會把數(shù)據(jù)刷出緩沖區(qū)。需要注意的是,標(biāo)準(zhǔn)輸出是行緩沖,所以遇到“n”的時候會刷出緩沖區(qū),但對于磁盤這個塊設(shè)備來說,“n”并不會引起緩沖區(qū)刷出的動作,那是全緩沖,你可以使用setvbuf來設(shè)置緩沖區(qū)大小,或是用fflush刷緩存。
我估計有些朋友可能對于fork()還不是很了解,那么我們把上面的程序改成下面這樣:
#include <stdio.h> #include <sys/types.h> #include <unistd.h> int main(void) { int i; for(i=0; i<2; i++){ fork(); //注意:下面的printf有“n” printf("ppid=%d, pid=%d, i=%d n", getppid(), getpid(), i); } sleep(10); //讓進程停留十秒,這樣我們可以用pstree查看一下進程樹 return 0; }
于是,上面這段程序會輸出下面的結(jié)果,(注:編譯出的可執(zhí)行的程序名為fork)
ppid=8858, pid=8518, i=0 ppid=8858, pid=8518, i=1 ppid=8518, pid=8519, i=0 ppid=8518, pid=8519, i=1 ppid=8518, pid=8520, i=1 ppid=8519, pid=8521, i=1
$ pstree -p | grep fork
|-bash(8858)-+-fork(8518)-+-fork(8519)---fork(8521)
面對這樣的圖你可能還是看不懂,沒事,我好事做到底,畫個圖給你看看:
注意:上圖中的我用了幾個色彩,相同顏色的是同一個進程。于是,我們的pstree的圖示就可以成為下面這個樣子:(下圖中的顏色與上圖對應(yīng))
這樣,對于printf(“-”);這個語句,我們就可以很清楚的知道,哪個子進程復(fù)制了父進程標(biāo)準(zhǔn)輸出緩中區(qū)里的的內(nèi)容,而導(dǎo)致了多次輸出了。(如下圖所示,就是我陰影并雙邊框了那兩個子進程)
相關(guān)文章
文件編譯時出現(xiàn)multiple definition of ''xxxxxx''的具體解決方法
以下是對文件編譯時出現(xiàn)multiple definition of 'xxxxxx'的解決方法進行了詳細的分析介紹,如也遇到此問題的朋友們可以過來參考下2013-07-07詳解C++中typedef 和 #define 的區(qū)別
這篇文章主要介紹了C++中typedef 與 #define 的區(qū)別,本文通過實例代碼給大家介紹的非常詳細,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2021-09-09