Android Init進(jìn)程對(duì)信號(hào)的處理流程詳細(xì)介紹
Android Init進(jìn)程對(duì)信號(hào)的處理流程
在Android中,當(dāng)一個(gè)進(jìn)程退出(exit())時(shí),會(huì)向它的父進(jìn)程發(fā)送一個(gè)SIGCHLD信號(hào)。父進(jìn)程收到該信號(hào)后,會(huì)釋放分配給該子進(jìn)程的系統(tǒng)資源;并且父進(jìn)程需要調(diào)用wait()或waitpid()等待子進(jìn)程結(jié)束。如果父進(jìn)程沒有做這種處理,且父進(jìn)程初始化時(shí)也沒有調(diào)用signal(SIGCHLD, SIG_IGN)來顯示忽略對(duì)SIGCHLD的處理,這時(shí)子進(jìn)程將一直保持當(dāng)前的退出狀態(tài),不會(huì)完全退出。這樣的子進(jìn)程不能被調(diào)度,所做的只是在進(jìn)程列表中占據(jù)一個(gè)位置,保存了該進(jìn)程的PID、終止?fàn)顟B(tài)、CPU使用時(shí)間等信息;我們將這種進(jìn)程稱為“Zombie”進(jìn)程,即僵尸進(jìn)程。
在Linux中,設(shè)置僵尸進(jìn)程的目的是維護(hù)子進(jìn)程的一些信息,以供父進(jìn)程后續(xù)查詢獲取。特殊的,如果一個(gè)父進(jìn)程終止,那么它的所有僵尸子進(jìn)程的父進(jìn)程將被設(shè)置為Init進(jìn)程(PID為1),并由Init進(jìn)程負(fù)責(zé)回收這些僵尸進(jìn)程(Init進(jìn)程將wait()/waitpid()它們,并清除它們?cè)谶M(jìn)程列表中的信息)。
由于僵尸進(jìn)程仍會(huì)在進(jìn)程列表中占據(jù)一個(gè)位置,而Linux所支持的最大進(jìn)程數(shù)量是有限的;超過這個(gè)界限值后,我們就無法創(chuàng)建進(jìn)程。所以,我們有必要清理那些僵尸進(jìn)程,以保證系統(tǒng)的正常運(yùn)作。
接下來,我們分析下Init進(jìn)程是如何處理SIGCHLD信號(hào)的。
在Init.cpp中,我們是通過signal_handler_init()來初始化SIGCHLD信號(hào)處理的:
void signal_handler_init() { // Create a signalling mechanism for SIGCHLD. int s[2]; //socketpair()創(chuàng)造一對(duì)未命名的、相互連接的UNIX域套接字 if (socketpair(AF_UNIX, SOCK_STREAM | SOCK_NONBLOCK | SOCK_CLOEXEC, 0, s) == -1) { ERROR("socketpair failed: %s\n", strerror(errno)); exit(1); } signal_write_fd = s[0]; signal_read_fd = s[1]; // Write to signal_write_fd if we catch SIGCHLD. struct sigaction act; memset(&act, 0, sizeof(act)); act.sa_handler = SIGCHLD_handler;//設(shè)置信號(hào)處理函數(shù)句柄,當(dāng)有信號(hào)產(chǎn)生時(shí),會(huì)向上面創(chuàng)建的socket寫入數(shù)據(jù),epoll監(jiān)控到該socket對(duì)中的fd可讀時(shí),就會(huì)調(diào)用注冊(cè)的函數(shù)去處理該事件 act.sa_flags = SA_NOCLDSTOP;//設(shè)置標(biāo)志,表示只有當(dāng)子進(jìn)程終止時(shí)才接受SIGCHID信號(hào) sigaction(SIGCHLD, &act, 0);//初始化SIGCHLD信號(hào)處理方式 reap_any_outstanding_children();//處理這之前退出的子進(jìn)程 register_epoll_handler(signal_read_fd, handle_signal); }
我們通過sigaction()函數(shù)來初始化信號(hào)。在act參數(shù)中,指定了信號(hào)處理函數(shù):SIGCHLD_handler();如果有信號(hào)到來,就會(huì)調(diào)用該函數(shù)處理;同時(shí),在參數(shù)act中,我們還設(shè)置了SA_NOCLDSTOP標(biāo)志,表示只有當(dāng)子進(jìn)程終止時(shí)才接受SIGCHLD信號(hào)。
Linux中,信號(hào)是一種軟中斷,所以信號(hào)的到來會(huì)終止當(dāng)前進(jìn)程正在處理的操作。所以,我們?cè)谧?cè)的信號(hào)處理函數(shù)中不要調(diào)一些不可重入的函數(shù)。并且,Linux不會(huì)對(duì)信號(hào)做排隊(duì)處理,在一個(gè)信號(hào)的處理期間不管再收到多少個(gè)信號(hào),當(dāng)前信號(hào)處理完畢后,內(nèi)核也只會(huì)再發(fā)送一個(gè)信號(hào)給進(jìn)程;所以這里就存在信號(hào)丟失的可能。為了避免丟失信號(hào),我們注冊(cè)的信號(hào)處理函數(shù)操作應(yīng)該越高效、越快越好。
而我們處理SIGCHLD信號(hào)時(shí),父進(jìn)程會(huì)做等待操作,這個(gè)時(shí)間是比較長(zhǎng)的。為了解決這個(gè)問題,上面的信號(hào)初始化代碼中創(chuàng)建了一對(duì)未命名且相關(guān)聯(lián)的本地socket用于線程間通信。注冊(cè)的信號(hào)處理函數(shù)是SIGCHLD_handler():
static void SIGCHLD_handler(int) { if (TEMP_FAILURE_RETRY(write(signal_write_fd, "1", 1)) == -1) { ERROR("write(signal_write_fd) failed: %s\n", strerror(errno)); } }
#define TEMP_FAILURE_RETRY(exp) \ ({ \ decltype(exp) _rc; \ do { \ _rc = (exp); \ } while (_rc == -1 && errno == EINTR); \ _rc; \ })
當(dāng)有信號(hào)到來時(shí),只要向socket中寫入數(shù)據(jù),這個(gè)過程是很快的,此時(shí)信號(hào)的處理就轉(zhuǎn)移到socket的響應(yīng)中去進(jìn)行了;這樣就不會(huì)影響下一個(gè)信號(hào)的處理。同時(shí),write()函數(shù)外圍嵌套了一個(gè)do...while循環(huán),循環(huán)條件是write()發(fā)生錯(cuò)誤且當(dāng)前的錯(cuò)誤號(hào)為EINTR(EINTR :此調(diào)用被信號(hào)所中斷),即當(dāng)前write()是由于有中斷到來而發(fā)生錯(cuò)誤時(shí),操作將再次執(zhí)行;其他情況下,write()函數(shù)只會(huì)執(zhí)行一次。再初始化完信號(hào)處理后,就會(huì)調(diào)用reap_any_outstanding_children() 處理這之前的進(jìn)程退出情況:
static void reap_any_outstanding_children() { while (wait_for_one_process()) { } }
wait_for_one_process()主要調(diào)用waitpid()等待子進(jìn)程結(jié)束,當(dāng)該進(jìn)程代表的服務(wù)需要重啟時(shí),會(huì)對(duì)它做一些設(shè)置、清理工作。
最后,通過epoll_ctl()向epoll_fd注冊(cè)本地socket,監(jiān)聽其是否可讀;并注冊(cè)了epoll事件的處理函數(shù):
register_epoll_handler(signal_read_fd, handle_signal);
void register_epoll_handler(int fd, void (*fn)()) { epoll_event ev; ev.events = EPOLLIN;//對(duì)文件描述符可讀 ev.data.ptr = reinterpret_cast<void*>(fn);//保存指定的函數(shù)指針,用于后續(xù)的事件處理 if (epoll_ctl(epoll_fd, EPOLL_CTL_ADD, fd, &ev) == -1) {//向epoll_fd添加要監(jiān)聽的fd,比如property、keychord和signal事件監(jiān)聽 ERROR("epoll_ctl failed: %s\n", strerror(errno)); } }
我們以Zygote進(jìn)程退出為例,來看下SIGCHLD信號(hào)處理的具體流程。Zygote進(jìn)程在init.rc中被聲明為Service并由Init進(jìn)程創(chuàng)建。當(dāng)Zygote進(jìn)程退出時(shí),將向Init進(jìn)程發(fā)送SIGCHLD信號(hào)。前面的代碼已經(jīng)完成了信號(hào)的初始化操作,所以當(dāng)信號(hào)到來時(shí)會(huì)調(diào)用SIGCHLD_handler()函數(shù)處理,它的處理就是直接通過socket寫入一個(gè)數(shù)據(jù)就立刻返回;這時(shí),SIGCHLD的處理就轉(zhuǎn)移到socket事件的響應(yīng)上。我們通過epoll_ctl注冊(cè)了本地socket,并監(jiān)聽它是否可讀;這時(shí)由于之前的write()調(diào)用,此時(shí)socket有數(shù)據(jù)可讀,此刻會(huì)調(diào)用注冊(cè)的handle_signal()函數(shù)進(jìn)行處理:
static void handle_signal() { // Clear outstanding requests. char buf[32]; read(signal_read_fd, buf, sizeof(buf)); reap_any_outstanding_children(); }
它會(huì)將socket的數(shù)據(jù)的獨(dú)到buf中,并調(diào)用reap_any_outstanding_children()函數(shù)處理子進(jìn)程的退出及服務(wù)的重啟操作:
static void reap_any_outstanding_children() { while (wait_for_one_process()) { } }
static bool wait_for_one_process() { int status; pid_t pid = TEMP_FAILURE_RETRY(waitpid(-1, &status, WNOHANG));//等待子進(jìn)程結(jié)束,并獲取到它的pid進(jìn)程號(hào),WNOHANG表明若沒有進(jìn)程結(jié)束,則立即返回. if (pid == 0) { return false; } else if (pid == -1) { ERROR("waitpid failed: %s\n", strerror(errno)); return false; } service* svc = service_find_by_pid(pid);//根據(jù)pid,在鏈表中找到這個(gè)服務(wù)信息 std::string name; if (svc) { name = android::base::StringPrintf("Service '%s' (pid %d)", svc->name, pid); } else { name = android::base::StringPrintf("Untracked pid %d", pid); } NOTICE("%s %s\n", name.c_str(), DescribeStatus(status).c_str()); if (!svc) { return true; } // TODO: all the code from here down should be a member function on service. //如果該服務(wù)進(jìn)程沒有設(shè)定SVC_ONESHOT標(biāo)志,或者設(shè)置了SVC_RESTART標(biāo)志,則先殺掉當(dāng)前的進(jìn)程,在重新創(chuàng)建新的進(jìn)程; //以避免后面重啟進(jìn)程時(shí),因當(dāng)前服務(wù)進(jìn)程已經(jīng)存在而發(fā)生錯(cuò)誤. if (!(svc->flags & SVC_ONESHOT) || (svc->flags & SVC_RESTART)) { NOTICE("Service '%s' (pid %d) killing any children in process group\n", svc->name, pid); kill(-pid, SIGKILL); } // Remove any sockets we may have created. //如果之前為這個(gè)服務(wù)進(jìn)程創(chuàng)建過socket,這時(shí)我們需要清除掉該socket for (socketinfo* si = svc->sockets; si; si = si->next) { char tmp[128]; snprintf(tmp, sizeof(tmp), ANDROID_SOCKET_DIR"/%s", si->name); unlink(tmp);//刪除這個(gè)socket設(shè)備文件 } if (svc->flags & SVC_EXEC) {////服務(wù)完全退出,清除掉所有信息,并將該服務(wù)從svc-slist中移除 INFO("SVC_EXEC pid %d finished...\n", svc->pid); waiting_for_exec = false; list_remove(&svc->slist); free(svc->name); free(svc); return true; } svc->pid = 0; svc->flags &= (~SVC_RUNNING); // Oneshot processes go into the disabled state on exit, // except when manually restarted. //如果該服務(wù)進(jìn)程帶有SVC_ONESHOT標(biāo)志,且沒有SVC_RESTART標(biāo)志,則表明該服務(wù)無需重啟 if ((svc->flags & SVC_ONESHOT) && !(svc->flags & SVC_RESTART)) { svc->flags |= SVC_DISABLED; } // Disabled and reset processes do not get restarted automatically. //如果服務(wù)帶有SVC_RESET標(biāo)志,表示服務(wù)無需重啟 if (svc->flags & (SVC_DISABLED | SVC_RESET)) {//從結(jié)果看SVC_RESET標(biāo)志的判斷優(yōu)先級(jí)最高 svc->NotifyStateChange("stopped"); return true; } //到此,我們可以得知一個(gè)服務(wù)進(jìn)程在init.rc中只要沒有聲明SVC_ONESHOT和SVC_RESET標(biāo)志,當(dāng)該進(jìn)程死亡時(shí),就會(huì)被重啟; //但是,如果一個(gè)服務(wù)進(jìn)程帶有SVC_CRITICAL標(biāo)志,且沒有SVC_RESTART標(biāo)志,當(dāng)它c(diǎn)rash、重啟的次數(shù)超過4此時(shí),系統(tǒng)會(huì)自動(dòng)重啟并進(jìn)入recovery模式 time_t now = gettime(); if ((svc->flags & SVC_CRITICAL) && !(svc->flags & SVC_RESTART)) { if (svc->time_crashed + CRITICAL_CRASH_WINDOW >= now) { if (++svc->nr_crashed > CRITICAL_CRASH_THRESHOLD) { ERROR("critical process '%s' exited %d times in %d minutes; " "rebooting into recovery mode\n", svc->name, CRITICAL_CRASH_THRESHOLD, CRITICAL_CRASH_WINDOW / 60); android_reboot(ANDROID_RB_RESTART2, 0, "recovery"); return true; } } else { svc->time_crashed = now; svc->nr_crashed = 1; } } svc->flags &= (~SVC_RESTART); svc->flags |= SVC_RESTARTING;//為服務(wù)加上重啟標(biāo)志,表明它需要重啟;后續(xù)工作要以此判斷 // Execute all onrestart commands for this service. struct listnode* node; list_for_each(node, &svc->onrestart.commands) {//如果服務(wù)有onrestart選項(xiàng),則遍歷進(jìn)程重啟時(shí)需要執(zhí)行的命令列表,并執(zhí)行 command* cmd = node_to_item(node, struct command, clist); cmd->func(cmd->nargs, cmd->args); } svc->NotifyStateChange("restarting"); return true; }
該函數(shù)中的處理主要這幾個(gè)要點(diǎn):
- 調(diào)用waitpid()等待子進(jìn)程結(jié)束,waitpid()的返回值就是子進(jìn)程的進(jìn)程號(hào)。如果沒有子進(jìn)程退出,由于設(shè)置了WONHANG標(biāo)志,waitpid()就會(huì)立即返回而不會(huì)掛起。嵌套的TEMP_FAILURE_RETRY()含義與之前介紹的類似,當(dāng)waitpid()返回錯(cuò)誤且錯(cuò)誤碼是EINTR,將重復(fù)調(diào)用waitpid()。
- 根據(jù)pid,從service_list列表中找到對(duì)應(yīng)進(jìn)程對(duì)應(yīng)的service信息。如果該服務(wù)進(jìn)程的定義在init.rc中沒有設(shè)定SVC_ONESHOT標(biāo)志,或者設(shè)置了SVC_RESTART標(biāo)志,則先殺掉當(dāng)前的進(jìn)程,再重新創(chuàng)建新的進(jìn)程;以避免后面重新創(chuàng)建進(jìn)程時(shí),因當(dāng)前服務(wù)進(jìn)程已經(jīng)存在而發(fā)生錯(cuò)誤。
- 如果為當(dāng)前服務(wù)創(chuàng)建了socket,則清除這個(gè)socket。
- 如果該服務(wù)進(jìn)程帶有SVC_ONESHOT標(biāo)志,且沒有SVC_RESTART標(biāo)志,則表明該服務(wù)無需重啟。
- 如果服務(wù)帶有SVC_RESET標(biāo)志,表示服務(wù)無需重啟。
- 如果一個(gè)服務(wù)進(jìn)程帶有SVC_CRITICAL標(biāo)志,且沒有SVC_RESTART標(biāo)志,當(dāng)它c(diǎn)rash、重啟的次數(shù)超過4此時(shí),系統(tǒng)會(huì)自動(dòng)重啟并進(jìn)入recovery模式。
- 如果服務(wù)判斷為需要重啟,則為該服務(wù)加上重啟標(biāo)志SVC_RESTARTING,表明它需要重新啟動(dòng);后續(xù)工作要以此判斷。//重要
- 最后,如果服務(wù)有onrestart選項(xiàng),則遍歷服務(wù)重啟時(shí)需要執(zhí)行的命令列表,并執(zhí)行這些命令
如果這個(gè)子進(jìn)程所代表的服務(wù)需要重啟,則會(huì)為該服務(wù)加上SVC_RESTARTING標(biāo)志。
在之前介紹Init進(jìn)程初始化流程時(shí),我們分析過,當(dāng)Init進(jìn)程處理完,它就會(huì)進(jìn)入一個(gè)循環(huán)化身為守護(hù)進(jìn)程,處理signal、property和keychord等服務(wù):
while (true) { if (!waiting_for_exec) { execute_one_command();//執(zhí)行命令列表中的命令 restart_processes();//啟動(dòng)服務(wù)列表中的進(jìn)程 } int timeout = -1; if (process_needs_restart) { timeout = (process_needs_restart - gettime()) * 1000; if (timeout < 0) timeout = 0; } if (!action_queue_empty() || cur_action) { timeout = 0; } bootchart_sample(&timeout);//bootchart是一個(gè)用可視化方式對(duì)啟動(dòng)過程進(jìn)行性能分析的工具;需要定時(shí)喚醒進(jìn)程 epoll_event ev; int nr = TEMP_FAILURE_RETRY(epoll_wait(epoll_fd, &ev, 1, timeout));//開始輪詢,epoll_wait()等待事件產(chǎn)生 if (nr == -1) { ERROR("epoll_wait failed: %s\n", strerror(errno)); } else if (nr == 1) { ((void (*)()) ev.data.ptr)();//調(diào)用epoll_event事件存儲(chǔ)的函數(shù)指針處理事件 } }
其中,它會(huì)循環(huán)調(diào)用restart_processes()去重啟在service_list列表中帶有所有帶有SVC_RESTARTING標(biāo)志(該標(biāo)志是在wait_for_one_process()處理中設(shè)置的)的服務(wù):
static void restart_processes() { process_needs_restart = 0; service_for_each_flags(SVC_RESTARTING, restart_service_if_needed); } void service_for_each_flags(unsigned matchflags, void (*func)(struct service *svc)) { struct listnode *node; struct service *svc; list_for_each(node, &service_list) { svc = node_to_item(node, struct service, slist); if (svc->flags & matchflags) { func(svc); } } }
static void restart_service_if_needed(struct service *svc) { time_t next_start_time = svc->time_started + 5; if (next_start_time <= gettime()) { svc->flags &= (~SVC_RESTARTING); service_start(svc, NULL); return; } if ((next_start_time < process_needs_restart) || (process_needs_restart == 0)) { process_needs_restart = next_start_time; } }
最終會(huì)調(diào)用service_start()函數(shù)去重新啟動(dòng)一個(gè)退出的服務(wù)。service_start()的處理過程在介紹Init進(jìn)程處理流程時(shí)已經(jīng)分析,這里就不再贅述。
感謝閱讀,希望能幫助到大家,謝謝大家對(duì)本站的支持!
相關(guān)文章
Android 解決使用SearchView時(shí)軟鍵盤不支持actionSearch的問題
本文主要介紹使用SearchView時(shí)軟鍵盤不支持actionSearch,這里提供了解決方案,希望能幫助開發(fā)Android應(yīng)用的同學(xué)2016-07-07android模擬器開發(fā)和測(cè)試nfc應(yīng)用實(shí)例詳解
本文介紹android模擬器開發(fā)nfc應(yīng)用詳解,大家參考使用吧2013-12-12Android時(shí)間選擇器、日期選擇器實(shí)現(xiàn)代碼
這篇文章主要為大家分別介紹了Android時(shí)間選擇器、日期選擇器實(shí)現(xiàn)代碼,感興趣的小伙伴們可以參考一下2016-04-04Android UI實(shí)時(shí)預(yù)覽和編寫的各種技巧
大家好,今天給大家分享的是Android中實(shí)時(shí)預(yù)覽UI和編寫UI的各種技巧,2015-11-11Android中給按鈕同時(shí)設(shè)置背景和圓角示例代碼
相信每位Android開發(fā)者們都遇到過給按鈕設(shè)置背景或者設(shè)置圓角的需求,但是如果要同時(shí)設(shè)置背景和圓角該怎么操作才是方便快捷的呢?這篇文章通過示例代碼給大家演示了Android中給按鈕同時(shí)設(shè)置背景和圓角的方法,有需要的朋友們可以參考借鑒。2016-10-10Android中實(shí)現(xiàn)基本的短信攔截功能的代碼示例
這篇文章主要介紹了Android中實(shí)現(xiàn)基本短信攔截功能的代碼示例,這里之突出核心部分針對(duì)一個(gè)號(hào)碼,當(dāng)然程序擴(kuò)充后可以制定更多攔截規(guī)則,需要的朋友可以參考下2016-04-04Android實(shí)現(xiàn)手機(jī)攝像頭的自動(dòng)對(duì)焦
這篇文章主要為大家詳細(xì)介紹了Android實(shí)現(xiàn)手機(jī)攝像頭的自動(dòng)對(duì)焦的相關(guān)資料,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2016-11-11