進(jìn)程的內(nèi)核棧是什么?淺談Linux的進(jìn)程內(nèi)核棧

在重游《LDD3》的時(shí)候,又發(fā)現(xiàn)了一個(gè)當(dāng)年被我忽略的一句話:
“內(nèi)核具有非常小的棧,它可能只和一個(gè)4096字節(jié)大小的頁(yè)那樣小”
針對(duì)這句話,我簡(jiǎn)單地學(xué)習(xí)了一下進(jìn)程的“內(nèi)核棧”
什么是進(jìn)程的“內(nèi)核棧”?
在每一個(gè)進(jìn)程的生命周期中,必然會(huì)通過(guò)到系統(tǒng)調(diào)用陷入內(nèi)核。在執(zhí)行系統(tǒng)調(diào)用陷入內(nèi)核之后,這些內(nèi)核代碼所使用的棧并不是原先用戶空間中的棧,而是一個(gè)內(nèi)核空間的棧,這個(gè)稱(chēng)作進(jìn)程的“內(nèi)核棧”。
比如,有一個(gè)簡(jiǎn)單的字符驅(qū)動(dòng)實(shí)現(xiàn)了open方法。在這個(gè)驅(qū)動(dòng)掛載后,應(yīng)用程序?qū)δ莻€(gè)驅(qū)動(dòng)所對(duì)應(yīng)的設(shè)備節(jié)點(diǎn)執(zhí)行open操作,這個(gè)應(yīng)用程序的open其實(shí)就通過(guò)glib庫(kù)調(diào)用了Linux的open系統(tǒng)調(diào)用,執(zhí)行系統(tǒng)調(diào)用陷入內(nèi)核后,處理器轉(zhuǎn)換為了特權(quán)模式(具體的轉(zhuǎn)換機(jī)制因構(gòu)架而異,對(duì)于ARM來(lái)說(shuō)普通模式和用戶模式的的棧針(SP)是不同的寄存器),此時(shí)使用的棧指針就是內(nèi)核棧指針,他指向內(nèi)核為每個(gè)進(jìn)程分配的內(nèi)核??臻g。
內(nèi)核棧的作用
我個(gè)人的理解是:在陷入內(nèi)核后,系統(tǒng)調(diào)用中也是存在函數(shù)調(diào)用和自動(dòng)變量,這些都需要棧支持。用戶空間的棧顯然不安全,需要內(nèi)核棧的支持。此外,內(nèi)核棧同時(shí)用于保存一些系統(tǒng)調(diào)用前的應(yīng)用層信息(如用戶空間棧指針、系統(tǒng)調(diào)用參數(shù))。
內(nèi)核棧與進(jìn)程結(jié)構(gòu)體的關(guān)聯(lián)
每個(gè)進(jìn)程在創(chuàng)建的時(shí)候都會(huì)得到一個(gè)內(nèi)核棧空間,內(nèi)核棧和進(jìn)程的對(duì)應(yīng)關(guān)系是通過(guò)2個(gè)結(jié)構(gòu)體中的指針成員來(lái)完成的:
(1)struct task_struct
在學(xué)習(xí)Linux進(jìn)程管理肯定要學(xué)的結(jié)構(gòu)體,在內(nèi)核中代表了一個(gè)進(jìn)程,其中記錄的進(jìn)程的所有狀態(tài)信息,定義在Sched.h (include\linux)。
其中有一個(gè)成員:void *stack;就是指向下面的內(nèi)核棧結(jié)構(gòu)體的“棧底”。
在系統(tǒng)運(yùn)行的時(shí)候,宏current獲得的就是當(dāng)前進(jìn)程的struct task_struct結(jié)構(gòu)體。
(2)內(nèi)核棧結(jié)構(gòu)體union thread_union
union thread_union {
struct thread_info thread_info;
unsigned long stack[THREAD_SIZE/sizeof(long)];
};
其中struct thread_info是記錄部分進(jìn)程信息的結(jié)構(gòu)體,其中包括了進(jìn)程上下文信息:
/*
* low level task data that entry.S needs immediate access to.
* __switch_to() assumes cpu_context follows immediately after cpu_domain.
*/
struct thread_info {
unsigned long flags; /* low level flags */
int preempt_count; /* 0 => preemptable, <0 => bug */
mm_segment_t addr_limit; /* address limit */
struct task_struct *task; /* main task structure */
struct exec_domain *exec_domain; /* execution domain */
__u32 cpu; /* cpu */
__u32 cpu_domain; /* cpu domain */
struct cpu_context_save cpu_context; /* cpu context */
__u32 syscall; /* syscall number */
__u8 used_cp[16]; /* thread used copro */
unsigned long tp_value;
struct crunch_state crunchstate;
union fp_state fpstate __attribute__((aligned(8)));
union vfp_state vfpstate;
#ifdef CONFIG_ARM_THUMBEE
unsigned long thumbee_state; /* ThumbEE Handler Base register */
#endif
struct restart_block restart_block;
};
關(guān)鍵是其中的task成員,指向的是所創(chuàng)建的進(jìn)程的struct task_struct結(jié)構(gòu)體
而其中的stack成員就是內(nèi)核棧。從這里可以看出內(nèi)核??臻g和 thread_info是共用一塊空間的。如果內(nèi)核棧溢出, thread_info就會(huì)被摧毀,系統(tǒng)崩潰了~~~
內(nèi)核棧---struct thread_info----struct task_struct三者的關(guān)系入下圖:
內(nèi)核棧的產(chǎn)生
在進(jìn)程被創(chuàng)建的時(shí)候,fork族的系統(tǒng)調(diào)用中會(huì)分別為內(nèi)核棧和struct task_struct分配空間,調(diào)用過(guò)程是:
fork族的系統(tǒng)調(diào)用--->do_fork--->copy_process--->dup_task_struct
在dup_task_struct函數(shù)中:
static struct task_struct *dup_task_struct(struct task_struct *orig)
{
struct task_struct *tsk;
struct thread_info *ti;
unsigned long *stackend;
int err;
prepare_to_copy(orig);
tsk = alloc_task_struct();
if (!tsk)
return NULL;
ti = alloc_thread_info(tsk);
if (!ti) {
free_task_struct(tsk);
return NULL;
}
err = arch_dup_task_struct(tsk, orig);
if (err)
goto out;
tsk->stack = ti;
err = prop_local_init_single(&tsk->dirties);
if (err)
goto out;
setup_thread_stack(tsk, orig);
......
其中alloc_task_struct使用內(nèi)核的slab分配器去為所要?jiǎng)?chuàng)建的進(jìn)程分配struct task_struct的空間
而alloc_thread_info使用內(nèi)核的伙伴系統(tǒng)去為所要?jiǎng)?chuàng)建的進(jìn)程分配內(nèi)核棧(union thread_union )空間
注意:
后面的tsk->stack = ti;語(yǔ)句,這就是關(guān)聯(lián)了struct task_struct和內(nèi)核棧
而在setup_thread_stack(tsk, orig);中,關(guān)聯(lián)了內(nèi)核棧和struct task_struct:
static inline void setup_thread_stack(struct task_struct *p, struct task_struct *org)
{
*task_thread_info(p) = *task_thread_info(org);
task_thread_info(p)->task = p;
}
內(nèi)核棧的大小
由于是每一個(gè)進(jìn)程都分配一個(gè)內(nèi)核??臻g,所以不可能分配很大。這個(gè)大小是構(gòu)架相關(guān)的,一般以頁(yè)為單位。其實(shí)也就是上面我們看到的THREAD_SIZE,這個(gè)值一般為4K或者8K。對(duì)于ARM構(gòu)架,這個(gè)定義在Thread_info.h (arch\arm\include\asm),
#define THREAD_SIZE_ORDER 1
#define THREAD_SIZE 8192
#define THREAD_START_SP (THREAD_SIZE - 8)
所以ARM的內(nèi)核棧是8KB
在(內(nèi)核)驅(qū)動(dòng)編程時(shí)需要注意的問(wèn)題:
由于??臻g的限制,在編寫(xiě)的驅(qū)動(dòng)(特別是被系統(tǒng)調(diào)用使用的底層函數(shù))中要注意避免對(duì)??臻g消耗較大的代碼,比如遞歸算法、局部自動(dòng)變量定義的大小等等
相關(guān)文章
Linux系統(tǒng)中查看執(zhí)行中的進(jìn)程占用內(nèi)存量的方法
我們可以使用cat命令查看Linux中的內(nèi)存占用情況,這里就以cat的各個(gè)參數(shù)用法為主講解Linux系統(tǒng)中查看執(zhí)行中的進(jìn)程占用內(nèi)存量的方法,需要的朋友可以參考下2016-07-07Linux中進(jìn)程管理工具h(yuǎn)top的安裝與其命令使用教程
這篇文章主要介紹了Linux中進(jìn)程管理工具h(yuǎn)top的安裝與其命令使用教程,htop比系統(tǒng)自帶的top命令行工具更為強(qiáng)大,需要的朋友可以參考下2016-05-03詳解Linux系統(tǒng)中的進(jìn)程初始化配置文件inittab
這篇文章主要介紹了Linux系統(tǒng)中的進(jìn)程初始化配置文件inittab,inittab負(fù)責(zé)設(shè)置init初始化程序初始化腳本的位置,文中對(duì)inittab中的主要字段作了介紹,需要的朋友可以參考下2016-03-08Linux系統(tǒng)中的ps進(jìn)程查看命令使用實(shí)例集錦
這篇文章主要介紹了Linux系統(tǒng)中的ps進(jìn)程查看命令使用實(shí)例集錦,包括對(duì)ps命令的常用參數(shù)總結(jié),整理得非常全面,需要的朋友可以參考下2016-03-03簡(jiǎn)要剖析Linux系統(tǒng)的進(jìn)程管理機(jī)制
這篇文章主要介紹了Linux系統(tǒng)的進(jìn)程管理機(jī)制,包括對(duì)一些基本進(jìn)程管理命令的介紹,需要的朋友可以參考下2016-02-16在Linux系統(tǒng)中使用fuser命令來(lái)列出進(jìn)程編號(hào)
這篇文章主要介紹了在Linux系統(tǒng)中使用fuser命令來(lái)列出進(jìn)程編號(hào)的方法,在管理系統(tǒng)進(jìn)程的時(shí)候非常方便,需要的朋友可以參考下2016-01-15Linux中用于進(jìn)程顯示的top命令使用實(shí)例集錦
這篇文章主要介紹了Linux系統(tǒng)中的top命令使用實(shí)例集錦,top命令的相關(guān)進(jìn)程和任務(wù)查看是Linux系統(tǒng)使用的基礎(chǔ)知識(shí),需要的朋友可以參考下2016-01-04Linux中終止某個(gè)用戶的所有進(jìn)程的簡(jiǎn)單方法
這篇文章主要介紹了Linux中終止某個(gè)用戶的所有進(jìn)程的方法,包括pgrep和pkill等命令的使用整理,需要的朋友可以參考下2015-12-28Linux系統(tǒng)中查殺僵尸進(jìn)程的基本方法講解
這篇文章主要介紹了Linux系統(tǒng)中查殺僵尸進(jìn)程的基本方法講解,文中講到了Linux中處理相關(guān)進(jìn)程的SIGCHLD信號(hào)的相關(guān)知識(shí),需要的朋友可以參考下2015-12-19解讀Linux系統(tǒng)中的進(jìn)程調(diào)度
這篇文章主要介紹了Linux系統(tǒng)中的進(jìn)程調(diào)度,并分析了集中進(jìn)程調(diào)度策略間的相同點(diǎn)和不同點(diǎn),需要的朋友可以參考下2015-10-08