如何調(diào)用C標(biāo)準(zhǔn)庫(kù)的exit函數(shù)詳解
編譯大于運(yùn)算符
原定的計(jì)劃中這一篇應(yīng)當(dāng)是要講如何編譯if表達(dá)式的,但是我發(fā)現(xiàn)沒什么東西可以作為if的test-form的部分的表達(dá)式,所以覺得,要不還是先實(shí)現(xiàn)一下比較兩個(gè)數(shù)字這樣子的功能吧。說干就干,我決定用大于運(yùn)算符來作為例子——大于運(yùn)算符就是指>啦。所以,我的目標(biāo)是要編譯下面這樣的代碼
(> 1 2)
并且比較之后的結(jié)果要放在EAX寄存器中。鑒于現(xiàn)在這門語言還非常地簡(jiǎn)陋,沒有布爾類型這樣子的東西,所以在此仿照C語言的處置方式,以數(shù)值0表示邏輯假,其它的值表示邏輯真。所以上面的表達(dá)式在編譯成匯編代碼并最終運(yùn)行后,應(yīng)當(dāng)可以看到EAX寄存器中的值為0。
為了編譯大于運(yùn)算符,并且將結(jié)果放入到EAX寄存器中,需要用到新的指令CMP、JG,以及JMP了。我的想法是,先將第一個(gè)操作數(shù)放入到EAX寄存器,將第二個(gè)操作數(shù)放入到EBX寄存器。然后,使用CMP指令比較這兩個(gè)寄存器。如果EAX中的數(shù)值大于EBX,那么就使用JG指令跳到一個(gè)MOV指令上,這道MOV會(huì)將寄存器EAX的值修改為1;否則,JG不被執(zhí)行,執(zhí)行后續(xù)的一道MOV指令,將數(shù)值0寫入到EAX寄存器,然后使用JMP跳走,避免又執(zhí)行到了剛才的第一道MOV指令。思路還是挺簡(jiǎn)單的。
在修改jjcc2之前,還需要在inside-out/aux中對(duì)>予以支持,但沒什么特別的,就是往member的參數(shù)中加入>這個(gè)符號(hào)而已。之后,將jjcc2改為如下的形式
(defun jjcc2 (expr globals) "支持兩個(gè)數(shù)的四則運(yùn)算的編譯器" (check-type globals hash-table) (cond ((eq (first expr) '+) `((movl ,(get-operand expr 0) %eax) (movl ,(get-operand expr 1) %ebx) (addl %ebx %eax))) ((eq (first expr) '-) `((movl ,(get-operand expr 0) %eax) (movl ,(get-operand expr 1) %ebx) (subl %ebx %eax))) ((eq (first expr) '*) ;; 將兩個(gè)數(shù)字相乘的結(jié)果放到第二個(gè)操作數(shù)所在的寄存器中 ;; 因?yàn)榧s定了用EAX寄存器作為存放最終結(jié)果給continuation用的寄存器,所以第二個(gè)操作數(shù)應(yīng)當(dāng)為EAX `((movl ,(get-operand expr 0) %eax) (movl ,(get-operand expr 1) %ebx) (imull %ebx %eax))) ((eq (first expr) '/) `((movl ,(get-operand expr 0) %eax) (cltd) (movl ,(get-operand expr 1) %ebx) (idivl %ebx))) ((eq (first expr) 'progn) (let ((result '())) (dolist (expr (rest expr)) (setf result (append result (jjcc2 expr globals)))) result)) ((eq (first expr) 'setq) ;; 編譯賦值語句的方式比較簡(jiǎn)單,就是將被賦值的符號(hào)視為一個(gè)全局變量,然后將eax寄存器中的內(nèi)容移動(dòng)到這里面去 ;; TODO: 這里expr的second的結(jié)果必須是一個(gè)符號(hào)才行 ;; FIXME: 不知道應(yīng)該賦值什么比較好,先隨便寫個(gè)0吧 (setf (gethash (second expr) globals) 0) (values (append (jjcc2 (third expr) globals) ;; 為了方便stringify函數(shù)的實(shí)現(xiàn),這里直接構(gòu)造出RIP-relative形式的字符串 `((movl %eax ,(get-operand expr 0)))) globals)) ((eq (first expr) '_exit) ;; 因?yàn)橹繽exit只需要一個(gè)參數(shù),所以將它的第一個(gè)操作數(shù)塞到EDI寄存器里面就可以了 ;; TODO: 更好的寫法,應(yīng)該是有一個(gè)單獨(dú)的函數(shù)來處理這種參數(shù)傳遞的事情(以符合calling convention的方式) `((movl ,(get-operand expr 0) %edi) (movl #x2000001 %eax) (syscall))) ((eq (first expr) '>) ;; 為了可以把比較之后的結(jié)果放入到EAX寄存器中,以我目前不完整的匯編語言知識(shí),可以想到的方法如下 (let ((label-greater-than (intern (symbol-name (gensym)) :keyword)) (label-end (intern (symbol-name (gensym)) :keyword))) ;; 根據(jù)這篇文章(https://en.wikibooks.org/wiki/X86_Assembly/Control_Flow#Comparison_Instructions)中的說法,大于號(hào)左邊的數(shù)字應(yīng)該放在CMP指令的第二個(gè)操作數(shù)中,右邊的放在第一個(gè)操作數(shù)中 `((movl ,(get-operand expr 0) %eax) (movl ,(get-operand expr 1) %ebx) (cmpl %ebx %eax) (jg ,label-greater-than) (movl $0 %eax) (jmp ,label-end) ,label-greater-than (movl $1 %eax) ,label-end)))))
然后便可以在REPL中運(yùn)行下列代碼了
(let* ((ht (make-hash-table)) (asm (jjcc2 (inside-out '(_exit (> 1 2))) ht))) (stringify asm ht))
輸出的匯編代碼為
.data G809: .long 0 .section __TEXT,__text,regular,pure_instructions .globl _main _main: MOVL $1, %EAX MOVL $2, %EBX CMPL %EBX, %EAX JG G810 MOVL $0, %EAX JMP G811 G810: MOVL $1, %EAX G811: MOVL %EAX, G809(%RIP) MOVL G809(%RIP), %EDI MOVL $33554433, %EAX SYSCALL
編譯鏈接運(yùn)行后,就可以得到預(yù)期的結(jié)果了。下面開始本文的正文
調(diào)用C標(biāo)準(zhǔn)庫(kù)的exit函數(shù)
在上面的介紹中,實(shí)現(xiàn)了對(duì)大于號(hào)(>)的處理,那么對(duì)if表達(dá)式的編譯也就是信手拈來的事了,不解釋太多。在本篇中,將會(huì)講述一下如何產(chǎn)生可以調(diào)用來自于C語言標(biāo)準(zhǔn)庫(kù)的exit(3)函數(shù)的匯編代碼。
在Common Lisp中并沒有一個(gè)叫做EXIT的內(nèi)置函數(shù),所以如同之前實(shí)現(xiàn)的_exit一樣,我會(huì)新增一種需要識(shí)別的(first expr),即符號(hào)exit。為了可以調(diào)用C語言標(biāo)準(zhǔn)庫(kù)中的exit函數(shù),需要遵循調(diào)用約定。對(duì)于exit這種只有一個(gè)參數(shù)的函數(shù)而言,情形比較簡(jiǎn)單,只需要跟對(duì)_exit一樣處理即可。剛開始,我寫下的代碼是這樣的
(defun jjcc2 (expr globals) ;; 省略不必要的內(nèi)容 (cond ;; 省略不必要的內(nèi)容 ((member (first expr) '(_exit exit)) ;; 暫時(shí)以硬編碼的方式識(shí)別一個(gè)函數(shù)是否來自于C語言的標(biāo)準(zhǔn)庫(kù) `((movl ,(get-operand expr 0) %edi) (call :|_exit|)))))
對(duì)(exit 1)進(jìn)行編譯,會(huì)得到如下的代碼
.data .section __TEXT,__text,regular,pure_instructions .globl _main _main: MOVL $1, %EDI CALL _exit
不過這樣的代碼經(jīng)過編譯鏈接之后,一運(yùn)行就會(huì)遇到段錯(cuò)誤(segmentation fault)。經(jīng)過一番放狗搜索后,才知道原來在macOS上調(diào)用C函數(shù)的時(shí)候,需要先將棧對(duì)齊到16字節(jié)——我將其理解為將指向棧頂?shù)闹羔槍?duì)齊到16字節(jié)。于是乎,我將jjcc2修改為如下的形式
(defun jjcc2 (expr globals) ;; 省略不必要的內(nèi)容 (cond ;; 省略不必要的內(nèi)容 ((member (first expr) '(_exit exit)) ;; 暫時(shí)以硬編碼的方式識(shí)別一個(gè)函數(shù)是否來自于C語言的標(biāo)準(zhǔn)庫(kù) `((movl ,(get-operand expr 0) %edi) ;; 據(jù)這篇回答(https://stackoverflow.com/questions/12678230/how-to-print-argv0-in-nasm)所說,在macOS上調(diào)用C語言函數(shù),需要將棧對(duì)齊到16位 ;; 假裝要對(duì)齊的是棧頂?shù)刂?。因?yàn)闂m數(shù)刂肥峭偷刂吩鲩L(zhǎng)的,所以只需要將地址的低16位抹掉就可以了 (and ,(format nil "$0x~X" #XFFFFFFF0) %esp) (call :|_exit|)))))
結(jié)果發(fā)現(xiàn)還是不行。最后,實(shí)在沒轍了,只好先寫一段簡(jiǎn)單的C代碼,然后用gcc -S生成匯編代碼,來看看究竟應(yīng)當(dāng)如何處理這個(gè)棧的對(duì)齊要求。一番瞎折騰之后,發(fā)現(xiàn)原來是要處理RSP寄存器而不是ESP寄存器——我也不曉得這是為什么,ESP不就是RSP的低32位而已么。
最后,把jjcc2寫成下面這樣后,終于可以成功編譯(exit 1)了
(defun jjcc2 (expr globals) "支持兩個(gè)數(shù)的四則運(yùn)算的編譯器" (check-type globals hash-table) (cond ((eq (first expr) '+) `((movl ,(get-operand expr 0) %eax) (movl ,(get-operand expr 1) %ebx) (addl %ebx %eax))) ((eq (first expr) '-) `((movl ,(get-operand expr 0) %eax) (movl ,(get-operand expr 1) %ebx) (subl %ebx %eax))) ((eq (first expr) '*) ;; 將兩個(gè)數(shù)字相乘的結(jié)果放到第二個(gè)操作數(shù)所在的寄存器中 ;; 因?yàn)榧s定了用EAX寄存器作為存放最終結(jié)果給continuation用的寄存器,所以第二個(gè)操作數(shù)應(yīng)當(dāng)為EAX `((movl ,(get-operand expr 0) %eax) (movl ,(get-operand expr 1) %ebx) (imull %ebx %eax))) ((eq (first expr) '/) `((movl ,(get-operand expr 0) %eax) (cltd) (movl ,(get-operand expr 1) %ebx) (idivl %ebx))) ((eq (first expr) 'progn) (let ((result '())) (dolist (expr (rest expr)) (setf result (append result (jjcc2 expr globals)))) result)) ((eq (first expr) 'setq) ;; 編譯賦值語句的方式比較簡(jiǎn)單,就是將被賦值的符號(hào)視為一個(gè)全局變量,然后將eax寄存器中的內(nèi)容移動(dòng)到這里面去 ;; TODO: 這里expr的second的結(jié)果必須是一個(gè)符號(hào)才行 ;; FIXME: 不知道應(yīng)該賦值什么比較好,先隨便寫個(gè)0吧 (setf (gethash (second expr) globals) 0) (values (append (jjcc2 (third expr) globals) ;; 為了方便stringify函數(shù)的實(shí)現(xiàn),這里直接構(gòu)造出RIP-relative形式的字符串 `((movl %eax ,(get-operand expr 0)))) globals)) ;; ((eq (first expr) '_exit) ;; ;; 因?yàn)橹繽exit只需要一個(gè)參數(shù),所以將它的第一個(gè)操作數(shù)塞到EDI寄存器里面就可以了 ;; ;; TODO: 更好的寫法,應(yīng)該是有一個(gè)單獨(dú)的函數(shù)來處理這種參數(shù)傳遞的事情(以符合calling convention的方式) ;; `((movl ,(get-operand expr 0) %edi) ;; (movl #x2000001 %eax) ;; (syscall))) ((eq (first expr) '>) ;; 為了可以把比較之后的結(jié)果放入到EAX寄存器中,以我目前不完整的匯編語言知識(shí),可以想到的方法如下 (let ((label-greater-than (intern (symbol-name (gensym)) :keyword)) (label-end (intern (symbol-name (gensym)) :keyword))) ;; 根據(jù)這篇文章(https://en.wikibooks.org/wiki/X86_Assembly/Control_Flow#Comparison_Instructions)中的說法,大于號(hào)左邊的數(shù)字應(yīng)該放在CMP指令的第二個(gè)操作數(shù)中,右邊的放在第一個(gè)操作數(shù)中 `((movl ,(get-operand expr 0) %eax) (movl ,(get-operand expr 1) %ebx) (cmpl %ebx %eax) (jg ,label-greater-than) (movl $0 %eax) (jmp ,label-end) ,label-greater-than (movl $1 %eax) ,label-end))) ((eq (first expr) 'if) ;; 假定if語句的測(cè)試表達(dá)式的結(jié)果也是放在%eax寄存器中的,所以只需要拿%eax寄存器中的值跟0做比較即可(類似于C語言) (let ((label-else (intern (symbol-name (gensym)) :keyword)) (label-end (intern (symbol-name (gensym)) :keyword))) (append (jjcc2 (second expr) globals) `((cmpl $0 %eax) (je ,label-else)) (jjcc2 (third expr) globals) `((jmp ,label-end) ,label-else) (jjcc2 (fourth expr) globals) `(,label-end)))) ((member (first expr) '(_exit exit)) ;; 暫時(shí)以硬編碼的方式識(shí)別一個(gè)函數(shù)是否來自于C語言的標(biāo)準(zhǔn)庫(kù) `((movl ,(get-operand expr 0) %edi) ;; 據(jù)這篇回答(https://stackoverflow.com/questions/12678230/how-to-print-argv0-in-nasm)所說,在macOS上調(diào)用C語言函數(shù),需要將棧對(duì)齊到16位 ;; 假裝要對(duì)齊的是棧頂?shù)刂?。因?yàn)闂m數(shù)刂肥峭偷刂吩鲩L(zhǎng)的,所以只需要將地址的低16位抹掉就可以了 (and ,(format nil "$0x~X" #XFFFFFFFFFFFFFFF0) %rsp) (call :|_exit|)))))
生成的匯編代碼如下
.data .section __TEXT,__text,regular,pure_instructions .globl _main _main: MOVL $1, %EDI AND $0xFFFFFFFFFFFFFFF0, %RSP CALL _exit
好了,這個(gè)時(shí)候我就在想,如果想要支持其它來自C語言標(biāo)準(zhǔn)庫(kù)的函數(shù)的話,只要依葫蘆畫瓢就好了,好像還挺簡(jiǎn)單的——天真的我如此天真地想著。
總結(jié)
以上就是這篇文章的全部?jī)?nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,謝謝大家對(duì)腳本之家的支持。
相關(guān)文章
C++實(shí)現(xiàn)冒泡排序(BubbleSort)
這篇文章主要為大家詳細(xì)介紹了C++實(shí)現(xiàn)冒泡排序,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2020-04-04C語言中進(jìn)行大小寫字母轉(zhuǎn)化的示例代碼
C語言標(biāo)準(zhǔn)庫(kù)中提供了用于大小寫轉(zhuǎn)換的函數(shù),使得這一操作變得簡(jiǎn)單而高效,本文將詳細(xì)介紹如何在C語言中進(jìn)行大小寫字母的轉(zhuǎn)換,包括相關(guān)的函數(shù)和示例代碼,需要的朋友可以參考下2024-03-03C語言圍圈報(bào)數(shù)題目代碼實(shí)現(xiàn)
大家好,本篇文章主要講的是C語言圍圈報(bào)數(shù)題目代碼實(shí)現(xiàn),感興趣的同學(xué)趕快來看一看吧,對(duì)你有幫助的話記得收藏一下,方便下次瀏覽2022-01-01C語言中獲取進(jìn)程識(shí)別碼的相關(guān)函數(shù)
這篇文章主要介紹了C語言中獲取進(jìn)程識(shí)別碼的相關(guān)函數(shù),分別為getpid()函數(shù)和getppid()函數(shù)的使用,需要的朋友可以參考下2015-08-08