C語言深入探究sizeof與整型數(shù)據(jù)存儲及數(shù)據(jù)類型取值范圍
1.關(guān)鍵字sizeof
sizeof 與 strlen 是我們?nèi)粘4虼a時(shí)經(jīng)常使用到的兩個(gè)“工具”。前者是求變量或者類型的大小(單位為字節(jié)),后者是求某一字符串的長度。我們很容易產(chǎn)生這樣一個(gè)誤解,即把 sizeof 和 strlen 歸為函數(shù)一類。事實(shí)上 sizeof 并不是一個(gè)函數(shù),它是一個(gè)操作符、關(guān)鍵字。我們通過一段代碼證明它不是函數(shù):
#include <stdio.h> int main() { int n = 20; printf("%d\n", sizeof(n)); printf("%d\n", sizeof(int)); printf("%d\n", sizeof n); return 0; }
我們注意到紅線部分的 sizeof 后面的變量名沒有加括號也能正常運(yùn)行:
這就證明了 sizeof 它不是一個(gè)函數(shù),而是一個(gè)操作符、關(guān)鍵字。
在這里順便復(fù)習(xí)一下關(guān)于數(shù)組的知識,即數(shù)組名的兩個(gè)特例(除了這兩種情況其他任何時(shí)候數(shù)組名都表示數(shù)組首元素地址):
- sizeof 內(nèi)單獨(dú)放數(shù)組名,其數(shù)組名表整個(gè)數(shù)組。
- & 數(shù)組名,表取整個(gè)數(shù)組的地址。
由此也可以看出 sizeof 與函數(shù)的區(qū)別。
2.整型數(shù)據(jù)存儲深入
變量的作用是在內(nèi)存中開辟一塊空間,而類型則決定了這塊空間有多大。
我們可以與 sizeof 結(jié)合起來驗(yàn)證這個(gè)問題:
#include <stdio.h> int main() { printf("%d\n", sizeof(char)); printf("%d\n", sizeof(short)); printf("%d\n", sizeof(int)); printf("%d\n", sizeof(long)); printf("%d\n", sizeof(long long)); return 0; }
我們知道,計(jì)算機(jī)只能識別二進(jìn)制,恰恰計(jì)算機(jī)系統(tǒng)又能把我們?nèi)祟愂炀毷褂玫氖M(jìn)制轉(zhuǎn)換成二進(jìn)制,并且產(chǎn)生相應(yīng)的原碼、反碼、補(bǔ)碼。設(shè)計(jì)計(jì)算機(jī)的人設(shè)計(jì)出這樣一套規(guī)則是非常巧妙的。
我們引出原碼、反碼、補(bǔ)碼如何計(jì)算以及他們之間如何轉(zhuǎn)換:
- 原碼:將數(shù)字直接翻譯成二進(jìn)制得到的序列。
- 反碼:在原碼的基礎(chǔ)上符號位(二進(jìn)制序列的最高位,1表負(fù)數(shù),0表負(fù)數(shù))不變,替他位按位取反得到的序列。
- 補(bǔ)碼:在反碼的基礎(chǔ)上加1。
- 補(bǔ)碼計(jì)算回原碼方法一:補(bǔ)碼減1,然后符號位不變,其他位按位取反得到原碼。
- 補(bǔ)碼計(jì)算回原碼方法二:補(bǔ)碼符號位不變,其他位按位取反,然后加1。此方法與原碼計(jì)算補(bǔ)碼的方式是一樣的,這樣做的意義在于 CPU 進(jìn)行數(shù)據(jù)處理時(shí),只要設(shè)計(jì)一套計(jì)算方法就可以完成原碼、反碼、補(bǔ)碼之間的相互轉(zhuǎn)換。
那么具體的例子,在數(shù)據(jù)的存儲——整形篇有講到,這里就不贅述。
我們需要明白的是:數(shù)據(jù)存儲到變量當(dāng)中,不會受到類型的影響。什么意思呢?我們舉個(gè)例子:
#include <stdio.h> int main() { unsigned int p = -10; return 0; }
大家可以看到,我把一個(gè)負(fù)數(shù)存入到無符號的整型變量 p 中,這有些違反我們的直覺,無符號類型不是不存在負(fù)數(shù)的概念嗎?事實(shí)上,不是程序出錯(cuò),而是我們的直覺有問題。
我們在一開頭便闡述了變量的作用在內(nèi)存中開辟一塊空間,而類型便是決定開辟多大的空間。就好比說,我們有 100 ,放在了我的荷包里,那我們能說我有 100 塊嗎?就算是錢,我們定義它是美元、港幣、日元了嗎?所以,我們可以把變量看成 100 ,類型看成是美元、港幣、日元等等。
到這里,我們就可以清楚,數(shù)據(jù)的存儲與變量的類型是沒有關(guān)系的,變量的作用僅僅是開辟一塊空間讓我們的數(shù)據(jù)存儲進(jìn)去。聊到這里,不妨讓我們再回顧一下,整型數(shù)據(jù)是如何存放在變量(內(nèi)存)里面的。我們就以上面那段代碼為例:
這里再提一嘴:雖然內(nèi)存中存放的是二進(jìn)制序列,但為了我們方便,內(nèi)存還是會以十六進(jìn)制的表現(xiàn)形式表現(xiàn)出來。
我們試探性往內(nèi)存里面看 p 變量里面存的是什么東西:
可以發(fā)現(xiàn),內(nèi)存里面的各種數(shù)據(jù)都對上了我們分析的結(jié)果,但是看起來有點(diǎn)“怪”。我們就來分析“怪”在哪里:
我們知道 int 類型是有 4 個(gè)字節(jié)的,那么數(shù)據(jù)占了 4 個(gè)字節(jié)沒有問題。那么如果是以 1 列的形式查看地址,可以看到從上到下的地址是遞增的。
現(xiàn)在我們以 4 列的形式查看地址,可以看到從左往右地址遞增,從上往下地址遞增。
得出一個(gè)現(xiàn)象:f6 存在了我們的低地址處。
我們似乎可以這樣做推導(dǎo):
這樣的存儲模式我們叫做小端存儲。為什么這樣的模式叫做小端存儲?我們使用這個(gè)案例來類比:
所以我們得出結(jié)論,小端與大端的存儲模式可以定義為:
- 權(quán)重小的數(shù)位放入內(nèi)存中的低地址處,權(quán)重大的放入內(nèi)存中的高地址處,這樣的存儲模式叫小端存儲。
- 權(quán)重小的數(shù)位放入內(nèi)存中的高地址處,權(quán)重小的放入內(nèi)存中的低地址處,這樣的存儲模式叫大端存儲。
為什么會有這種看似復(fù)雜的存儲模式?我們可以舉一個(gè)例子:我們大家都吃過雞蛋,有些人剝殼喜歡往小的那一頭剝,有的人喜歡往大的那一頭剝,也就是“剝雞蛋”這個(gè)動作,沒有統(tǒng)一的行為概念。硬件制作廠商也不例外,有的廠商想讓數(shù)據(jù)的存儲行為是小端,也有的廠商想讓數(shù)據(jù)以大端的模式進(jìn)行存儲,只不過我們平時(shí)所接觸的硬件,都是以小端模式存儲字節(jié)序的。
我們討論了數(shù)據(jù)的存儲,現(xiàn)在我們來討論一下數(shù)據(jù)的“取出”規(guī)則。
好比說我們舉這個(gè)例子:
#include <stdio.h> int main() { unsigned int p = -10; printf("%u\n", p); printf("%d\n", p); return 0; }
我們可以看到,對于 -10 存儲在內(nèi)存當(dāng)中,我們第一次使用 %u 的形式將它從內(nèi)存里拿出來,第二次使用 %d 的形式將它從內(nèi)存中拿出來。
我們可以看到,對于不同類型的使用方式就會造成不同的結(jié)果。我們似乎可以這樣斷定:數(shù)據(jù)類型不會影響數(shù)據(jù)的存儲,但一定會影響數(shù)據(jù)的取出(使用)。我們來分析一下為什么使用不同的類型打印能造成不同的結(jié)果:
所以我們再總結(jié)一次:變量的數(shù)據(jù)類型不會對數(shù)據(jù)的存儲產(chǎn)生影響(截?cái)嘁膊荒芩愠墒且环N影響),但數(shù)據(jù)類型一定會影響數(shù)據(jù)的取出、使用。
3.數(shù)據(jù)類型取值范圍深入
什么叫數(shù)據(jù)類型的取值范圍?好比說我們有這樣一個(gè)例子:
那么我們?nèi)?C 語言中大小最小的數(shù)據(jù)類型 char 來討論數(shù)據(jù)類型的取值范圍。
我們知道,char 類型只有 1 個(gè)字節(jié),它有 8 個(gè)比特位。無符號類型的 char 我們就不做討論,我們重點(diǎn)討論無符號類型的 char 。那么 8 個(gè)比特位,能有多少種排列組合?能從什么值取到什么值?
那么通過演繹推理,得出來排列組合得個(gè)數(shù),有什么意義呢?可以確定八個(gè)比特位能存放多少個(gè)數(shù)字。例如兩個(gè)比特位能存放 4 個(gè)數(shù)字,三個(gè)比特位能存放 8 個(gè)數(shù)字,八個(gè)比特位能存放 256 個(gè)數(shù)字。
現(xiàn)在我們的重點(diǎn)在于:char 類型的八個(gè)比特位,能存哪 256 個(gè)數(shù)字?
可以看到這個(gè)結(jié)果,取值范圍似乎是 [-127,127] ,但是這個(gè)區(qū)間里面只有 255 個(gè)數(shù),那我們理論推導(dǎo)出來的結(jié)果是 256 個(gè)數(shù),是我們推導(dǎo)錯(cuò)了嗎?其實(shí)不然,我們應(yīng)該注意 1000 0000 后面的那個(gè)問號:如果這串二進(jìn)制序列真表示 0 了,那么就有兩個(gè) 0 了,但是在計(jì)算機(jī)在考慮取值范圍的時(shí)候,是不會浪費(fèi)任何一個(gè)比特位來存放相同的數(shù)字的。
那么既然沖突了,就要在兩個(gè)邊界任意一端擴(kuò)充。那么是 128 還是 -128 呢?只能是 -128 。在這里,我們就已經(jīng)踏入計(jì)算機(jī)的知識邊界了,為什么只能是 -128 它是個(gè)數(shù)學(xué)問題,就好比為什么會設(shè)計(jì)出原碼、反碼、補(bǔ)碼一樣,我們是無法理解設(shè)計(jì)計(jì)算機(jī)的人為什么會這樣設(shè)計(jì)的。所以在這里只需記住,char 類型的取值范圍是 [-2^7,2^7-1] 。那么我們類比出來 short 類型的取值范圍是 [-2^15,2^15-1] , int 類型的取值范圍是 [-2^31,2^31-1] ……
我們來看一個(gè)非常經(jīng)典的例題:
#include <stdio.h> #include <string.h> int main() { char arr[1000]; for (int i = 0; i < 1000; i++) { arr[i] = -1 - i; } printf("%d\n", strlen(arr)); return 0; }
那么這道題要我們輸出 arr 數(shù)組的長度是什么意思呢?我們再好好想想 strlen 。strlen 是求字符串長度,我們模擬實(shí)現(xiàn)過 strlen 的工作機(jī)制,知道遇到 '\0' 時(shí)就停止,返回 '\0' 之前的字符長度。那么 '\0' 就是數(shù)學(xué)意義上的 0 。其 '\' 是轉(zhuǎn)義字符,如果僅僅寫 '0' 的話,那么這個(gè) '0' 并非數(shù)學(xué)意義上的 0 ,而是一個(gè)字符 0 。
好的,那我們知道這段代碼會循環(huán) 1000 次對數(shù)組賦值。實(shí)際上我們的輸出的要求是:輸出 '\0' 出現(xiàn)之前的字符長度。我們可以這么運(yùn)算:
我們通過計(jì)算,可以計(jì)算出當(dāng)數(shù)組下標(biāo)為 255 時(shí),元素存儲的是 0 ,即代表存儲的是 '\0' ,那么 strlen 碰到 '\0' 時(shí)就會停止。那么數(shù)組下標(biāo)為 255 ,那數(shù)組下標(biāo) 0~255 有 256 個(gè)元素,舍棄一個(gè) '\0' ,即剩下 255 個(gè)有效字符。所以最后輸出 255 。
到此這篇關(guān)于C語言深入探究sizeof與整型數(shù)據(jù)存儲及數(shù)據(jù)類型取值范圍的文章就介紹到這了,更多相關(guān)C語言sizeof內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
C++中一維數(shù)組與指針的關(guān)系詳細(xì)總結(jié)
以下是對C++中一維數(shù)組與指針的關(guān)系進(jìn)行了詳細(xì)的總結(jié)介紹,需要的朋友可以過來參考下2013-09-09