快捷導(dǎo)航

C語言深入探究sizeof與整型數(shù)據(jù)存儲及數(shù)據(jù)類型取值范圍

更新時間：2022年07月07日 09:13:28 作者：龍兆萬

在main函數(shù)中，sizeof是可以正常工作的，但是在自定義函數(shù)中就不可以了。所以本文將為大家詳細(xì)講解一下關(guān)鍵字sizeof、整型數(shù)據(jù)存儲深入、數(shù)據(jù)類型取值范圍深入

1.關(guān)鍵字sizeof

sizeof 與 strlen 是我們?nèi)粘４虼a時經(jīng)常使用到的兩個“工具”。前者是求變量或者類型的大小(單位為字節(jié))，后者是求某一字符串的長度。我們很容易產(chǎn)生這樣一個誤解，即把 sizeof 和 strlen 歸為函數(shù)一類。事實上 sizeof 并不是一個函數(shù)，它是一個操作符、關(guān)鍵字。我們通過一段代碼證明它不是函數(shù)：

#include <stdio.h>
int main()
{
	int n = 20;
	printf("%d\n", sizeof(n));
	printf("%d\n", sizeof(int));
	printf("%d\n", sizeof n);
	return 0;
}

我們注意到紅線部分的 sizeof 后面的變量名沒有加括號也能正常運行：

這就證明了 sizeof 它不是一個函數(shù)，而是一個操作符、關(guān)鍵字。

在這里順便復(fù)習(xí)一下關(guān)于數(shù)組的知識，即數(shù)組名的兩個特例(除了這兩種情況其他任何時候數(shù)組名都表示數(shù)組首元素地址)：

sizeof 內(nèi)單獨放數(shù)組名，其數(shù)組名表整個數(shù)組。
& 數(shù)組名，表取整個數(shù)組的地址。

由此也可以看出 sizeof 與函數(shù)的區(qū)別。

2.整型數(shù)據(jù)存儲深入

變量的作用是在內(nèi)存中開辟一塊空間，而類型則決定了這塊空間有多大。

我們可以與 sizeof 結(jié)合起來驗證這個問題：

#include <stdio.h>
int main()
{
	printf("%d\n", sizeof(char));
	printf("%d\n", sizeof(short));
	printf("%d\n", sizeof(int));
	printf("%d\n", sizeof(long));
	printf("%d\n", sizeof(long long));
	return 0;
}

我們知道，計算機只能識別二進制，恰恰計算機系統(tǒng)又能把我們?nèi)祟愂炀毷褂玫氖M制轉(zhuǎn)換成二進制，并且產(chǎn)生相應(yīng)的原碼、反碼、補碼。設(shè)計計算機的人設(shè)計出這樣一套規(guī)則是非常巧妙的。

我們引出原碼、反碼、補碼如何計算以及他們之間如何轉(zhuǎn)換：

原碼：將數(shù)字直接翻譯成二進制得到的序列。
反碼：在原碼的基礎(chǔ)上符號位(二進制序列的最高位，1表負(fù)數(shù)，0表負(fù)數(shù))不變，替他位按位取反得到的序列。
補碼：在反碼的基礎(chǔ)上加1。
補碼計算回原碼方法一：補碼減1，然后符號位不變，其他位按位取反得到原碼。
補碼計算回原碼方法二：補碼符號位不變，其他位按位取反，然后加1。此方法與原碼計算補碼的方式是一樣的，這樣做的意義在于 CPU 進行數(shù)據(jù)處理時，只要設(shè)計一套計算方法就可以完成原碼、反碼、補碼之間的相互轉(zhuǎn)換。

那么具體的例子，在數(shù)據(jù)的存儲——整形篇有講到，這里就不贅述。

我們需要明白的是：數(shù)據(jù)存儲到變量當(dāng)中，不會受到類型的影響。什么意思呢？我們舉個例子：

#include <stdio.h>
int main()
{
	unsigned int p = -10;
	return 0;
}

大家可以看到，我把一個負(fù)數(shù)存入到無符號的整型變量 p 中，這有些違反我們的直覺，無符號類型不是不存在負(fù)數(shù)的概念嗎？事實上，不是程序出錯，而是我們的直覺有問題。

我們在一開頭便闡述了變量的作用在內(nèi)存中開辟一塊空間，而類型便是決定開辟多大的空間。就好比說，我們有 100 ，放在了我的荷包里，那我們能說我有 100 塊嗎？就算是錢，我們定義它是美元、港幣、日元了嗎？所以，我們可以把變量看成 100 ，類型看成是美元、港幣、日元等等。

到這里，我們就可以清楚，數(shù)據(jù)的存儲與變量的類型是沒有關(guān)系的，變量的作用僅僅是開辟一塊空間讓我們的數(shù)據(jù)存儲進去。聊到這里，不妨讓我們再回顧一下，整型數(shù)據(jù)是如何存放在變量(內(nèi)存)里面的。我們就以上面那段代碼為例：

這里再提一嘴：雖然內(nèi)存中存放的是二進制序列，但為了我們方便，內(nèi)存還是會以十六進制的表現(xiàn)形式表現(xiàn)出來。

我們試探性往內(nèi)存里面看 p 變量里面存的是什么東西：

可以發(fā)現(xiàn)，內(nèi)存里面的各種數(shù)據(jù)都對上了我們分析的結(jié)果，但是看起來有點“怪”。我們就來分析“怪”在哪里：

我們知道 int 類型是有 4 個字節(jié)的，那么數(shù)據(jù)占了 4 個字節(jié)沒有問題。那么如果是以 1 列的形式查看地址，可以看到從上到下的地址是遞增的。

現(xiàn)在我們以 4 列的形式查看地址，可以看到從左往右地址遞增，從上往下地址遞增。

得出一個現(xiàn)象：f6 存在了我們的低地址處。

我們似乎可以這樣做推導(dǎo)：

這樣的存儲模式我們叫做小端存儲。為什么這樣的模式叫做小端存儲？我們使用這個案例來類比：

所以我們得出結(jié)論，小端與大端的存儲模式可以定義為：

權(quán)重小的數(shù)位放入內(nèi)存中的低地址處，權(quán)重大的放入內(nèi)存中的高地址處，這樣的存儲模式叫小端存儲。
權(quán)重小的數(shù)位放入內(nèi)存中的高地址處，權(quán)重小的放入內(nèi)存中的低地址處，這樣的存儲模式叫大端存儲。

為什么會有這種看似復(fù)雜的存儲模式？我們可以舉一個例子：我們大家都吃過雞蛋，有些人剝殼喜歡往小的那一頭剝，有的人喜歡往大的那一頭剝，也就是“剝雞蛋”這個動作，沒有統(tǒng)一的行為概念。硬件制作廠商也不例外，有的廠商想讓數(shù)據(jù)的存儲行為是小端，也有的廠商想讓數(shù)據(jù)以大端的模式進行存儲，只不過我們平時所接觸的硬件，都是以小端模式存儲字節(jié)序的。

我們討論了數(shù)據(jù)的存儲，現(xiàn)在我們來討論一下數(shù)據(jù)的“取出”規(guī)則。

好比說我們舉這個例子：

#include <stdio.h>
int main()
{
	unsigned int p = -10;
	printf("%u\n", p);
	printf("%d\n", p);
	return 0;
}

我們可以看到，對于 -10 存儲在內(nèi)存當(dāng)中，我們第一次使用 %u 的形式將它從內(nèi)存里拿出來，第二次使用 %d 的形式將它從內(nèi)存中拿出來。

我們可以看到，對于不同類型的使用方式就會造成不同的結(jié)果。我們似乎可以這樣斷定：數(shù)據(jù)類型不會影響數(shù)據(jù)的存儲，但一定會影響數(shù)據(jù)的取出(使用)。我們來分析一下為什么使用不同的類型打印能造成不同的結(jié)果：

所以我們再總結(jié)一次：變量的數(shù)據(jù)類型不會對數(shù)據(jù)的存儲產(chǎn)生影響(截斷也不能算成是一種影響)，但數(shù)據(jù)類型一定會影響數(shù)據(jù)的取出、使用。

3.數(shù)據(jù)類型取值范圍深入

什么叫數(shù)據(jù)類型的取值范圍？好比說我們有這樣一個例子：

那么我們?nèi)?C 語言中大小最小的數(shù)據(jù)類型 char 來討論數(shù)據(jù)類型的取值范圍。

我們知道，char 類型只有 1 個字節(jié)，它有 8 個比特位。無符號類型的 char 我們就不做討論，我們重點討論無符號類型的 char 。那么 8 個比特位，能有多少種排列組合？能從什么值取到什么值？

那么通過演繹推理，得出來排列組合得個數(shù)，有什么意義呢？可以確定八個比特位能存放多少個數(shù)字。例如兩個比特位能存放 4 個數(shù)字，三個比特位能存放 8 個數(shù)字，八個比特位能存放 256 個數(shù)字。

現(xiàn)在我們的重點在于：char 類型的八個比特位，能存哪 256 個數(shù)字？

可以看到這個結(jié)果，取值范圍似乎是 [-127,127] ，但是這個區(qū)間里面只有 255 個數(shù)，那我們理論推導(dǎo)出來的結(jié)果是 256 個數(shù)，是我們推導(dǎo)錯了嗎？其實不然，我們應(yīng)該注意 1000 0000 后面的那個問號：如果這串二進制序列真表示 0 了，那么就有兩個 0 了，但是在計算機在考慮取值范圍的時候，是不會浪費任何一個比特位來存放相同的數(shù)字的。

那么既然沖突了，就要在兩個邊界任意一端擴充。那么是 128 還是 -128 呢？只能是 -128 。在這里，我們就已經(jīng)踏入計算機的知識邊界了，為什么只能是 -128 它是個數(shù)學(xué)問題，就好比為什么會設(shè)計出原碼、反碼、補碼一樣，我們是無法理解設(shè)計計算機的人為什么會這樣設(shè)計的。所以在這里只需記住，char 類型的取值范圍是 [-2^7,2^7-1] 。那么我們類比出來 short 類型的取值范圍是 [-2^15,2^15-1] , int 類型的取值范圍是 [-2^31,2^31-1] ……

我們來看一個非常經(jīng)典的例題：

#include <stdio.h>
#include <string.h>
int main()
{
	char arr[1000];
	for (int i = 0; i < 1000; i++)
	{
		arr[i] = -1 - i;
	}
	printf("%d\n", strlen(arr));
	return 0;
}

那么這道題要我們輸出 arr 數(shù)組的長度是什么意思呢？我們再好好想想 strlen 。strlen 是求字符串長度，我們模擬實現(xiàn)過 strlen 的工作機制，知道遇到 '\0' 時就停止，返回 '\0' 之前的字符長度。那么 '\0' 就是數(shù)學(xué)意義上的 0 。其 '\' 是轉(zhuǎn)義字符，如果僅僅寫 '0' 的話，那么這個 '0' 并非數(shù)學(xué)意義上的 0 ，而是一個字符 0 。

好的，那我們知道這段代碼會循環(huán) 1000 次對數(shù)組賦值。實際上我們的輸出的要求是：輸出 '\0' 出現(xiàn)之前的字符長度。我們可以這么運算：

我們通過計算，可以計算出當(dāng)數(shù)組下標(biāo)為 255 時，元素存儲的是 0 ，即代表存儲的是 '\0' ，那么 strlen 碰到 '\0' 時就會停止。那么數(shù)組下標(biāo)為 255 ，那數(shù)組下標(biāo) 0~255 有 256 個元素，舍棄一個 '\0' ，即剩下 255 個有效字符。所以最后輸出 255 。