C語言中數(shù)據(jù)的存儲詳解
類型的基本歸類
整形家族:
char unsigned char signed char short unsigned short [int] signed short [int] int unsigned int signed int long unsigned long [int] signed long [int]
補(bǔ)充:
char
是 signed char
還是 unsigned char
,C語言標(biāo)準(zhǔn)并沒有規(guī)定,取決于編譯器。
int
是s igne int
, short
是 signed short
。
浮點數(shù)家族:
float double
構(gòu)造類型:
> 數(shù)組類型 > 結(jié)構(gòu)體類型 struct > 枚舉類型 enum > 聯(lián)合類型 union
空類型:
void
表示空類型(無類型),通常應(yīng)用于函數(shù)的返回類型、函數(shù)的參數(shù)、指針類型。
整形在內(nèi)存中的存儲
一個變量的創(chuàng)建是要在內(nèi)存中開辟空間的??臻g的大小是根據(jù)不同的類型而決定的。
int a = 20; int b = -10;
該段代碼為 a 分配四個字節(jié)的空間。那如何存儲?
原碼、反碼、補(bǔ)碼
計算機(jī)中的整數(shù)有三種2進(jìn)制表示方法,即原碼、反碼和補(bǔ)碼。三種表示方法均有符號位和數(shù)值位兩部分,符號位都是用0表示“正”,用1表示“負(fù)”,而數(shù)值位正數(shù)的原、反、補(bǔ)碼都相同。
負(fù)整數(shù)的三種表示方法各不相同。
原碼:直接將數(shù)值按照正負(fù)數(shù)的形式翻譯成二進(jìn)制就可以得到原碼。
反碼:將原碼的符號位不變,其他位依次按位取反就可以得到反碼。
補(bǔ)碼:反碼+1就得到補(bǔ)碼。
對于整形來說:數(shù)據(jù)存放內(nèi)存中其實存放的是補(bǔ)碼。
在計算機(jī)系統(tǒng)中,數(shù)值一律用補(bǔ)碼來表示和存儲。原因在于,使用補(bǔ)碼,可以將符號位和數(shù)值域統(tǒng)一處理;同時,加法和減法也可以統(tǒng)一處理(CPU只有加法器)此外,補(bǔ)碼與原碼相互轉(zhuǎn)換,其運(yùn)算過程是相同的,不需要額外的硬件電路。
在內(nèi)存中的存儲:
可以看到對于a和b分別存儲的是補(bǔ)碼。但是我們發(fā)現(xiàn)順序有點不對勁。這是又為什么?
大小端介紹
什么大端小端:大端(存儲)模式,是指數(shù)據(jù)的低位保存在內(nèi)存的高地址中,而數(shù)據(jù)的高位,保存在內(nèi)存的低地址中;小端(存儲)模式,是指數(shù)據(jù)的低位保存在內(nèi)存的低地址中,而數(shù)據(jù)的高位,,保存在內(nèi)存的高地址中。
為什么有大端和小端:
為什么會有大小端模式之分呢?這是因為在計算機(jī)系統(tǒng)中,我們是以字節(jié)為單位的,每個地址單元都對應(yīng)著一個字節(jié),一個字節(jié)為8 bit。但是在C語言中除了8 bit的char之外,還有16 bit的short型,32 bit的long型(要看具體的編譯器),另外,對于位數(shù)大于8位的處理器,例如16位或者32位的處理器,由于寄存器寬度大于一個字節(jié),那么必然存在著一個如何將多個字節(jié)安排的問題。因此就導(dǎo)致了大端存儲模式和小端存儲模式。例如:一個 16bit 的 short 型 x ,在內(nèi)存中的地址為 0x0010 , x 的值為 0x1122 ,那么 0x11 為高字節(jié), 0x22 為低字節(jié)。對于大端模式,就將 0x11 放在低地址中,即 0x0010 中, 0x22 放在高地址中,即 0x0011 中。小端模式,剛好相反。我們常用的 X86 結(jié)構(gòu)是小端模式,而 KEIL C51 則為大端模式。很多的ARM,DSP都為小端模式。有些ARM處理器還可以由硬件來選擇是大端模式還是小端模式。
百度2015年系統(tǒng)工程師筆試題:
請簡述大端字節(jié)序和小端字節(jié)序的概念,設(shè)計一個小程序來判斷當(dāng)前機(jī)器的字節(jié)序。
//代碼1 #include <stdio.h> int check_sys() { int i = 1; return (*(char *)&i); } int main() { int ret = check_sys(); if(ret == 1) { printf("小端\n"); } else { printf("大端\n"); } return 0; } //代碼2 int check_sys() { union { int i; char c; }un; un.i = 1; return un.c; }
練習(xí)
下面程序輸出什么?(答案在后面)
1. #include <stdio.h> int main() { char a= -1; signed char b=-1; unsigned char c=-1; printf("a=%d,b=%d,c=%d",a,b,c); return 0; }
2. #include <stdio.h> int main() { char a = -128; printf("%u\n",a); return 0; }
3. #include <stdio.h> int main() { char a = 128; printf("%u\n",a); return 0; }
4. int i= -20; unsigned int j = 10; printf("%d\n", i+j); //按照補(bǔ)碼的形式進(jìn)行運(yùn)算,最后格式化成為有符號整數(shù)
5. unsigned int i; for(i = 9; i >= 0; i--) { printf("%u\n",i); }
6. int main() { char a[1000]; int i; for(i=0; i<1000; i++) { a[i] = -1-i; } printf("%d",strlen(a)); return 0; }
7. #include <stdio.h> unsigned char i = 0; int main() { for(i = 0;i<=255;i++) { printf("hello world\n"); } return 0; }
浮點型在內(nèi)存中的存儲
常見的浮點數(shù): 3.14159
, 1E10
浮點數(shù)家族包括: float、double、long double 類型。浮點數(shù)表示的范圍: float.h
中定義
浮點數(shù)存儲的例子
int main() { int n = 9; float *pFloat = (float *)&n; printf("n的值為:%d\n",n); printf("*pFloat的值為:%f\n",*pFloat); *pFloat = 9.0; printf("num的值為:%d\n",n); printf("*pFloat的值為:%f\n",*pFloat); return 0; }
輸出的結(jié)果:
浮點數(shù)存儲規(guī)則
num
和 *pFloat
在內(nèi)存中明明是同一個數(shù),為什么浮點數(shù)和整數(shù)的解讀結(jié)果會差別這么大?要理解這個結(jié)果,一定要搞懂浮點數(shù)在計算機(jī)內(nèi)部的表示方法。詳細(xì)解讀:
根據(jù)國際標(biāo)準(zhǔn)IEEE(電氣和電子工程協(xié)會) 754,任意一個二進(jìn)制浮點數(shù)V可以表示成下面的形式:(-1)^S * M * 2^E(-1)^S表示符號位,當(dāng)S=0,V為正數(shù);當(dāng)S=1,V為負(fù)數(shù)。M表示有效數(shù)字,大于等于1,小于2。2^E表示指數(shù)位。
舉例來說:十進(jìn)制的5.0,寫成二進(jìn)制是 101.0 ,相當(dāng)于 1.01×2^2 。那么,按照上面V的格式,可以得出S=0,M=1.01,E=2。十進(jìn)制的-5.0,寫成二進(jìn)制是 -101.0 ,相當(dāng)于 -1.01×2^2 。那么,S=1,M=1.01,E=2。IEEE 754規(guī)定:對于32位的浮點數(shù),最高的1位是符號位S,接著的8位是指數(shù)E,剩下的23位為有效數(shù)字M。
對于64位的浮點數(shù),最高的1位是符號位S,接著的11位是指數(shù)E,剩下的52位為有效數(shù)字M。
IEEE 754對有效數(shù)字M和指數(shù)E,還有一些特別規(guī)定。前面說過, 1≤M<2 ,也就是說,M可以寫成 1.xxxxxx 的形式,其中xxxxxx表示小數(shù)部分。IEEE 754規(guī)定,在計算機(jī)內(nèi)部保存M時,默認(rèn)這個數(shù)的第一位總是1,因此可以被舍去,只保存后面的xxxxxx部分。比如保存1.01的時候,只保存01,等到讀取的時候,再把第一位的1加上去。這樣做的目的,是節(jié)省1位有效數(shù)字。以32位浮點數(shù)為例,留給M只有23位,將第一位的1舍去以后,等于可以保存24位有效數(shù)字。
至于指數(shù)E,情況就比較復(fù)雜。首先,E為一個無符號整數(shù)(unsigned int)這意味著,如果E為8位,它的取值范圍為0255;如果E為11位,它的取值范圍為02047。但是,我們知道,科學(xué)計數(shù)法中的E是可以出現(xiàn)負(fù)數(shù)的,所以IEEE 754規(guī)定,存入內(nèi)存時E的真實值必須再加上一個中間數(shù),對于8位的E,這個中間數(shù)是127;對于11位的E,這個中間數(shù)是1023。比如,2^10的E是10,所以保存成32位浮點數(shù)時,必須保存成10+127=137,即10001001。
然后,指數(shù)E從內(nèi)存中取出還可以再分成三種情況:E不全為0或不全為1這時,浮點數(shù)就采用下面的規(guī)則表示,即指數(shù)E的計算值減去127(或1023),得到真實值,再將有效數(shù)字M前加上第一位的1。比如:0.5(1/2)的二進(jìn)制形式為0.1,由于規(guī)定正數(shù)部分必須為1,即將小數(shù)點右移1位,則為1.0*2^(-1),其階碼為-1+127=126,表示為01111110,而尾數(shù)1.0去掉整數(shù)部分為0,補(bǔ)齊0到23位00000000000000000000000,則其二進(jìn)制表示形式為:
0 01111110 00000000000000000000000
E全為0這時,浮點數(shù)的指數(shù)E等于1-127(或者1-1023)即為真實值,有效數(shù)字M不再加上第一位的1,而是還原為0.xxxxxx的小數(shù)。這樣做是為了表示±0,以及接近于0的很小的數(shù)字。E全為1這時,如果有效數(shù)字M全為0,表示±無窮大(正負(fù)取決于符號位s);好了,關(guān)于浮點數(shù)的表示規(guī)則,就說到這里。
解釋前面的題目:下面,讓我們回到一開始的問題:為什么 0x00000009 還原成浮點數(shù),就成了 0.000000 ?首先,將 0x00000009 拆分,得到第一位符號位s=0,后面8位的指數(shù) E=00000000 ,最后23位的有效數(shù)字M=000 0000 0000 0000 0000 1001。
9 -> 0000 0000 0000 0000 0000 0000 0000 1001
由于指數(shù)E全為0,所以符合上一節(jié)的第二種情況。因此,浮點數(shù)V就寫成: V=(-1)^0 × 0.00000000000000000001001×2^(-126)=1.001×2^(-146)
顯然,V是一個很小的接近于0的正數(shù),所以用十進(jìn)制小數(shù)表示就是0.000000。再看例題的第二部分。請問浮點數(shù)9.0,如何用二進(jìn)制表示?還原成十進(jìn)制又是多少?首先,浮點數(shù)9.0等于二進(jìn)制的1001.0,即1.001×2^3。
那么,第一位的符號位s=0,有效數(shù)字M等于001后面再加20個0,湊滿23位,指數(shù)E等于3+127=130,即10000010。所以,寫成二進(jìn)制形式,應(yīng)該是s+E+M,即
0 10000010 001 0000 0000 0000 0000 0000
這個32位的二進(jìn)制數(shù),還原成十進(jìn)制,正是 1091567616
。
到此這篇關(guān)于C語言中數(shù)據(jù)的存儲詳解的文章就介紹到這了,更多相關(guān)C語言數(shù)據(jù)的存儲內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
C++下如何將TensorFlow模型封裝成DLL供C#調(diào)用
這篇文章主要介紹了C++下如何將TensorFlow模型封裝成DLL供C#調(diào)用問題,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-11-11C語言匯編分析傳遞結(jié)構(gòu)體指針比傳遞結(jié)構(gòu)體變量高效的深層原因
本文章使用的工具是vs2010,本篇文章主要講解結(jié)構(gòu)體指針作為參數(shù)傳遞與結(jié)構(gòu)體變量作為參數(shù)傳遞的對比,不談值傳遞與址傳遞的概念2022-10-10C++編程中__if_exists與__if_not_exists語句的用法
這篇文章主要介紹了C++編程中__if_exists與__if_not_exists語句的用法,是C++中用于判斷指定的標(biāo)識符是否存在的基礎(chǔ)的條件判斷語句,需要的朋友可以參考下2016-01-01C++友元函數(shù)與拷貝構(gòu)造函數(shù)詳解
這篇文章主要介紹了C++友元函數(shù)與拷貝構(gòu)造函數(shù),需要的朋友可以參考下2014-07-07好用的C++ string Format“函數(shù)”介紹
大家好,本篇文章主要講的是好用的C++ string Format“函數(shù)”介紹,感興趣的同學(xué)趕快來看一看吧,對你有幫助的話記得收藏一下,方便下次瀏覽2021-12-12