深入剖析C++中的struct結(jié)構(gòu)體字節(jié)對齊
什么是字節(jié)對齊,為什么要對齊?
現(xiàn)代計算機(jī)中內(nèi)存空間都是按照byte劃分的,從理論上講似乎對任何類型的變量的訪問可以從任何地址開始,但實際情況是在訪問特定類型變量的時候經(jīng)常在特 定的內(nèi)存地址訪問,這就需要各種類型數(shù)據(jù)按照一定的規(guī)則在空間上排列,而不是順序的一個接一個的排放,這就是對齊。
對齊的作用和原因:各個硬件平臺對存儲空間的處理上有很大的不同。一些平臺對某些特定類型的數(shù)據(jù)只能從某些特定地址開始存取。比如有些架構(gòu)的CPU在訪問一個沒有進(jìn)行對齊的變量的時候會發(fā)生錯誤,那么在這種架構(gòu)下編程必須保證字節(jié)對齊.其他平臺可能沒有這種情況,但是最常見的是如果不按照適合其平臺要求對數(shù)據(jù)存放進(jìn)行對齊,會在存取效率上帶來損失。比如有些平臺每次讀都是從偶地址開始,如果一個int型(假設(shè)為32位系統(tǒng))如果存放在偶地址開始的地方,那么一個讀周期就可以讀出這32bit,而如果存放在奇地址開始的地方,就需要2個讀周期,并對兩次讀出的結(jié)果的高低字節(jié)進(jìn)行拼湊才能得到該32bit數(shù)據(jù)。顯然在讀取效率上下降很多。
結(jié)構(gòu)的存儲分配
編譯器按照結(jié)構(gòu)體成員列表的順序為每個成員分配內(nèi)存,當(dāng)存儲成員時需要滿足正確地邊界對齊要求時,成員之間可能出現(xiàn)用于填充地額外內(nèi)存空間。32位系統(tǒng)每次分配字節(jié)數(shù)最多為4個字節(jié),64位系統(tǒng)分配字節(jié)數(shù)最多為8個字節(jié)。
以下圖表是在不同系統(tǒng)中基本類型數(shù)據(jù)內(nèi)存大小和默認(rèn)對齊模數(shù):
注:此外指針?biāo)純?nèi)存的長度由系統(tǒng)決定,在32位系統(tǒng)下為32位(即4個字節(jié)),64位系統(tǒng)下則為64位(即8個字節(jié)).
沒有#pragma pack宏的對齊
對齊規(guī)則:
結(jié)構(gòu)體的起始存儲位置必須是能夠被該結(jié)構(gòu)體中最大的數(shù)據(jù)類型所整除。
每個數(shù)據(jù)成員存儲的起始位置是自身大小的整數(shù)倍(比如int在32位機(jī)為4字節(jié),則int型成員要從4的整數(shù)倍地址開始存儲)。
結(jié)構(gòu)體總大?。ㄒ簿褪莝izeof的結(jié)果),必須是該結(jié)構(gòu)體成員中最大的對齊模數(shù)的整數(shù)倍。若不滿足,會根據(jù)需要自動填充空缺的字節(jié)。
結(jié)構(gòu)體包含另一個結(jié)構(gòu)體成員,則被包含的結(jié)構(gòu)體成員要從其原始結(jié)構(gòu)體內(nèi)部最大對齊模數(shù)的整數(shù)倍地址開始存儲。(比如struct a里存有struct b,b里有char,int,double等元素,那b應(yīng)該從8的整數(shù)倍開始存儲。)
結(jié)構(gòu)體包含數(shù)組成員,比如char a[3],它的對齊方式和分別寫3個char是一樣的,也就是說它還是按一個字節(jié)對齊。如果寫:typedef char Array[3],Array這種類型的對齊方式還是按一個字節(jié)對齊,而不是按它的長度3對齊。
結(jié)構(gòu)體包含共用體成員,則該共用體成員要從其原始共用體內(nèi)部最大對齊模數(shù)的整數(shù)倍地址開始存儲。
現(xiàn)在給出一個結(jié)構(gòu)體,我們針對win-32和Linux-32進(jìn)行分析,
例1:
struct MyStruct { char a; int b; long double c; };
解答:
win-32位系統(tǒng)下:
由上圖可知該結(jié)構(gòu)體的最大對齊模數(shù)為sizeof(long double)=8;假設(shè)MyStruct從地址空間0x0000開始存放。char為1個字節(jié),所以a存放于0x0000中;int為4個字節(jié),根據(jù)規(guī)則,b存儲的起始地址必須為其對齊模數(shù)4的整數(shù)倍,所以a后面自動填充空缺字節(jié)空間0x0001-0x0003,因此b存放于0x0004-0x0007中。long double是8個字節(jié),由于32位系統(tǒng)每次最多分配4個字節(jié),則首先分配0x0008-0x000B,由于不夠存儲空間,則繼續(xù)分配0x000C-0x000F,所以c存儲在0x0008-0x000F中,由于此時總存儲空間為4+4+8=16;則16滿足最大對齊模數(shù)sizeof(long double)=8的整數(shù)倍;因此,sizeof(MyStruct)=16個字節(jié)。
Linux-32位系統(tǒng)下:
由上圖可知該結(jié)構(gòu)體的最大對齊模數(shù)為4;假設(shè)MyStruct從地址空間0x0000開始存放。char為1個字節(jié),所以a存放于0x0000中;int為4個字節(jié),根據(jù)規(guī)則,b存儲的起始地址必須為其對齊模數(shù)4的整數(shù)倍,所以a后面自動填充空缺字節(jié)空間0x0001-0x0003,因此b存放于0x0004-0x0007中。long double是12個字節(jié),由于32位系統(tǒng)每次最多分配4個字節(jié),則首先分配0x0008-0x000B,由于不夠存儲空間,則繼續(xù)分配0x000C-0x000F,仍然不滿足存儲c,則繼續(xù)分配0x0010-0x0013,所以c存儲在0x0008-0x0013中,由于此時總存儲空間為4+4+12=20;則20滿足最大對齊模數(shù)4的整數(shù)倍;因此,sizeof(MyStruct)=20個字節(jié)。
注:以下的所有例子都是在win-32下實現(xiàn)
例2:
struct B{ char a; int b; char c; };
由上圖可知該結(jié)構(gòu)體的最大對齊模數(shù)為sizeof(int)=4;假設(shè)B從地址空間0x0000開始存放。char為1個字節(jié),所以a存放于0x0000中;int為4個字節(jié),根據(jù)規(guī)則,b存儲的起始地址必須為其對齊模數(shù)4的整數(shù)倍,所以a后面自動填充空缺字節(jié)空間0x0001-0x0003,因此b存放于0x0004-0x0007中。c也是char類型,所以c存放在0x0008中;此時結(jié)構(gòu)體B總的大小為4+4+1=9個字節(jié);則9不能滿足最大對齊模數(shù)4的整數(shù)倍;因此在c的后面自動填充空間0x0009-0x000B,使其滿足最大對齊模數(shù)的倍數(shù),最終結(jié)構(gòu)體B的存儲空間為0x0000-0x000B;則sizeof(B)=12個字節(jié)。
例3:空結(jié)構(gòu)體
struct C{ }; sizeof(C) = 0或sizeof(C);
C為空結(jié)構(gòu)體,在C語言中占0字節(jié),在C++中占1字節(jié)。
例4:結(jié)構(gòu)體有靜態(tài)成員
struct D{ char a; int b; static double c; //靜態(tài)成員 };
靜態(tài)成員變量存放在全局?jǐn)?shù)據(jù)區(qū)內(nèi),在編譯的時候已經(jīng)分配好內(nèi)存空間,所以對結(jié)構(gòu)體的總內(nèi)存大小不做任何貢獻(xiàn);因此,sizeof(D)=4+4=8個字節(jié)
例5:結(jié)構(gòu)體中包含結(jié)構(gòu)體
struct E{ int a; double b; float c; }; struct F{ char e[2]; int f; short h; struct E i; };
在結(jié)構(gòu)體E中最大對齊模數(shù)是sizeof(double)=8;且sizeof(E)=8+8+8=24個字節(jié);在結(jié)構(gòu)體F中,除了結(jié)構(gòu)體成員E之外,其他的最大對齊模數(shù)是sizeof(int)=4;又因為結(jié)構(gòu)體E中最大對齊模數(shù)是sizeof(double)=8;所以結(jié)構(gòu)體F的最大對齊模數(shù)取E的最大對齊模數(shù)8;因此,sizeof(F)=4+4+8+24=40個字節(jié)。
例6:結(jié)構(gòu)體包含共用體
union union1 { long a; double b; char name[9]; int c[2]; }; struct E{ int a; double b; float c; union1 MyUnion; };
共用體中的最大對齊模式是sizeof(double)=8;則sizeof(union1)=16;結(jié)構(gòu)體E的最大對齊模數(shù)也是8;則sizeof(E)=8+8+8+16=40個字節(jié)。
例7:結(jié)構(gòu)體包含指針成員
typedef struct A{ char a; int b; float c; double d; int *p; char *pc; short e; }A;
結(jié)構(gòu)體包含的指針成員的大小根據(jù)系統(tǒng)類型決定,由于這里是在win-32位系統(tǒng)下分析,則指針大小為4個字節(jié);因此,結(jié)構(gòu)體A的最大對齊模數(shù)為sizeof(double)=8;則sizeof(A)=4+4+8+8+4+4+8=40個字節(jié)。
存在#pragma pack宏的對齊
#pragma pack (n) //編譯器將按照n個字節(jié)對齊 #pragma pack () //取消自定義字節(jié)對齊方式
對齊規(guī)則:
結(jié)構(gòu),聯(lián)合,或者類的數(shù)據(jù)成員,第一個放在偏移為0的地方,以后每個數(shù)據(jù)成員的對齊,按照#pragma pack指定的數(shù)值和自身對齊模數(shù)中較小的那個。
例8:按指定的對齊模數(shù)
#pragma pack (2) /*指定按2字節(jié)對齊*/ struct G{ char b; int a; double d; short c; }; #pragma pack () /*取消指定對齊,恢復(fù)缺省對齊*/
在結(jié)構(gòu)體G中成員變量的最大對齊模數(shù)是sizeof(double)=8;又因為指定對齊模數(shù)是2;所以取其較小者2為結(jié)構(gòu)體G的最大對齊模數(shù);則sizeof(G)=2+4+8+2=16;由于16是2的整數(shù)倍,則不需要填充。
總結(jié)
在分析結(jié)構(gòu)體字節(jié)對齊時,首先確定有沒有利用#pragma pack()宏定義指定對齊模數(shù);根據(jù)情況對應(yīng)上面進(jìn)行兩種情況分析,針對不同的系統(tǒng)會得到不同的結(jié)果。
補充:
在Visual C++下可以用__declspec(align(#))聲明數(shù)據(jù)按#字節(jié)對齊
GUN C下可以使用以下命令:
__attribute__((aligned (n))),讓所作用的結(jié)構(gòu)成員對齊在n字節(jié)自然邊界上。如果結(jié)構(gòu)中有成員的長度大于n,則按照最大成員的長度來對齊
__attribute__((__packed__)),取消結(jié)構(gòu)在編譯過程中的優(yōu)化對齊,按照實際占用字節(jié)數(shù)進(jìn)行對齊。
C++11新加關(guān)鍵字alignas(n)
相關(guān)文章
c語言之char*和unsigned?char*的區(qū)別及說明
這篇文章主要介紹了c語言之char*和unsigned?char*的區(qū)別及說明,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2023-08-08在c和c++中實現(xiàn)函數(shù)回調(diào)
如何在c和c++中實現(xiàn)函數(shù)回調(diào)呢?現(xiàn)在小編就和大家分享一下在c/c++中實現(xiàn)函數(shù)回調(diào)的示例代碼,需要的朋友可以參考下2013-07-07C語言sizeof和strlen的指針和數(shù)組面試題詳解
strlen是函數(shù),字符串長度,不包括停止符。而sizeof則是內(nèi)存塊的大小,包括停止符。數(shù)組是一種數(shù)據(jù)類型,數(shù)據(jù)類型的本質(zhì)就是固定大小,內(nèi)存塊的別名。可以用sizeof()一般都是數(shù)據(jù)類型2022-04-04使用代碼驗證linux子進(jìn)程與父進(jìn)程的關(guān)系
Linux下父進(jìn)程可以使用fork 函數(shù)創(chuàng)建子進(jìn)程,但是當(dāng)父進(jìn)程先退出后,子進(jìn)程會不會也退出呢?通過下面這個小實驗,我們能夠很好的看出來2014-02-02C語言與java語言中關(guān)于二維數(shù)組的區(qū)別
這篇文章主要介紹了C語言與java語言中關(guān)于二維數(shù)組的區(qū)別,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-08-08