快捷導(dǎo)航

深入剖析C++中的struct結(jié)構(gòu)體字節(jié)對齊

更新時間：2016年05月18日 17:13:45 作者：drybeans

要求數(shù)據(jù)內(nèi)存的起始地址的值是某個數(shù)k的倍數(shù),這就是所謂的內(nèi)存對齊,本文就來深入剖析C++中的struct結(jié)構(gòu)體字節(jié)對齊,需要的朋友可以參考下

什么是字節(jié)對齊,為什么要對齊?

現(xiàn)代計算機中內(nèi)存空間都是按照byte劃分的，從理論上講似乎對任何類型的變量的訪問可以從任何地址開始，但實際情況是在訪問特定類型變量的時候經(jīng)常在特定的內(nèi)存地址訪問，這就需要各種類型數(shù)據(jù)按照一定的規(guī)則在空間上排列，而不是順序的一個接一個的排放，這就是對齊。

對齊的作用和原因：各個硬件平臺對存儲空間的處理上有很大的不同。一些平臺對某些特定類型的數(shù)據(jù)只能從某些特定地址開始存取。比如有些架構(gòu)的CPU在訪問一個沒有進行對齊的變量的時候會發(fā)生錯誤,那么在這種架構(gòu)下編程必須保證字節(jié)對齊.其他平臺可能沒有這種情況，但是最常見的是如果不按照適合其平臺要求對數(shù)據(jù)存放進行對齊，會在存取效率上帶來損失。比如有些平臺每次讀都是從偶地址開始，如果一個int型（假設(shè)為32位系統(tǒng)）如果存放在偶地址開始的地方，那么一個讀周期就可以讀出這32bit，而如果存放在奇地址開始的地方，就需要2個讀周期，并對兩次讀出的結(jié)果的高低字節(jié)進行拼湊才能得到該32bit數(shù)據(jù)。顯然在讀取效率上下降很多。

結(jié)構(gòu)的存儲分配
編譯器按照結(jié)構(gòu)體成員列表的順序為每個成員分配內(nèi)存，當(dāng)存儲成員時需要滿足正確地邊界對齊要求時，成員之間可能出現(xiàn)用于填充地額外內(nèi)存空間。32位系統(tǒng)每次分配字節(jié)數(shù)最多為4個字節(jié),64位系統(tǒng)分配字節(jié)數(shù)最多為8個字節(jié)。
以下圖表是在不同系統(tǒng)中基本類型數(shù)據(jù)內(nèi)存大小和默認對齊模數(shù):
注：此外指針?biāo)純?nèi)存的長度由系統(tǒng)決定，在32位系統(tǒng)下為32位（即4個字節(jié)），64位系統(tǒng)下則為64位（即8個字節(jié)）.

2016518170752299.png (675×267)

沒有#pragma pack宏的對齊
對齊規(guī)則:

結(jié)構(gòu)體的起始存儲位置必須是能夠被該結(jié)構(gòu)體中最大的數(shù)據(jù)類型所整除。
每個數(shù)據(jù)成員存儲的起始位置是自身大小的整數(shù)倍(比如int在32位機為4字節(jié)，則int型成員要從4的整數(shù)倍地址開始存儲)。
結(jié)構(gòu)體總大?。ㄒ簿褪莝izeof的結(jié)果），必須是該結(jié)構(gòu)體成員中最大的對齊模數(shù)的整數(shù)倍。若不滿足，會根據(jù)需要自動填充空缺的字節(jié)。
結(jié)構(gòu)體包含另一個結(jié)構(gòu)體成員，則被包含的結(jié)構(gòu)體成員要從其原始結(jié)構(gòu)體內(nèi)部最大對齊模數(shù)的整數(shù)倍地址開始存儲。(比如struct a里存有struct b，b里有char,int,double等元素,那b應(yīng)該從8的整數(shù)倍開始存儲。)
結(jié)構(gòu)體包含數(shù)組成員，比如char a[3],它的對齊方式和分別寫3個char是一樣的，也就是說它還是按一個字節(jié)對齊。如果寫：typedef char Array[3],Array這種類型的對齊方式還是按一個字節(jié)對齊，而不是按它的長度3對齊。
結(jié)構(gòu)體包含共用體成員，則該共用體成員要從其原始共用體內(nèi)部最大對齊模數(shù)的整數(shù)倍地址開始存儲。
現(xiàn)在給出一個結(jié)構(gòu)體，我們針對win-32和Linux-32進行分析,

例1：

struct MyStruct
{
  char a;
  int b;
  long double c;
};

解答：
win-32位系統(tǒng)下：
由上圖可知該結(jié)構(gòu)體的最大對齊模數(shù)為sizeof(long double)=8；假設(shè)MyStruct從地址空間0x0000開始存放。char為1個字節(jié)，所以a存放于0x0000中；int為4個字節(jié)，根據(jù)規(guī)則，b存儲的起始地址必須為其對齊模數(shù)4的整數(shù)倍，所以a后面自動填充空缺字節(jié)空間0x0001-0x0003，因此b存放于0x0004-0x0007中。long double是8個字節(jié)，由于32位系統(tǒng)每次最多分配4個字節(jié)，則首先分配0x0008-0x000B，由于不夠存儲空間，則繼續(xù)分配0x000C-0x000F,所以c存儲在0x0008-0x000F中，由于此時總存儲空間為4+4+8=16；則16滿足最大對齊模數(shù)sizeof(long double)=8的整數(shù)倍；因此，sizeof(MyStruct)=16個字節(jié)。
Linux-32位系統(tǒng)下：

由上圖可知該結(jié)構(gòu)體的最大對齊模數(shù)為4；假設(shè)MyStruct從地址空間0x0000開始存放。char為1個字節(jié)，所以a存放于0x0000中；int為4個字節(jié)，根據(jù)規(guī)則，b存儲的起始地址必須為其對齊模數(shù)4的整數(shù)倍，所以a后面自動填充空缺字節(jié)空間0x0001-0x0003，因此b存放于0x0004-0x0007中。long double是12個字節(jié)，由于32位系統(tǒng)每次最多分配4個字節(jié)，則首先分配0x0008-0x000B，由于不夠存儲空間，則繼續(xù)分配0x000C-0x000F,仍然不滿足存儲c，則繼續(xù)分配0x0010-0x0013，所以c存儲在0x0008-0x0013中，由于此時總存儲空間為4+4+12=20；則20滿足最大對齊模數(shù)4的整數(shù)倍；因此，sizeof(MyStruct)=20個字節(jié)。

注：以下的所有例子都是在win-32下實現(xiàn)
例2：

struct B{ 
  char a; 
  int b; 
  char c; 
};

由上圖可知該結(jié)構(gòu)體的最大對齊模數(shù)為sizeof(int)=4；假設(shè)B從地址空間0x0000開始存放。char為1個字節(jié)，所以a存放于0x0000中；int為4個字節(jié)，根據(jù)規(guī)則，b存儲的起始地址必須為其對齊模數(shù)4的整數(shù)倍，所以a后面自動填充空缺字節(jié)空間0x0001-0x0003，因此b存放于0x0004-0x0007中。c也是char類型，所以c存放在0x0008中；此時結(jié)構(gòu)體B總的大小為4+4+1=9個字節(jié)；則9不能滿足最大對齊模數(shù)4的整數(shù)倍；因此在c的后面自動填充空間0x0009-0x000B，使其滿足最大對齊模數(shù)的倍數(shù)，最終結(jié)構(gòu)體B的存儲空間為0x0000-0x000B；則sizeof(B)=12個字節(jié)。
例3：空結(jié)構(gòu)體

struct C{ 
  };
sizeof(C) = 0或sizeof(C);

C為空結(jié)構(gòu)體，在C語言中占0字節(jié)，在C++中占1字節(jié)。

例4：結(jié)構(gòu)體有靜態(tài)成員

struct D{ 
   char a; 
   int b; 
   static double c; //靜態(tài)成員 
};

靜態(tài)成員變量存放在全局數(shù)據(jù)區(qū)內(nèi)，在編譯的時候已經(jīng)分配好內(nèi)存空間，所以對結(jié)構(gòu)體的總內(nèi)存大小不做任何貢獻；因此，sizeof(D)=4+4=8個字節(jié)
例5：結(jié)構(gòu)體中包含結(jié)構(gòu)體

struct E{ 
  int a; 
  double b; 
  float c; 
}; 
struct F{ 
  char e[2]; 
  int f; 
  short h; 
  struct E i; 
};

在結(jié)構(gòu)體E中最大對齊模數(shù)是sizeof(double)=8；且sizeof(E)=8+8+8=24個字節(jié)；在結(jié)構(gòu)體F中，除了結(jié)構(gòu)體成員E之外，其他的最大對齊模數(shù)是sizeof(int)=4；又因為結(jié)構(gòu)體E中最大對齊模數(shù)是sizeof(double)=8；所以結(jié)構(gòu)體F的最大對齊模數(shù)取E的最大對齊模數(shù)8；因此，sizeof(F)=4+4+8+24=40個字節(jié)。
例6：結(jié)構(gòu)體包含共用體

union union1 
{ 
  long a; 
  double b; 
  char name[9]; 
  int c[2]; 
}; 
struct E{ 
  int a; 
  double b; 
  float c; 
  union1 MyUnion; 
};

共用體中的最大對齊模式是sizeof(double)=8；則sizeof(union1)=16；結(jié)構(gòu)體E的最大對齊模數(shù)也是8；則sizeof(E)=8+8+8+16=40個字節(jié)。
例7：結(jié)構(gòu)體包含指針成員

typedef struct A{ 
  char a; 
  int b; 
  float c; 
  double d; 
  int *p; 
  char *pc; 
  short e; 
}A;

結(jié)構(gòu)體包含的指針成員的大小根據(jù)系統(tǒng)類型決定，由于這里是在win-32位系統(tǒng)下分析，則指針大小為4個字節(jié)；因此，結(jié)構(gòu)體A的最大對齊模數(shù)為sizeof(double)=8；則sizeof(A)=4+4+8+8+4+4+8=40個字節(jié)。

存在#pragma pack宏的對齊

#pragma pack (n)  //編譯器將按照n個字節(jié)對齊 
#pragma pack ()   //取消自定義字節(jié)對齊方式

對齊規(guī)則：
結(jié)構(gòu)，聯(lián)合，或者類的數(shù)據(jù)成員，第一個放在偏移為0的地方，以后每個數(shù)據(jù)成員的對齊，按照#pragma pack指定的數(shù)值和自身對齊模數(shù)中較小的那個。
例8：按指定的對齊模數(shù)

#pragma pack (2) /*指定按2字節(jié)對齊*/ 
struct G{ 
  char b; 
  int a; 
  double d; 
  short c; 
}; 
#pragma pack () /*取消指定對齊，恢復(fù)缺省對齊*/

在結(jié)構(gòu)體G中成員變量的最大對齊模數(shù)是sizeof(double)=8；又因為指定對齊模數(shù)是2；所以取其較小者2為結(jié)構(gòu)體G的最大對齊模數(shù)；則sizeof(G)=2+4+8+2=16；由于16是2的整數(shù)倍，則不需要填充。

總結(jié)
在分析結(jié)構(gòu)體字節(jié)對齊時，首先確定有沒有利用#pragma pack()宏定義指定對齊模數(shù)；根據(jù)情況對應(yīng)上面進行兩種情況分析，針對不同的系統(tǒng)會得到不同的結(jié)果。

補充：
在Visual C++下可以用__declspec(align(#))聲明數(shù)據(jù)按#字節(jié)對齊
GUN C下可以使用以下命令:
__attribute__((aligned (n)))，讓所作用的結(jié)構(gòu)成員對齊在n字節(jié)自然邊界上。如果結(jié)構(gòu)中有成員的長度大于n，則按照最大成員的長度來對齊
__attribute__((__packed__))，取消結(jié)構(gòu)在編譯過程中的優(yōu)化對齊，按照實際占用字節(jié)數(shù)進行對齊。
C++11新加關(guān)鍵字alignas(n)

您可能感興趣的文章: