快捷導(dǎo)航

關(guān)于C++內(nèi)存中字節(jié)對齊問題的詳細(xì)介紹

更新時間：2013年05月16日 10:20:44 作者：

本篇文章是對C++內(nèi)存中字節(jié)對齊的問題進行了詳細(xì)的分析與總結(jié)。需要的朋友參考下

一、什么是字節(jié)對齊
計算機中內(nèi)存空間都是按照byte劃分的，從理論上講似乎對任何類型的變量的訪問可以從任何地址開始，但實際情況是在訪問特定類型變量的時候經(jīng)常在特定的內(nèi)存地址訪問，這就需要各種類型數(shù)據(jù)按照一定的規(guī)則在空間上排列，而不是順序的一個接一個的排放，這就是對齊。

二、對齊的作用和原因：
1、平臺原因(移植原因)：不是所有的硬件平臺都能訪問任意地址上的任意數(shù)據(jù)的；某些硬件平臺只能在某些地址處取某些特定類型的數(shù)據(jù)，否則拋出硬件異常。各個硬件平臺對存儲空間的處理上有很大的不同。一些平臺對某些特定類型的數(shù)據(jù)只能從某些特定地址開始存取。比如有些架構(gòu)的CPU在訪問一個沒有進行對齊的變量的時候會發(fā)生錯誤，那么在這種架構(gòu)下編程必須保證字節(jié)對齊。

2、性能原因：最常見的是如果不按照適合其平臺要求對數(shù)據(jù)存放進行對齊，會在存取效率上帶來損失。數(shù)據(jù)結(jié)構(gòu)(尤其是棧)應(yīng)該盡可能地在自然邊界上對齊。原因在于，為了訪問未對齊的內(nèi)存，處理器需要作兩次內(nèi)存訪問，而對齊的內(nèi)存訪問僅需要一次訪問。比如有些平臺每次讀都是從偶地址開始，如果一個int型（假設(shè)為32位系統(tǒng)）如果存放在偶地址開始的地方，那么一個讀周期就可以讀出這32bit，而如果存放在奇地址開始的地方，就需要2個讀周期，并對兩次讀出的結(jié)果的高低字節(jié)進行拼湊才能得到該32bit數(shù)據(jù)。顯然在讀取效率上下降很多。

三、對齊規(guī)則
每個特定平臺上的編譯器都有自己的默認(rèn)“對齊系數(shù)”(也叫對齊模數(shù))。程序員可以通過預(yù)編譯命令#pragma pack(n)，n=1,2,4,8,16 來改變這一系數(shù)，其中的n就是你要指定的“對齊系數(shù)”。
規(guī)則：
1、數(shù)據(jù)成員對齊規(guī)則：結(jié)構(gòu)(struct)(或聯(lián)合(union))的數(shù)據(jù)成員，第一個數(shù)據(jù)成員放在offset為0的地方，以后每個數(shù)據(jù)成員的對齊按照#pragma pack指定的數(shù)值和這個數(shù)據(jù)成員自身長度中，比較小的那個進行。
2、結(jié)構(gòu)(或聯(lián)合)的整體對齊規(guī)則：在數(shù)據(jù)成員完成各自對齊之后，結(jié)構(gòu)(或聯(lián)合)本身也要進行對齊，對齊將按照#pragma pack指定的數(shù)值和結(jié)構(gòu)(或聯(lián)合)最大數(shù)據(jù)成員長度中，比較小的那個進行。
3、當(dāng)#pragma pack的n值等于或超過所有數(shù)據(jù)成員長度的時候，這個n值的大小將不產(chǎn)生任何效果。

四、請看下面的結(jié)構(gòu)：
struct MyStruct
{
double dda1;
char dda;
int type
};
對結(jié)構(gòu)MyStruct采用sizeof會出現(xiàn)什么結(jié)果呢？sizeof（MyStruct）為多少呢？也許你會這樣求: sizeof（MyStruct）=sizeof（double）+sizeof（char）+sizeof（int）=13
但是當(dāng)在VC中測試上面結(jié)構(gòu)的大小時，你會發(fā)現(xiàn)sizeof（MyStruct）為16。你知道為什么在VC中會得出這樣一個結(jié)果嗎？
其實，這是VC對變量存儲的一個特殊處理。為了提高CPU的存儲速度，VC對一些變量的起始地址做了“對齊”處理。在默認(rèn)情況下，VC規(guī)定各成員變量存放的起始地址相對于結(jié)構(gòu)的起始地址的偏移量必須為該變量的類型所占用的字節(jié)數(shù)的倍數(shù)。下面列出常用類型的對齊方式（vc6.0,32位系統(tǒng)）。

類型對齊方式（變量存放的起始地址相對于結(jié)構(gòu)的起始地址的偏移量）
Char偏移量必須為sizeof（char）即1的倍數(shù)
int 偏移量必須為sizeof（int）即4的倍數(shù)
float 偏移量必須為sizeof（float）即4的倍數(shù)
double偏移量必須為sizeof（double）即8的倍數(shù)
Short 偏移量必須為sizeof（short）即2的倍數(shù)

各成員變量在存放的時候根據(jù)在結(jié)構(gòu)中出現(xiàn)的順序依次申請空間，同時按照上面的對齊方式調(diào)整位置，空缺的字節(jié)VC會自動填充。同時VC為了確保結(jié)構(gòu)的大小為結(jié)構(gòu)的字節(jié)邊界數(shù)（即該結(jié)構(gòu)中占用最大空間的類型所占用的字節(jié)數(shù)）的倍數(shù)，所以在為最后一個成員變量申請空間后，還會根據(jù)需要自動填充空缺的字節(jié)。

下面用前面的例子來說明VC到底怎么樣來存放結(jié)構(gòu)的。
struct MyStruct
{
double dda1;
char dda;
int type
};
為上面的結(jié)構(gòu)分配空間的時候，VC根據(jù)成員變量出現(xiàn)的順序和對齊方式，先為第一個成員dda1分配空間，其起始地址跟結(jié)構(gòu)的起始地址相同（剛好偏移量0剛好為sizeof（double）的倍數(shù)），該成員變量占用sizeof（double）=8個字節(jié)；接下來為第二個成員dda分配空間，這時下一個可以分配的地址對于結(jié)構(gòu)的起始地址的偏移量為8，是sizeof（char）的倍數(shù)，所以把dda存放在偏移量為8的地方滿足對齊方式，該成員變量占用 sizeof（char）=1個字節(jié)；接下來為第三個成員type分配空間，這時下一個可以分配的地址對于結(jié)構(gòu)的起始地址的偏移量為9，不是sizeof （int）=4的倍數(shù)，為了滿足對齊方式對偏移量的約束問題，VC自動填充3個字節(jié)（這三個字節(jié)沒有放什么東西），這時下一個可以分配的地址對于結(jié)構(gòu)的起始地址的偏移量為12，剛好是sizeof（int）=4的倍數(shù)，所以把type存放在偏移量為12的地方，該成員變量占用sizeof（int）=4個字節(jié)；這時整個結(jié)構(gòu)的成員變量已經(jīng)都分配了空間，總的占用的空間大小為：8+1+3+4=16，剛好為結(jié)構(gòu)的字節(jié)邊界數(shù)（即結(jié)構(gòu)中占用最大空間的類型所占用的字節(jié)數(shù)sizeof（double）=8）的倍數(shù)，所以沒有空缺的字節(jié)需要填充。所以整個結(jié)構(gòu)的大小為：sizeof（MyStruct）=8+1+ 3+4=16，其中有3個字節(jié)是VC自動填充的，沒有放任何有意義的東西。

下面再舉個例子，交換一下上面的MyStruct的成員變量的位置，使它變成下面的情況：
struct MyStruct
{
char dda;
double dda1;
int type
}；

這個結(jié)構(gòu)占用的空間為多大呢？在VC6.0環(huán)境下，可以得到sizeof（MyStruc）為24。結(jié)合上面提到的分配空間的一些原則，分析下VC怎么樣為上面的結(jié)構(gòu)分配空間的。（簡單說明）
struct MyStruct
{
char dda;//偏移量為0，滿足對齊方式，dda占用1個字節(jié)；
double dda1;//下一個可用的地址的偏移量為1，不是sizeof（double）=8的倍數(shù)，需要補足7個字節(jié)才能使偏移量變?yōu)?（滿足對齊方式），因此VC自動填充7個字節(jié)，dda1存放在偏移量為8的地址上，它占用8個字節(jié)。
int type；//下一個可用的地址的偏移量為16，是sizeof（int）=4的倍數(shù)，滿足int的對齊方式，所以不需要VC自動填充，type存放在偏移量為16的地址上，它占用4個字節(jié)。
}；
所有成員變量都分配了空間，空間總的大小為1+7+8+4=20，不是結(jié)構(gòu)的節(jié)邊界數(shù)（即結(jié)構(gòu)中占用最大空間的類型所占用的字節(jié)數(shù)sizeof（double）=8）的倍數(shù)，所以需要填充4個字節(jié)，以滿足結(jié)構(gòu)的大小為sizeof（double）=8的倍數(shù)。所以該結(jié)構(gòu)總的大小為：sizeof（MyStruc）為1+7+8+4+4=24。其中總的有7+4=11個字節(jié)是VC自動填充的，沒有放任何有意義的東西。

VC對結(jié)構(gòu)的存儲的特殊處理確實提高CPU存儲變量的速度，但是有時候也帶來了一些麻煩，我們也屏蔽掉變量默認(rèn)的對齊方式，自己可以設(shè)定變量的對齊方式。VC 中提供了#pragma pack（n）來設(shè)定變量以n字節(jié)對齊方式。n字節(jié)對齊就是說變量存放的起始地址的偏移量有兩種情況：第一、如果n大于等于該變量所占用的字節(jié)數(shù)，那么偏移量必須滿足默認(rèn)的對齊方式，第二、如果n小于該變量的類型所占用的字節(jié)數(shù)，那么偏移量為n的倍數(shù)，不用滿足默認(rèn)的對齊方式。結(jié)構(gòu)的總大小也有個約束條件，分下面兩種情況：如果n大于所有成員變量類型所占用的字節(jié)數(shù)，那么結(jié)構(gòu)的總大小必須為占用空間最大的變量占用的空間數(shù)的倍數(shù)；否則必須為n的倍數(shù)。

下面舉例說明其用法。
#pragma pack（push） //保存對齊狀態(tài)
#pragma pack（4）//設(shè)定為4字節(jié)對齊
struct test
{
char m1;
double m4;
int m3;
};
#pragma pack（pop）//恢復(fù)對齊狀態(tài)
以上結(jié)構(gòu)的大小為16，下面分析其存儲情況，首先為m1分配空間，其偏移量為0，滿足我們自己設(shè)定的對齊方式（4字節(jié)對齊），m1占用1個字節(jié)。接著開始為 m4分配空間，這時其偏移量為1，需要補足3個字節(jié)，這樣使偏移量滿足為n=4的倍數(shù)（因為sizeof（double）大于n），m4占用8個字節(jié)。接著為m3分配空間，這時其偏移量為12，滿足為4的倍數(shù)，m3占用4個字節(jié)。這時已經(jīng)為所有成員變量分配了空間，共分配了16個字節(jié)，滿足為n的倍數(shù)。如果把上面的#pragma pack（4）改為#pragma pack（16），那么我們可以得到結(jié)構(gòu)的大小為24。（請讀者自己分析）

五、再看下面這個例子

復(fù)制代碼代碼如下:

#pragma pack（8）
struct S1
{
char a;
long b;
};
struct S2
{ 
char c;
struct S1 d;
long long e;
};
#pragma pack（pop）

sizeof（S2）結(jié)果為24.。成員對齊有一個重要的條件，即每個成員分別對齊。即每個成員按自己的方式對齊。也就是說上面雖然指定了按8字節(jié)對齊，但并不是所有的成員都是以8字節(jié)對齊。其對齊的規(guī)則是，每個成員按其類型的對齊參數(shù)（通常是這個類型的大?。┖椭付▽R參數(shù)（這里是8字節(jié)）中較小的一個對齊。并且結(jié)構(gòu)的長度必須為所用過的所有對齊參數(shù)的整數(shù)倍，不夠就補空字節(jié)。

S1中，成員a是1字節(jié)默認(rèn)按1字節(jié)對齊，指定對齊參數(shù)為8,這兩個值中取1,a按1字節(jié)對齊；成員b是4個字節(jié)，默認(rèn)是按4字節(jié)對齊，這時就按4字節(jié)對齊，所以sizeof（S1）應(yīng)該為8;

S2 中，c和S1中的a一樣，按1字節(jié)對齊，而d 是個結(jié)構(gòu)，它是8個字節(jié)，它按什么對齊呢？對于結(jié)構(gòu)來說，它的默認(rèn)對齊方式就是它的所有成員使用的對齊參數(shù)中最大的一個，S1的就是4.所以，成員d就是按4字節(jié)對齊。成員e是8個字節(jié)，它是默認(rèn)按8字節(jié)對齊，和指定的一樣，所以它對到8字節(jié)的邊界上，這時，已經(jīng)使用了12個字節(jié)了，所以又添加了4個字節(jié)的空，從第16個字節(jié)開始放置成員e.這時，長度為24,已經(jīng)可以被8（成員e按8字節(jié)對齊）整除。這樣，一共使用了24個字節(jié)。
a b
S1的內(nèi)存布局：11**,1111,
c S1.a S1.b d
S2的內(nèi)存布局：1***,11**,1111,****11111111

這里有三點很重要：
1.每個成員分別按自己的方式對齊，并能最小化長度。
2.復(fù)雜類型（如結(jié)構(gòu)）的默認(rèn)對齊方式是它最長的成員的對齊方式，這樣在成員是復(fù)雜類型時，可以最小化長度。
3.對齊后的長度必須是成員中最大的對齊參數(shù)的整數(shù)倍，這樣在處理數(shù)組時可以保證每一項都邊界對齊。

六、sizeof例子(注意：下面的例子都是經(jīng)過測試驗證的)

復(fù)制代碼代碼如下:

std::cout <<"void* size"<<sizeof(void*)<<std::endl; //4
std::cout <<"char size"<<sizeof(char)<<std::endl; //1
std::cout <<"unsigned char size"<<sizeof(unsigned char)<<std::endl; //1
std::cout <<"short size"<<sizeof(short)<<std::endl; //2
std::cout <<"int size"<<sizeof(int)<<std::endl;//4
std::cout <<"unsigned int size"<<sizeof(unsigned int)<<std::endl; //4
std::cout <<"long size"<<sizeof(long)<<std::endl; //4
std::cout <<"long int size"<<sizeof(long int)<<std::endl; //4
std::cout <<"long long size"<<sizeof(long long)<<std::endl; //8
std::cout <<"float size"<<sizeof(float)<<std::endl; //4
std::cout <<"double size"<<sizeof(double)<<std::endl; //8
std::cout <<"time_t size"<<sizeof(time_t)<<std::endl;//8

char bufc[32];
std::cout <<"bufc size"<<sizeof(bufc)<<std::endl;//32

struct teststruct{};
class testclass{};
std::cout <<"struct size"<<sizeof(teststruct)<<std::endl;//1
std::cout <<"class size"<<sizeof(testclass)<<std::endl;//1

class A
{
char c;
int val;
short sh;
};

class B
{
public:
char c;
int val;
short sh;
void func1(void){};
virtual void func2(void){};
};

std::cout <<"class size A"<<sizeof(A)<<std::endl;//12
std::cout <<"class size B"<<sizeof(B)<<std::endl;//16

char*p =NULL;
p=new char[100];
std::cout <<"size p"<<sizeof(p)<<std::endl;//4

七、其它
1、在編寫代碼時候可以通過#pragma pack(n),n=1,2,4,8,16來靈活控制內(nèi)存對齊的系數(shù)，當(dāng)需要關(guān)閉內(nèi)存對齊時，可以使用#pragma pack()實現(xiàn)。
2、注意事項
內(nèi)存對齊可以大大的提高編譯器的處理速度，但不是任何時候都是必需的，有的時候不注意的話，還可能出現(xiàn)意想不到的錯誤！最典型的情況就是網(wǎng)絡(luò)通信程序的編碼中，
一定要在定義結(jié)構(gòu)體或者聯(lián)合之前使用#pragma pack()把內(nèi)存對齊關(guān)閉，這是因為遠程主機通常不知道對方使用的何種對齊方式，通過socket接收的字節(jié)流，然后按照字節(jié)解析
得到對應(yīng)的結(jié)果，如果使用內(nèi)存對齊，遠程主機很可能會得到錯誤的結(jié)果！這種情況曾經(jīng)指導(dǎo)上機時遇到過，而且屬于比較隱蔽的錯誤，debug了好久才發(fā)現(xiàn)問題出在這里。
3、優(yōu)化結(jié)構(gòu)體
雖然內(nèi)存對齊可以提高運行效率，但是卻浪費了內(nèi)存，在現(xiàn)代PC上通常不會在乎這點小的空間，但是在一些內(nèi)存很小的嵌入式設(shè)備上，可能就要錙銖必較了。其實我們發(fā)現(xiàn)在不影響功能的前提下，可以調(diào)整成員的順序來減少“內(nèi)存空洞”帶來的浪費。

您可能感興趣的文章: