C語言內(nèi)存對齊實例詳解
本文詳細(xì)講述了C語言程序設(shè)計中內(nèi)存對其的概念與用法。分享給大家供大家參考之用。具體如下:
一、字節(jié)對齊基本概念
現(xiàn)代計算機中內(nèi)存空間都是按照byte劃分的,從理論上講似乎對任何類型的變量的訪問可以從任何地址開始,但實際情況是在訪問特定類型變量的時候經(jīng)常在特定的內(nèi)存地址訪問,這就需要各種類型數(shù)據(jù)按照一定的規(guī)則在空間上排列,而不是順序的一個接一個的排放,這就是對齊。 對齊的作用和原因:各個硬件平臺對存儲空間的處理上有很大的不同。一些平臺對某些特定類型的數(shù)據(jù)只能從某些特定地址開始存取。比如有些架構(gòu)的CPU在訪問一個沒有進(jìn)行對齊的變量的時候會發(fā)生錯誤,那么在這種架構(gòu)下編程必須保證字節(jié)對齊.其他平臺可能沒有這種情況,但是最常見的是如果不按照適合其平臺要求對數(shù)據(jù)存放進(jìn)行對齊,會在存取效率上帶來損失。比如有些平臺每次讀都是從偶地址開始,如果一個int型(假設(shè)為32位系統(tǒng))如果存放在偶地址開始的地方,那 么一個讀周期就可以讀出這32bit,而如果存放在奇地址開始的地方,就需要2個讀周期,并對兩次讀出的結(jié)果的高低字節(jié)進(jìn)行拼湊才能得到該32bit數(shù)據(jù)。顯然在讀取效率上下降很多。
請看下面的結(jié)構(gòu):
struct struct1 { double dda; char cda; int ida; }; sizeof(struct1) = ?
錯誤的求法:
sizeof(struct1)=sizeof(double)+sizeof(char)+sizeof(int)=13
但是當(dāng)你運行如下測試代碼:
#include<stdio.h> struct mystruct { double dda; char cda; int ida; }; int main() { struct mystruct ss; printf("%d\n",sizeof(ss)); return 0; }
運行結(jié)果為:16
其實,這是編譯器對變量存儲的一個特殊處理。為了提高CPU的存儲速度,編譯器對一些變量的起始地址做了“對齊”處理。在默認(rèn)情況下,編譯器規(guī)定各成員變量存放的起始地址相對于結(jié)構(gòu)的起始地址的偏移量必須為該變量的類型所占用的字節(jié)數(shù)的倍數(shù)。下面列出常用類型的對齊方式:
類型 對齊方式(變量存放的起始地址相對于結(jié)構(gòu)的起始地址的偏移量)
char 偏移量必須為sizeof(char)即1的倍數(shù)
int 偏移量必須為sizeof(int)即4的倍數(shù)
float 偏移量必須為sizeof(float)即4的倍數(shù)
double 偏移量必須為sizeof(double)即8的倍數(shù)
Short 偏移量必須為sizeof(short)即2的倍數(shù)
各成員變量在存放的時候根據(jù)在結(jié)構(gòu)中出現(xiàn)的順序依次申請空間,同時按照上面的對齊方式調(diào)整位置,空缺的字節(jié)編譯器會自動填充。同時編譯器為了確保結(jié)構(gòu)的大小為結(jié)構(gòu)的字節(jié)邊界數(shù)(即該結(jié)構(gòu)中占用最大空間的類型所占用的字節(jié)數(shù))的倍數(shù),所以在為最后一個成員變量申請空間后,還會根據(jù)需要自動填充空缺的字節(jié)
現(xiàn)在來分析編譯器是怎樣來存放結(jié)構(gòu)的:
struct struct1 { double dda; char cda; int ida; };
第一個成員dda分配空間,其起始地址跟結(jié)構(gòu)的起始地址相同(偏移量0剛好為sizeof(double)的倍數(shù)),該成員變量占用sizeof(double)=8個字節(jié);接下來為第二個成員cda分配空間,這時下一個可以分配的地址對于結(jié)構(gòu)的起始地址的偏移量為8,是sizeof(char)的倍數(shù),所以把cda存放在偏移量為8的地方滿足對齊方式,該成員變量占用 sizeof(char)=1個字節(jié);接下來為第三個成員ida分配空間,這時下一個可以分配的地址對于結(jié)構(gòu)的起始地址的偏移量為9,不是sizeof (int)=4的倍數(shù),為了滿足對齊方式對偏移量的約束問題,VC自動填充3個字節(jié)(這三個字節(jié)沒有放什么東西),這時下一個可以分配的地址對于結(jié)構(gòu)的起始地址的偏移量為12,剛好是sizeof(int)=4的倍數(shù),所以把ida存放在偏移量為12的地方,該成員變量占用sizeof(int)=4個字節(jié);這時整個結(jié)構(gòu)的成員變量已經(jīng)都分配了空間,總的占用的空間大小為:8+1+3+4=16,剛好為結(jié)構(gòu)的字節(jié)邊界數(shù)(即結(jié)構(gòu)中占用最大空間的類型所占用的字節(jié)數(shù)sizeof(double)=8)的倍數(shù),沒有空缺的字節(jié)需要填充。所以整個結(jié)構(gòu)的大小為:sizeof(struct1)=8+1+ 3+4=16,其中有3個字節(jié)是VC自動填充的,沒有放任何有意義的東西。
下面再舉個例子,交換一下上面的struct1的成員變量的位置,使它變成下面的情況:
struct mystruct2 { char cda; double dda; int ida; };
運行結(jié)果為:24
struct mystruct2 { char cda; //偏移量為0,滿足對齊方式,cda占用1個字節(jié); double dda; //下一個可用的地址的偏移量為1,不是sizeof(double)=8 //的倍數(shù),需要補足7個字節(jié)才能使偏移量變?yōu)?(滿足對齊 //方式),因此VC自動填充7個字節(jié),dda存放在偏移量為8 //的地址上,它占用8個字節(jié)。 int ida; //下一個可用的地址的偏移量為16,是sizeof(int)=4的倍 //數(shù),滿足int的對齊方式,所以不需要VC自動填充,type存 //放在偏移量為16的地址上,它占用4個字節(jié)。 //所有成員變量都分配了空間,空間總的大小為1+7+8+4=20,不是結(jié)構(gòu) //的節(jié)邊界數(shù)(即結(jié)構(gòu)中占用最大空間的類型所占用的字節(jié)數(shù)sizeof //(double)=8)的倍數(shù),所以需要填充4個字節(jié),以滿足結(jié)構(gòu)的大小為 //sizeof(double)=8的倍數(shù)。 };
所以該結(jié)構(gòu)總的大小為:sizeof(struct2)為1+7+8+4+4=24。其中總的有7+4=11個字節(jié)是VC自動填充的,沒有放任何有意義的東西。
二、#pragma pack(n)來設(shè)定變量以n字節(jié)對齊方式
VC對結(jié)構(gòu)的存儲的特殊處理確實提高CPU存儲變量的速度,但是有時候也帶來了一些麻煩,我們也屏蔽掉變量默認(rèn)的對齊方式,自己可以設(shè)定變量的對齊方式。VC 中提供了#pragma pack(n)來設(shè)定變量以n字節(jié)對齊方式。n字節(jié)對齊就是說變量存放的起始地址的偏移量有兩種情況:
第一、如果n大于等于該變量所占用的字節(jié)數(shù),那么偏移量必須滿足默認(rèn)的對齊方式;
第二、如果n小于該變量的類型所占用的字節(jié)數(shù),那么偏移量為n的倍數(shù),不用滿足默認(rèn)的對齊方式。
結(jié)構(gòu)的總大小也有個約束條件,分下面兩種情況:如果n大于所有成員變量類型所占用的字節(jié)數(shù),那么結(jié)構(gòu)的總大小必須為占用空間最大的變量占用的空間數(shù)的倍數(shù);否則必須為n的倍數(shù)。下面舉例說明其用法:
#pragma pack(push) //保存對齊狀態(tài) #pragma pack(4)//設(shè)定為4字節(jié)對齊 struct test { char m1; double m4; int m3; }; #pragma pack(pop)//恢復(fù)對齊狀態(tài)
以上結(jié)構(gòu)的大小為16,下面分析其存儲情況,首先為m1分配空間,其偏移量為0,滿足我們自己設(shè)定的對齊方式(4字節(jié)對齊),m1占用1個字節(jié)。接著開始為 m4分配空間,這時其偏移量為1,需要補足3個字節(jié),這樣使偏移量滿足為n=4的倍數(shù)(因為sizeof(double)大于n),m4占用8個字節(jié)。接著為m3分配空間,這時其偏移量為12,滿足為4的倍數(shù),m3占用4個字節(jié)。這時已經(jīng)為所有成員變量分配了空間,共分配了4+8+4=16個字節(jié),滿足為n的倍數(shù)。如果把上面的#pragma pack(4)改為#pragma pack(16),那么我們可以得到結(jié)構(gòu)的大小為24。
再看下面這個例子:
#pragma pack(8) struct S1{ char a; long b; }; struct S2 { char c; struct S1 d; long long e; }; #pragma pack()
成員對齊有一個重要的條件,即每個成員分別對齊.即每個成員按自己的方式對齊.
也就是說上面雖然指定了按8字節(jié)對齊,但并不是所有的成員都是以8字節(jié)對齊.其對齊的規(guī)則是,每個成員按其類型的對齊參數(shù)(通常是這個類型的大小)和指定對齊參數(shù)(這里是8字節(jié))中較小的一個對齊.并且結(jié)構(gòu)的長度必須為所用過的所有對齊參數(shù)的整數(shù)倍,不夠就補空字節(jié).
S1中,成員a是1字節(jié)默認(rèn)按1字節(jié)對齊,指定對齊參數(shù)為8,這兩個值中取1,a按1字節(jié)對齊;成員b是4個字節(jié),默認(rèn)是按4字節(jié)對齊,這時就按4字節(jié)對齊,所以sizeof(S1)應(yīng)該為8;
S2 中,c和S1中的a一樣,按1字節(jié)對齊,而d 是個結(jié)構(gòu),它是8個字節(jié),它按什么對齊呢?對于結(jié)構(gòu)來說,它的默認(rèn)對齊方式就是它的所有成員使用的對齊參數(shù)中最大的一個,S1的就是4.所以,成員d就是按4字節(jié)對齊.成員e是8個字節(jié),它是默認(rèn)按8字節(jié)對齊,和指定的一樣,所以它對到8字節(jié)的邊界上,這時,已經(jīng)使用了12個字節(jié)了,所以又添加了4個字節(jié)的空,從第16個字節(jié)開始放置成員e.這時,長度為24,已經(jīng)可以被8(成員e按8字節(jié)對齊)整除.這樣,sizeof(S2)為24個字節(jié).
這里有三點很重要:
1.每個成員分別按自己的方式對齊,并能最小化長度。
2.復(fù)雜類型(如結(jié)構(gòu))的默認(rèn)對齊方式是它最長的成員的對齊方式,這樣在成員是復(fù)雜類型時,可以最小化長度。
3.對齊后的長度必須是成員中最大的對齊參數(shù)的整數(shù)倍,這樣在處理數(shù)組時可以保證每一項都邊界對齊。
三、minix的stdarg.h文件中對齊方式
在minix的stdarg.h文件中,定義了如下一個宏:
/* Amount of space required in an argument list for an arg of type TYPE. * TYPE may alternatively be an expression whose type is used. */ #define __va_rounded_size(TYPE) \ (((sizeof (TYPE) + sizeof (int) - 1) / sizeof (int)) * sizeof (int))
從注釋以及宏的名字可以看出是有關(guān)內(nèi)存對齊方面的作用。根據(jù)前面關(guān)于C語言內(nèi)存對齊方面的理論可知
n字節(jié)對齊就是說變量存放的起始地址的偏移量有兩種情況:
第一、如果n大于等于該變量所占用的字節(jié)數(shù),那么偏移量必須滿足默認(rèn)的對齊方式(各成員變量存放的起始地址相對于結(jié)構(gòu)的起始地址的偏移量必須為該變量的類型所占用的字節(jié)數(shù)的倍數(shù));
第二、如果n小于該變量的類型所占用的字節(jié)數(shù),那么偏移量為n的倍數(shù),不用滿足默認(rèn)的對齊方式。
此時n = 4,對于sizeof(TYPE)一定為自然數(shù),sizeof(int) - 1 = 3
sizeof(TYPE)只可能出現(xiàn)如下兩種情況:
(1) 當(dāng)sizeof(TYPE) >= 4,偏移量 = (sizeof(TYPE)/4)*4
(2) 當(dāng)sizeof(TYPE) < 4,偏移量 = 4
此時sizeof(TYPE) = 1 or 2 or 3,而(sizeof(TYPE) + 3) / 4 = 1
為了將上述兩種情況統(tǒng)一,偏移量 = ((sizeof(TYPE) + 3) / 4) * 4
在有的源代碼中,將內(nèi)存對齊宏__va_rounded_size通過位操作來實現(xiàn),代碼如下:
#define __va_rounded_size(TYPE) \ ((sizeof(TYPE)+sizeof(int)-1)&~(sizeof(int)-1))
由于 ~(sizeof(int) – 1) ) = ~(4-1)=~(00000011B)=11111100B
(sizeof(TYPE) + sizeof(int) – 1)就是將大于4m但小于等于4(m+1)的數(shù)提高到大于等于4(m+1)但小于4(m+2),這樣再& ~(sizeof(int) – 1) )后就正好將原長度補齊到4的倍數(shù)了。
相信本文所述對大家C程序設(shè)計的學(xué)習(xí)一定的借鑒價值。
相關(guān)文章
C++中拷貝構(gòu)造函數(shù)的應(yīng)用詳解
這篇文章主要介紹了C++中拷貝構(gòu)造函數(shù)的應(yīng)用,需要的朋友可以參考下2014-07-07C++中實現(xiàn)子進(jìn)程執(zhí)行和管道通信詳解
在這篇博客中,我們將深入探索如何在 C++ 程序中實現(xiàn)子進(jìn)程的創(chuàng)建與執(zhí)行,以及父子進(jìn)程間的管道通信,感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下2024-01-01Linux下動靜態(tài)庫的打包與使用指南(C/C++)
c++是面向?qū)ο蟮木幊陶Z言,比較方便實現(xiàn)某些第三方庫,比如翻譯其他面向?qū)ο笳Z言的代碼,比c語言要方便的多,下面這篇文章主要給大家介紹了關(guān)于Linux下C/C++動靜態(tài)庫的打包與使用的相關(guān)資料,需要的朋友可以參考下2023-02-02C語言數(shù)據(jù)結(jié)構(gòu)之Hash散列表
這篇文章主要介紹了C語言數(shù)據(jù)結(jié)構(gòu)之Hash散列表,散列表(哈希表)其思想主要是基于數(shù)組支持按照下標(biāo)隨機訪問數(shù)據(jù),時間復(fù)雜度為O(1)的特性,可以說是數(shù)組的一種拓展,需要的朋友可以參考下2023-08-08