C語言、C++內(nèi)存對齊問題詳解
這也可以?
#include <iostream>
using namespace std;
struct Test_A
{
char a;
char b;
int c;
};
struct Test_B
{
char a;
int c;
char b;
};
struct Test_C
{
int c;
char a;
char b;
};
int main()
{
struct Test_A a;
memset(&a, 0, sizeof(a));
struct Test_B b;
memset(&b, 0, sizeof(b));
struct Test_C c;
memset(&c, 0, sizeof(c));
// Print the memory size of the struct
cout<<sizeof(a)<<endl;
cout<<sizeof(b)<<endl;
cout<<sizeof(c)<<endl;
return 0;
}
好了,一段簡單的程序,上面的這段程序輸出是什么?如果你很懂,也就會知道我接下來要講什么了,可以略過了;如果,你不知道,或者還很模糊,請繼續(xù)閱讀。
這是為什么?
上面這段程序的輸出結(jié)果如下(windows 8.1 + visual studio 2012 update3下運行):
// Print the memory size of the struct
cout<< sizeof(a)<<endl; // 8bytes
cout<< sizeof(b)<<endl; // 12bytes
cout<< sizeof(c)<<endl; // 8bytes
很奇怪么?定義的三個結(jié)構(gòu)體,只是換了一下結(jié)構(gòu)體中定義的成員的先后順序,怎么最終得到的結(jié)構(gòu)體所占用的內(nèi)存大小卻不一樣呢?很詭異么?好了,這就是我這里要總結(jié)的內(nèi)存對齊概念了。
內(nèi)存對齊
內(nèi)存對齊的問題主要存在于理解struct和union等復(fù)合結(jié)構(gòu)在內(nèi)存中的分布。許多實際的計算機(jī)系統(tǒng)對基本類型數(shù)據(jù)在內(nèi)存中存放的位置有限制,它們會要求這些數(shù)據(jù)的首地址的值是某個數(shù)k(通常它為4或8)的倍數(shù),這就是所謂的內(nèi)存對齊。這個值k在不同的CPU平臺下,不同的編譯器下表現(xiàn)也有所不同,現(xiàn)在我們涉及的主流的編譯器是Microsoft的編譯器和GCC。
對于我們這種做上層應(yīng)用的程序員來說,真的是很少考慮內(nèi)存對齊這個問題的,內(nèi)存對齊對于上層程序員來說,是“透明的”。內(nèi)存對齊,可以說是編譯器做的工作,編譯器為程序中的每個數(shù)據(jù)塊安排在適當(dāng)?shù)膬?nèi)存位置上。很多時候,我們要寫出效率更高的代碼,此時我們就需要去了解這種內(nèi)存對齊的概念,以及編譯器在后面到底偷偷摸摸干了點什么。特別是對于C和C++程序員來說,理解和掌握內(nèi)存對齊更是重要的。
為什么要有內(nèi)存對齊呢?該占用多大的內(nèi)存,那就開辟對應(yīng)大小的內(nèi)存就好了,好比上面的結(jié)構(gòu)體,兩個char類型和一個int類型,大小應(yīng)該是6bytes才對啊,怎么又是8bytes,又是12bytes的啊?對于內(nèi)存對齊,主要是為了提高程序的性能,數(shù)據(jù)結(jié)構(gòu),特別是棧,應(yīng)該盡可能地在自然邊界上對齊。原因在于,為了訪問未對其的內(nèi)存,處理器需要做兩次內(nèi)存訪問;然而,對齊的內(nèi)存訪問僅僅需要一次內(nèi)存訪問。
在計算機(jī)中,字、雙字和四字在自然邊界上不需要在內(nèi)存中對齊(對字、雙字和四字來說,自然邊界分別是偶數(shù)地址,可以被4整除的地址和可以被8整除的地址)。如果一個字或雙字操作數(shù)跨越了4字節(jié)邊界,或者一個四字操作數(shù)跨越了8字節(jié)邊界,就被認(rèn)為是未對齊的,從而需要兩次總線周期來訪問內(nèi)存。一個字起始地址是奇數(shù),但卻沒有跨越字邊界,就被認(rèn)為是對齊的,能夠在一個總線周期中被訪問。綜上所述,內(nèi)存對齊可以用一句話來概括——數(shù)據(jù)項只能存儲在地址是數(shù)據(jù)項大小的整數(shù)倍的內(nèi)存位置上。
我們再來看看一個簡答的例子:
#include <stdio.h>
struct Test
{
char a;
int b;
int c;
char d;
};
int main()
{
struct Test structTest;
printf("&a=%p\n", &structTest.a);
printf("&b=%p\n", &structTest.b);
printf("&c=%p\n", &structTest.c);
printf("&d=%p\n", &structTest.d);
printf("sizeof(Test)=%d\n", sizeof(structTest));
return 0;
}
輸出結(jié)果如下:
&a=00C7FA44
&b=00C7FA48
&c=00C7FA4C
&d=00C7FA50
sizeof(Test)=16
結(jié)構(gòu)體Test的成員變量b占用字節(jié)數(shù)為4bytes,所以只能存儲在4的整數(shù)倍的位置上,由于a只占用1一個字節(jié),而a的地址00C7FA44和b的地址00C7FA48之間相差4bytes,這就說明,a其實也占用了4個字節(jié),這樣才能保證b的起始地址是4的整數(shù)倍。這就是內(nèi)存對齊。如果沒有內(nèi)存對齊,我們再拿上面的代碼作為例子,則可能輸出結(jié)果如下:
&a=ffbff5e8
&b=ffbff5e9
&c=ffbff5ed
&d=ffbff5f1
sizeof(Test)=10
可以看到,a占用了一個字節(jié),緊接著a之后就是b;之前也說了,內(nèi)存對齊是操作系統(tǒng)為了快速訪問內(nèi)存而采用的一種策略,簡單來說,就是為了防止變量的二次訪問。操作系統(tǒng)在訪問內(nèi)存時,每次讀取一定的長度(這個長度就是操作系統(tǒng)的默認(rèn)對齊系數(shù),或者是默認(rèn)對齊系數(shù)的整數(shù)倍)。沒有了內(nèi)存對齊,當(dāng)我們讀取變量c時,第一次讀取0xffbff5e8~0xffbff5ef的內(nèi)存,第二次讀取0xffbff5f0~0xffbff5f8的內(nèi)存,由于變量c所占用的內(nèi)存跨越了兩片地址區(qū)域,為了正確得到變量c的值,就需要讀取兩次,將兩次內(nèi)存合并進(jìn)行整合,這樣就降低了內(nèi)存的訪問效率。
我在這里說了這么多,也挺繞口,這就是內(nèi)存對齊的規(guī)則。在C++中,每個特定平臺上的編譯器都有自己的內(nèi)存對齊規(guī)則,下面我們就內(nèi)存對齊的規(guī)則進(jìn)行總結(jié)。
內(nèi)存對齊規(guī)則
每個特定平臺上的編譯器都有自己的默認(rèn)“對齊系數(shù)”。我們可以通過預(yù)編譯命令#pragma pack(k),k=1,2,4,8,16來改變這個系數(shù),其中k就是需要指定的“對齊系數(shù)”;也可以使用#pragma pack()取消自定義字節(jié)對齊方式。具體的對齊規(guī)則如下:
規(guī)則1:struct或者union的數(shù)據(jù)成員對齊規(guī)則:第一個數(shù)據(jù)成員放在offset為0的地方,對齊按照#pragma pack指定的數(shù)值和自身占用字節(jié)數(shù)中,二者比較小的那個進(jìn)行對齊;比如;
#pragma pack(4) // 指定對齊系數(shù)為4,當(dāng)占用字節(jié)數(shù)大于等于4時,就按照4進(jìn)行對齊
struct Test
{
char x1;
short x2;
float x3;
char x4;
};
x1占用字節(jié)數(shù)為1,1 < 4,按照對齊系數(shù)1進(jìn)行對齊,所以x1放置在offset為0的位置;
x2占用字節(jié)數(shù)為2,2 < 4,按照對齊系數(shù)2進(jìn)行對齊,所以x2放置在offset為2,3的位置;
x3占用字節(jié)數(shù)為4,4 = 4,按照對齊系數(shù)4進(jìn)行對齊,所以x3放置在offset為4,5,6,7的位置;
x4占用字節(jié)數(shù)為1,1 < 4,按照對齊系數(shù)1進(jìn)行對齊,所以x4放置在offset為8的位置;
現(xiàn)在已經(jīng)占了9bytes的內(nèi)存空間了,但是實際在visual studio 2012中實測為12bytes,為什么呢?看下一條規(guī)則。
規(guī)則2:struct或者union的整體對齊規(guī)則:在數(shù)據(jù)成員完成各自對齊以后,struct或者union本身也要進(jìn)行對齊,對齊將按照#pragma pack指定的數(shù)值和struct或者union中最大數(shù)據(jù)成員長度中比較小的那個進(jìn)行;
繼續(xù)使用規(guī)則1種的例子進(jìn)行解釋,按照規(guī)則1的理解,struct Test已經(jīng)占用了9bytes,實際為什么是12bytes呢?根據(jù)規(guī)則2,在所有成員對齊完成以后,struct或者union自身也要進(jìn)行對齊;我們設(shè)定的對齊系數(shù)為4,而struct Test中占用字節(jié)數(shù)最大的是float類型的x3,由于x3占用字節(jié)數(shù)小于或等于設(shè)定的對齊系數(shù)4,所以struct或者union整體需要按照4bytes進(jìn)行對齊,也就是說,struct或者union占用的字節(jié)數(shù)必須能夠被4整除,好了。struct Test已經(jīng)占用了9bytes了,10bytes不能被4整除,11bytes也不能,12bytes正好;所以,struct Test最終占用的字節(jié)數(shù)為12bytes。
上述兩條規(guī)則就是內(nèi)存對齊的基本規(guī)則,先局部對齊,后整體對齊。
實例分析
總結(jié)了那么多的規(guī)則,不來點實際的code,總覺的少點什么,好吧。以下就按照上述總結(jié)的內(nèi)存對齊規(guī)則,來進(jìn)行一些實際的代碼分析(注:測試環(huán)境Windows 8.1 + Visual Studio 2012 update 3)。
測試代碼如下,先確認(rèn)測試環(huán)境:
#include <iostream>
using namespace std;
struct Test
{
char x1;
double x2;
short x3;
float x4;
char x5;
};
int main()
{
cout<<"sizeof(char)"<<sizeof(char)<<endl; // 1byte
cout<<"sizeof(short)"<<sizeof(short)<<endl; // 2bytes
cout<<"sizeof(int)"<<sizeof(int)<<endl; // 4bytes
cout<<"sizeof(double)"<<sizeof(double)<<endl; // 8bytes
return 0;
}
我分別設(shè)置#pragma pack(k),k=1,2,4,8,16進(jìn)行測試。
#pragma pack(1) // 設(shè)定對齊系數(shù)為1
struct Test
{
char x1;
double x2;
short x3;
float x4;
char x5;
};
首先使用規(guī)則1,對成員變量進(jìn)行對齊:
x1 <= 1,按照1進(jìn)行對齊,x1占用0;
x2 > 1,按照1進(jìn)行對齊,x2占用1,2,3,4,5,6,7,8;
x3 > 1,按照1進(jìn)行對齊,x3占用9,10;
x4 > 1,按照1進(jìn)行對齊,x4占用11,12,13,14;
x5 > 1,按照1進(jìn)行對齊,x5占用15;
最后使用規(guī)則2,對struct整體進(jìn)行對齊:
x2占用內(nèi)存最大,為8bytes,8bytes > 1byte,所以整體按照1進(jìn)行對齊;16%1=0。
所以,在#pragma pack(1) 的情況下,struct Test占用內(nèi)存為16bytes;內(nèi)存占用如下圖所示:
#pragma pack(2) // 設(shè)定對齊系數(shù)為2
struct Test
{
char x1;
double x2;
short x3;
float x4;
char x5;
};
首先使用規(guī)則1,對成員變量進(jìn)行對齊:
x1 <= 2,按照1進(jìn)行對齊,x1占用0;
x2 > 2,按照2進(jìn)行對齊,x2占用2,3,4,5,6,7,8,9;
x3 >= 2,按照2進(jìn)行對齊,x3占用10,11;
x4 > 2,按照2進(jìn)行對齊,x4占用12,13,14,15;
x5 < 2,按照1進(jìn)行對齊,x5占用16;
最后使用規(guī)則2,對struct整體進(jìn)行對齊:
x2占用內(nèi)存最大,為8bytes,8bytes > 2byte,所以整體按照2進(jìn)行對齊;17%2!=0
所以,在#pragma pack(2) 的情況下,struct Test占用內(nèi)存為18bytes;內(nèi)存占用如下圖所示:
#pragma pack(4) // 設(shè)定對齊系數(shù)為4
struct Test
{
char x1;
double x2;
short x3;
float x4;
char x5;
};
首先使用規(guī)則1,對成員變量進(jìn)行對齊:
x1 <= 4,按照1進(jìn)行對齊,x1占用0;
x2 > 4,按照4進(jìn)行對齊,x2占用4,5,6,7,8,9,10,11;
x3 < 4,按照2進(jìn)行對齊,x3占用12,13;
x4 >= 4,按照4進(jìn)行對齊,x4占用16,17,18,19;
x5 < 4,按照1進(jìn)行對齊,x5占用20;
最后使用規(guī)則2,對struct整體進(jìn)行對齊:
x2占用內(nèi)存最大,為8bytes,8bytes > 4byte,所以整體按照4進(jìn)行對齊;21%4!=0
所以,在#pragma pack(4) 的情況下,struct Test占用內(nèi)存為24bytes;內(nèi)存占用如下圖所示:
#pragma pack(8) // 設(shè)定對齊系數(shù)為8
struct Test
{
char x1;
double x2;
short x3;
float x4;
char x5;
};
首先使用規(guī)則1,對成員變量進(jìn)行對齊:
x1 <= 8,按照1進(jìn)行對齊,x1占用0;
x2 >= 8,按照8進(jìn)行對齊,x2占用8,9,10,11,12,13,14,15;
x3 < 8,按照2進(jìn)行對齊,x3占用16,17;
x4 <= 8,按照4進(jìn)行對齊,x4占用20,21,22,23;
x5 < 8,按照1進(jìn)行對齊,x5占用24;
最后使用規(guī)則2,對struct整體進(jìn)行對齊:
x2占用內(nèi)存最大,為8bytes,8bytes >= 8byte,所以整體按照8進(jìn)行對齊;25%8!=0
所以,在#pragma pack(8) 的情況下,struct Test占用內(nèi)存為32bytes;內(nèi)存占用如下圖所示:
#pragma pack(16) // 設(shè)定對齊系數(shù)為16
struct Test
{
char x1;
double x2;
short x3;
float x4;
char x5;
};
首先使用規(guī)則1,對成員變量進(jìn)行對齊:
x1 < 16,按照1進(jìn)行對齊,x1占用0;
x2 < 16,按照8進(jìn)行對齊,x2占用8,9,10,11,12,13,14,15;
x3 < 16,按照2進(jìn)行對齊,x3占用16,17;
x4 < 16,按照4進(jìn)行對齊,x4占用20,21,22,23;
x5 < 16,按照1進(jìn)行對齊,x5占用24;
最后使用規(guī)則2,對struct整體進(jìn)行對齊:
x2占用內(nèi)存最大,為8bytes,16bytes >= 8byte,所以整體按照8進(jìn)行對齊;25%8!=0
所以,在#pragma pack(16) 的情況下,struct Test占用內(nèi)存為32bytes;內(nèi)存占用如下圖所示:
總結(jié)
經(jīng)過上面的實例分析,我對內(nèi)存對齊有了全面的認(rèn)識和了解?,F(xiàn)在再回過來看看文章開頭的那段代碼,問題就迎刃而解了,同時經(jīng)過這段代碼,讓我們認(rèn)識到定義struct或者union時,也是有講解的。在以后的編碼生涯時,是不是又要多考慮一些呢?糾結(jié)~
相關(guān)文章
Visual Studio 2019配置OpenCV4.1.1詳細(xì)圖解教程
這篇文章主要介紹了Visual Studio 2019配置OpenCV4.1.1詳細(xì)圖解教程 ,需要的朋友可以參考下2020-02-02深入C/C++浮點數(shù)在內(nèi)存中的存儲方式詳解
本篇文章是對C/C++浮點數(shù)在內(nèi)存中的存儲方式進(jìn)行了詳細(xì)的分析介紹,需要的朋友參考下2013-05-05c++函數(shù)中的指針參數(shù)與地址參數(shù)區(qū)別介紹
c++函數(shù)中的指針參數(shù)與地址參數(shù)區(qū)別介紹;可供參考2012-11-11c++調(diào)用python實現(xiàn)圖片ocr識別
所謂c++調(diào)用python,實際上就是在c++中把整個python當(dāng)作一個第三方庫引入,然后使用特定的接口來調(diào)用python的函數(shù)或者直接執(zhí)行python腳本,本文介紹的是調(diào)用python實現(xiàn)圖片ocr識別,感興趣的可以了解下2023-09-09C++ 中重載和運算符重載加號實現(xiàn)矩陣相加實例代碼
這篇文章主要介紹了C++ 中重載和運算符重載加號實現(xiàn)矩陣相加實例代碼的相關(guān)資料,需要的朋友可以參考下2017-03-03淺談#ifndef,#define,#endif的作用和用法
下面小編就為大家?guī)硪黄獪\談#ifndef,#define,#endif的作用和用法。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2016-12-12