C語言、C++中的union用法總結
開始的話
已經好長時間沒有更新了,對不起自己,更對不起我親愛的讀者,同時也對不起自己開辦的這個博客平臺。忙,太忙了,忙于找工作,找一份好工作,糾結于去大城市闖呢,還是回到本省的首府城市。大家都在糾結這個問題,也希望大家和我討論討論。別的先不說了,都工作這么長時間了,還回過頭來總結union,確實有點過分,要是和大家說我一直從事于C++開發(fā),還不懂union,大家可能還真的不信。我們每天都在總結那些看似高端的東西,什么設計模式(當然我也有總結了)、重構(后期我也會說的了)了,卻忽略了那些最基礎,最根本的知識點。今天別人問我,我蒙了,所以,就有了這篇文章。
什么是union?
翻譯過來說,就是共用體,或者也叫聯合體。說到了union,也就是共用體,就不得不說一下struct了,當我們有如下的struct的定義時:
struct student
{
char mark;
long num;
float score;
};
關于struct的內存結構,將就會像下圖所示這樣(在x86機器上演示):
sizeof(struct student)的值為12bytes。但是,當我們定義如下的union時,
union test
{
char mark;
long num;
float score;
};
sizeof(union test)的值為4。這為什么呢?這就是需要說的。 有的時候,我們需要幾種不同類型的變量存在在同一段的內存空間中,就像上面的,我們需要將一個char類型的mark、一個long類型的num變量和一個float類型的score變量存放在同一個地址開始的內存單元中。上面的三個變量,char類型和long類型所占的內存字節(jié)數是不一樣的,但是在union中,它們都是從同一個地址存放的,也就是使用的覆蓋技術,這三個變量互相覆蓋,而這種使幾個不同的變量共占同一段內存的結構,稱為“共用體”類型的結構。上面定義的union類型的結構如下:
上面也說了,sizeof(union test)的值為4。那為什么是4呢?大體上來說,結構體struct所占用的內存為各個成員的占用的內存之和(當然也需要考慮內存對齊的問題了)。而對于union來說,在譚浩強的《C語言程序設計》中這么說:union變量所占用的內存長度等于最長的成員的內存長度。很顯然,這是不對的,對于union所占用的內存大小,需要考慮內存對齊的問題。這就是為什么sizeof(union test)的值為4啦。
C中使用union
說的再好,再多,終歸都是要在使用的,下面就好好的說說C中使用union。和struct一樣,union只有先定義了共用體變量才能引用它。而且不能直接引用共用體變量,而只能引用共用體變量中的成員。就像我上面定義的union test。我們不能像下面這樣直接引用union:
union test a;
printf("%d", a);
這種直接引用是錯誤的,由于a的存儲區(qū)有好幾種類型,分別占不同長度的存儲區(qū),僅寫共用體變量名a,這樣使編譯器無法確定究竟輸出的哪一個成員的值。所以,應該寫成下面這樣:
printf("%d", a.mark);
同時,在使用union的時候,我們還需要注意以下的幾點:
1.同一個內存段可以用來存放幾種不同類型的成員,但在每一個時刻只能存在其中一種,而不是同時存放幾種。也就是說,每一瞬間只有一個成員起作用,其它的成員不起作用,即不是同時都存在和起作用。
2.共用體變量中起作用的成員是最后一個存放的成員,在存入一個新的成員后,原有的成員就失去作用。比如以下的代碼:
#include <iostream>
using namespace std;
union test
{
char mark;
long num;
float score;
}a;
int main()
{
// cout<<a<<endl; // wrong
a.mark = 'b';
cout<<a.mark<<endl; // 輸出'b'
cout<<a.num<<endl; // 98 字符'b'的ACSII值
cout<<a.score<<endl; // 輸出錯誤值
a.num = 10;
cout<<a.mark<<endl; // 輸出空
cout<<a.num<<endl; // 輸出10
cout<<a.score<<endl; // 輸出錯誤值
a.score = 10.0;
cout<<a.mark<<endl; // 輸出空
cout<<a.num<<endl; // 輸出錯誤值
cout<<a.score<<endl; // 輸出10
return 0;
}
所以,在使用union的時候,要十二分的小心的。
3.由于union中的所有成員起始地址都是一樣的,所以&a.mark、&a.num和&a.score的值都是一樣的。
4.不能把union變量作為函數參數,也不能使函數帶回union變量,但可以使用指向union變量的指針。
5.union類型可以出現在結構體類型定義中,也可以定義union數組,反之,結構體也可以出現在union類型定義中,數組也可以作為union的成員。
按理說,總結到這里,C語言中的union也就沒什么更多的要說了。但是,有一種東西叫做C++,在這個C++中有一種東西叫做類。
當union遇到對象
就單單C中的union,上面的總結已經夠用了,但是,現在偏偏又有一個叫做C++的東西;當union遇到了C++中的對象時,一切又變得剪不斷,理還亂。上面總結的union使用法則,在C++中依然適用。本來union本就是從C語言中的,如果我們在C++中繼續(xù)按照C語言的那種方式使用union,那是沒有問題的。如果我們在union中放一個類的對象呢?結果會怎么樣?比如有以下代碼:
#include <iostream>
using namespace std;
class CA
{
int m_a;
};
union Test
{
CA a;
double d;
};
int main()
{
return 0;
}
可以看到,沒有問題;如果我們在再類CA中添加了構造函數,或者添加析構函數,我們就會發(fā)現程序就會出現錯誤。由于union里面的東西共享內存,所以不能定義靜態(tài)、引用類型的變量。由于在union里也不允許存放帶有構造函數、析構函數和復制構造函數等的類的對象,但是可以存放對應的類對象指針。編譯器無法保證類的構造函數和析構函數得到正確的調用,由此,就可能出現內存泄漏。所以,我們在C++中使用union時,盡量保持C語言中使用union的風格,盡量不要讓union帶有對象。
結束的話
我們都在玩那些高大上的東西,猛回頭,發(fā)現身后卻又一個大坑。打開塵封了多年的《C語言程序設計》(譚浩強著),小心翼翼的拭去封面上的塵土,思緒立刻被拉回到大一。那些年,我那清純的大一。對大學的憧憬,對計算機的好奇,對編程的未知,就是這本書,這本該死的《C語言程序設計》,把我?guī)狭恕俺绦蛟场边@條不歸路。說多了,都是淚,當你看我這篇文章時,你應該懂我的。CodeMonkey~~~,這條不歸路,且行且珍惜。
===修改日志===
2014年9月11日 刪除了文中“不能把union變量作為函數參數,也不能使函數帶回union變量,但可以使用指向union變量的指針?!边@樣的描述,非常感謝Cassie_Lcy的指正,而且還在評論中附上了驗證代碼,非常感謝;同時,我也非常抱歉,對于這點沒有驗證過的知識,就進行了總結,對大家造成了一定的誤導,sorry。一定要注重求學的嚴謹性。