快捷導(dǎo)航

詳談.net中的垃圾回收機(jī)制

更新時(shí)間：2013年04月16日 17:03:54 作者：

詳談.net中的垃圾回收機(jī)制，需要的朋友可以參考一下

1. 自動(dòng)內(nèi)存管理和GC
　　在原始程序中堆的內(nèi)存分配是這樣的：找到第一個(gè)有足夠空間的內(nèi)存地址（沒(méi)被占用的），然后將該內(nèi)存分配。當(dāng)程序不再需要此內(nèi)存中的信息時(shí)程序員需要手動(dòng)將此內(nèi)存釋放。堆的內(nèi)存是公用的，也就是說(shuō)所有進(jìn)程都有可能覆蓋另一進(jìn)程的內(nèi)存內(nèi)容，這就是為什么很多設(shè)計(jì)不當(dāng)?shù)某绦蛏踔習(xí)尣僮飨到y(tǒng)本身都down掉。我們有時(shí)碰到的程序莫名其妙的死掉了（隨機(jī)現(xiàn)象），也是因?yàn)閮?nèi)存管理不當(dāng)引起的（可能由于本身程序的內(nèi)存問(wèn)題或是外來(lái)程序造成的）。另一個(gè)常見(jiàn)的實(shí)例就是大家經(jīng)?？吹降挠螒虻腡rainer，他們通過(guò)直接修改游戲的內(nèi)存達(dá)到"無(wú)敵"的效果。明白了這些我們可以想象如果內(nèi)存地址被用混亂了的話會(huì)多么危險(xiǎn)，我們也可以想象為什么C++程序員（某些）一提起指針就頭疼的原因了。另外，如果程序中的內(nèi)存不被程序員手動(dòng)釋放的話那么這個(gè)內(nèi)存就不會(huì)被重新分配，直到電腦重起為止，也就是我們所說(shuō)的內(nèi)存泄漏。所說(shuō)的這些是在非托管代碼中，CLR通過(guò)AppDomain實(shí)現(xiàn)代碼間的隔離避免了這些內(nèi)存管理問(wèn)題，也就是說(shuō)一個(gè)AppDomain在一般情況下不能讀/寫(xiě)另一AppDomain的內(nèi)存。托管內(nèi)存釋放就由GC（Garbage Collector）來(lái)負(fù)責(zé)。我們要進(jìn)一步講述的就是這個(gè)GC，但是在這之前要先講一下托管代碼中內(nèi)存的分配，托管堆中內(nèi)存的分配是順序的，也就是說(shuō)一個(gè)挨著一個(gè)的分配。這樣內(nèi)存分配的速度就要比原始程序高，但是高出的速度會(huì)被GC找回去。為什么？看過(guò)GC的工作方式后你就會(huì)知道答案了。
2. GC工作方式
　　首先我們要知道托管代碼中的對(duì)象什么時(shí)候回收我們管不了（除非用GC.Collect**GC回收，這不推薦，后面會(huì)說(shuō)明為什么）。GC會(huì)在它"高興"的時(shí)候執(zhí)行一次回收（這有許多原因，比如內(nèi)存不夠用時(shí)。這樣做是為了提高內(nèi)存分配、回收的效率）。那么如果我們用Destructor呢？同樣不行，因?yàn)?NET中Destructor的概念已經(jīng)不存在了，它變成了Finalizer，這會(huì)在后面講到。目前請(qǐng)記住一個(gè)對(duì)象只有在沒(méi)有任何引用的情況下才能夠被回收。為了說(shuō)明這一點(diǎn)請(qǐng)看下面這一段代碼：

復(fù)制代碼代碼如下:

view sourceprint?object objA = new object();  
object objB = objA;  
objA = null;  
// **回收。  
GC.Collect();  
objB.ToString(); 

　　這里objA引用的對(duì)象并沒(méi)有被回收，因?yàn)檫@個(gè)對(duì)象還有另一個(gè)引用，ObjB。對(duì)象在沒(méi)有任何引用后就有條件被回收了。
　　當(dāng)GC回收時(shí)，它會(huì)做以下幾步：
　　1、確定對(duì)象沒(méi)有任何引用。
　　2、檢查對(duì)象是否在Finalizer表上有記錄。如果在Finalizer表上有記錄，那么將記錄移到另外的一張表上，在這里我們叫它Finalizer2。如果不在Finalizer2表上有記錄，那么釋放內(nèi)存。在Finalizer2表上的對(duì)象的Finalizer會(huì)在另外一個(gè)low priority的線程上執(zhí)行后從表上刪除。當(dāng)對(duì)象被創(chuàng)建時(shí)GC會(huì)檢查對(duì)象是否有Finalizer，如果有就會(huì)在Finalizer表中添加紀(jì)錄。我們這里所說(shuō)的記錄其實(shí)就是指針。如果仔細(xì)看這幾個(gè)步驟，我們就會(huì)發(fā)現(xiàn)有Finalizer的對(duì)象第一次不會(huì)被回收，也就是，有Finalizer的對(duì)象要一次以上的Collect操作才會(huì)被回收，這樣就要慢一步，所以作者推薦除非是絕對(duì)需要不要?jiǎng)?chuàng)建Finalizer。
　　GC為了提高回收的效率使用了Generation的概念，原理是這樣的，第一次回收之前創(chuàng)建的對(duì)象屬于Generation 0，之后，每次回收時(shí)這個(gè)Generation的號(hào)碼就會(huì)向后挪一，也就是說(shuō)，第二次回收時(shí)原來(lái)的Generation 0變成了Generation 1，而在第一次回收后和第二次回收前創(chuàng)建的對(duì)象將屬于Generation 0。GC會(huì)先試著在屬于Generation 0的對(duì)象中回收，因?yàn)檫@些是最新的，所以最有可能會(huì)被回收，比如一些函數(shù)中的局部變量在退出函數(shù)時(shí)就沒(méi)有引用了（可被回收）。如果在Generation 0中回收了足夠的內(nèi)存，那么GC就不會(huì)再接著回收了，如果回收的還不夠，那么GC就試著在Generation 1中回收，如果還不夠就在Generation 2中回收，以此類推。Generation也有個(gè)最大限制，根據(jù)Framework版本而定，可以用GC.MaxGeneration獲得。在回收了內(nèi)存之后GC會(huì)重新排整內(nèi)存，讓數(shù)據(jù)間沒(méi)有空格，這樣是因?yàn)镃LR順序分配內(nèi)存，所以內(nèi)存之間不能有空著的內(nèi)存?，F(xiàn)在我們知道每次回收時(shí)都會(huì)浪費(fèi)一定的CPU時(shí)間，這就是我說(shuō)的一般不要手動(dòng)GC.Collect的原因。
　　當(dāng)我們用Destructor的語(yǔ)法時(shí)，編譯器會(huì)自動(dòng)將它寫(xiě)為protected virtual void Finalize()，這個(gè)方法就是我所說(shuō)的Finalizer。就象它的名字所說(shuō)，它用來(lái)結(jié)束某些事物，不是用來(lái)摧毀（Destruct）事物。在Visual Basic中它就是以Finalize方法的形式出現(xiàn)的，所以Visual Basic程序員就不用操心了。C#程序員得用Destructor的語(yǔ)法寫(xiě)Finalizer，不過(guò)千萬(wàn)不要弄混了，.NET中已經(jīng)沒(méi)有Destructor了。C++中我們可以準(zhǔn)確的知道什么時(shí)候會(huì)執(zhí)行Destructor，不過(guò)在.NET中我們不能知道什么時(shí)候會(huì)執(zhí)行Finalizer，因?yàn)樗窃诘谝淮螌?duì)象回收操作后才執(zhí)行的。我們也不能知道Finalizer的執(zhí)行順序，也就是說(shuō)同樣的情況下，A的Finalize可能先被執(zhí)行，B的后執(zhí)行，也可能A的后執(zhí)行而B(niǎo)的先執(zhí)行。也就是說(shuō)，在Finalizer中我們的代碼不能有任何的時(shí)間邏輯。下面我們以計(jì)算一個(gè)類有多少個(gè)實(shí)例為示例，指出Finalizer與Destructor的不同并指出在Finalizer中有時(shí)間邏輯的錯(cuò)誤：

復(fù)制代碼代碼如下:

view sourceprint?public class CountObject {  
  public static int Count = 0;  
  public CountObject() {  
    Count++;  
  }  
  ~CountObject() {  
    Count--;  
  }  
}  
static void Main() {  
  CountObject obj;  
  for (int i = 0; i < 5; i++) {  
    obj = null; // 這一步多余，這么寫(xiě)只是為了更清晰些！  
   obj = new CountObject();  
  }  
  // Count不會(huì)是1，因?yàn)镕inalizer不會(huì)馬上被觸發(fā)，要等到有一次回收操作后才會(huì)被觸發(fā)。  
  Console.WriteLine(CountObject.Count);  
  Console.ReadLine();  
} 

　　注意以上代碼要是改用C++寫(xiě)的話會(huì)發(fā)生內(nèi)存泄漏，因?yàn)槲覀儧](méi)有用delete操作符手動(dòng)清理內(nèi)存，但是在托管代碼中卻不會(huì)發(fā)生內(nèi)存泄漏，因?yàn)镚C會(huì)自動(dòng)檢測(cè)沒(méi)有引用了的對(duì)象并回收。這里作者推薦你只在實(shí)現(xiàn)IDisposable接口時(shí)配合使用Finalizer，在其他的情況下不要使用（可能會(huì)有特殊情況）。
3. 對(duì)象的復(fù)活
　　什么？回收的對(duì)象也可以"復(fù)活"嗎？沒(méi)錯(cuò)，雖然這么說(shuō)的定義不準(zhǔn)確。讓我們先來(lái)看一段代碼：

復(fù)制代碼代碼如下:

view sourceprint?public class Resurrection {  
  public int Data;  
  public Resurrection(int data) {  
    this.Data = data;  
  }  
  ~Resurrection() {  
    Main.Instance = this;  
  }  
}  
public class Main {  
  public static Resurrection Instance;  
  public static void Main() {  
    Instance = new Resurrection(1);  
    Instance = null;  
    GC.Collect();  
    GC.WaitForPendingFinalizers();  
    // 看到了嗎，在這里“復(fù)活”了。  
    Console.WriteLine(Instance.Data);  
    Instance = null;  
    GC.Collect();  
    Console.ReadLine();  
  }  
} 

　　你可能會(huì)問(wèn)："既然這個(gè)對(duì)象能復(fù)活，那么這個(gè)對(duì)象在程序結(jié)束后會(huì)被回收嗎？"。會(huì)，"為什么？"。讓我們按照GC的工作方式走一遍你就明白是怎么回事了。
　　1、執(zhí)行Collect。檢查引用。沒(méi)問(wèn)題，對(duì)象已經(jīng)沒(méi)有引用了。
　　2、創(chuàng)建新實(shí)例時(shí)已經(jīng)在Finalizer表上作了紀(jì)錄，所以我們檢查到了對(duì)象有Finalizer。
　　3、因?yàn)椴榈搅薋inalizer，所以將記錄移到Finalizer2表上。
　　4、在Finalizer2表上有記錄，所以不釋放內(nèi)存。
　　5、Collect執(zhí)行完畢。這時(shí)我們用了GC.WaitForPendingFinalizers，所以我們將等待所有Finalizer2表上的Finalizers的執(zhí)行。
　　6、Finalizer執(zhí)行后我們的Instance就又引用了我們的對(duì)象。（復(fù)活了）
　　7、再一次去除所有的引用。
　　8、執(zhí)行Collect。檢查引用。沒(méi)問(wèn)題。
　　9、由于上次已經(jīng)將記錄從Finalizer表刪除，所以這次沒(méi)有查到對(duì)象有Finalizer。
　　10、在Finalizer2表上也不存在，所以對(duì)象的內(nèi)存被釋放了。
　　非托管資源的釋放到現(xiàn)在為止，我們說(shuō)了托管內(nèi)存的管理，那么當(dāng)我們利用如數(shù)據(jù)庫(kù)、文件等非托管資源時(shí)呢？這時(shí)我們就要用到.NET Framework中的標(biāo)準(zhǔn)：IDisposable接口。按照標(biāo)準(zhǔn)，所有有需要手動(dòng)釋放非托管資源的類都得實(shí)現(xiàn)此接口。這個(gè)接口只有一個(gè)方法，Dispose()，不過(guò)有相對(duì)的Guidelines指示如何實(shí)現(xiàn)此接口，在這里我向大家說(shuō)一說(shuō)。實(shí)現(xiàn)IDisposable這個(gè)接口的類需要有這樣的結(jié)構(gòu)：

復(fù)制代碼代碼如下:

view sourceprint?public class Base : IDisposable {  
  public void Dispose() {  
    this.Dispose(true);  
    GC.SupressFinalize(this);  
  }  
  protected virtual void Dispose(bool disposing) {  
    if (disposing) {  
      // 托管類  
    }  
    // 非托管資源釋放  
  }  
  ~Base() {  
    this.Dispose(false);  
  }  
}  
public class Derive : Base {  
  protected override void Dispose(bool disposing) {  
    if (disposing) {  
      // 托管類  
    }  
    // 非托管資源釋放  
    base.Dispose(disposing);  
  }  
} 

　　為什么要這樣設(shè)計(jì)呢？讓我在后面解說(shuō)一下?，F(xiàn)在我們講講實(shí)現(xiàn)這個(gè)Dispose方法的幾個(gè)準(zhǔn)則：它不能扔出任何錯(cuò)誤，重復(fù)的調(diào)用也不能扔出錯(cuò)誤。也就是說(shuō)，如果我已經(jīng)調(diào)用了一個(gè)對(duì)象的Dispose，當(dāng)我第二次調(diào)用Dispose的時(shí)候程序不應(yīng)該出錯(cuò)，簡(jiǎn)單地說(shuō)程序在第二次調(diào)用Dispose時(shí)不會(huì)做任何事。這些可以通過(guò)一個(gè)flag或多重if判斷實(shí)現(xiàn)。一個(gè)對(duì)象的Dispose要做到釋放這個(gè)對(duì)象的所有資源。拿一個(gè)繼承類為例，繼承類中用到了非托管資源所以它實(shí)現(xiàn)了IDisposable接口，如果繼承類的基類也用到了非托管資源那么基類也得被釋放，基類的資源如何在繼承類中釋放呢？當(dāng)然是通過(guò)一個(gè)virtual/Overridable方法了，這樣我們能保證每個(gè)Dispose都被調(diào)用到。這就是為什么我們的設(shè)計(jì)有一個(gè)virtual/Overridable的Dispose方法。注意我們首先要釋放繼承類的資源然后再釋放基類的資源。因?yàn)榉峭泄苜Y源一定要被保障正確釋放所以我們要定義一個(gè)Finalizer來(lái)避免程序員忘了調(diào)用Dispose的情況。上面的設(shè)計(jì)就采用了這種形式。如果我們手動(dòng)調(diào)用Dispose方法就沒(méi)有必要再保留Finalizer了，所以在Dispose中我們用了GC.SupressFinalize將對(duì)象從Finalizer表去掉，這樣再回收時(shí)速度會(huì)更快。那么那個(gè)disposing和"托管類"是怎么回事呢？是這樣：在"托管類"中寫(xiě)所有你想在調(diào)用Dispose時(shí)讓其處于可釋放狀態(tài)的托管代碼。還記得我們說(shuō)過(guò)我們不知道托管代碼是什么時(shí)候釋放的嗎？在這里我們只是去掉成員對(duì)象的引用讓它處于可被回收狀態(tài)，并不是直接釋放內(nèi)存。在"托管類"中這里我們也要寫(xiě)上所有實(shí)現(xiàn)了IDisposable的成員對(duì)象，因?yàn)樗麄円灿蠨ispose，所以也需要在對(duì)象的Dispose中調(diào)用他們的Dispose，這樣才能保證第二個(gè)準(zhǔn)則。disposing是為了區(qū)分Dispose的調(diào)用方法，如果我們手動(dòng)調(diào)用那么為了第二個(gè)準(zhǔn)則"托管類"部分當(dāng)然得執(zhí)行，但如果是Finalizer調(diào)用的Dispose，這時(shí)候?qū)ο笠呀?jīng)沒(méi)有任何引用，也就是說(shuō)對(duì)象的成員自然也就不存在了（無(wú)引用），也就沒(méi)有必要執(zhí)行"托管類"部分了，因?yàn)樗麄円呀?jīng)處于可被回收狀態(tài)了。好了，這就是IDisposable接口的全部了?，F(xiàn)在讓我們來(lái)回想一下，以前我們可能認(rèn)為有了Dispose內(nèi)存就會(huì)馬上被釋放，這是錯(cuò)誤的。只有非托管內(nèi)存才會(huì)被馬上釋放，托管內(nèi)存的釋放由GC管理，我們不用管。
4. 弱引用的使用
　　 A = B，我們稱這樣的引用叫做強(qiáng)引用，GC就是通過(guò)檢查強(qiáng)引用來(lái)決定一個(gè)對(duì)象是否是可以回收的。另外還有一種引用稱作弱引用（WeakReference），這種引用不影響GC回收，這就是它的用處所在。你會(huì)問(wèn)到底有什么用處?，F(xiàn)在我們來(lái)假設(shè)我們有一個(gè)很胖的對(duì)象，也就是說(shuō)它占用很多內(nèi)存。我們用過(guò)了這個(gè)對(duì)象，打算將它的引用去掉好讓GC可以回收內(nèi)存，但是功夫不大我們又需要這個(gè)對(duì)象了，沒(méi)辦法，重新創(chuàng)建實(shí)例，怎么創(chuàng)建這么慢??？有什么辦法解決這樣的問(wèn)題？有，將對(duì)象留在內(nèi)存中不就快了嘛！不過(guò)我們不想這樣胖得對(duì)象總占著內(nèi)存，而我們也不想總是創(chuàng)建這樣胖的新實(shí)例，因?yàn)檫@樣很耗時(shí)。那怎么辦……？聰明的朋友一定已經(jīng)猜到了我要說(shuō)解決方法是弱引用。不錯(cuò)，就是它。我們可以創(chuàng)建一個(gè)這個(gè)胖對(duì)象的弱引用，這樣在內(nèi)存不夠時(shí)GC可以回收，不影響內(nèi)存使用，而在沒(méi)有被GC回收前我們還可以再次利用該對(duì)象。這里有一個(gè)示例：

復(fù)制代碼代碼如下:

view sourceprint?public class Fat {  
  public int Data;  
  public Fat(int data) {  
    this.Data = data;  
  }  
}  
public class Main {  
  public static void Main() {  
    Fat oFat = new Fat(1);  
    WeakReference oFatRef = new WeakReference(oFat);  
    // 從這里開(kāi)始，F(xiàn)at對(duì)象可以被回收了。  
    oFat = null;  
    if (oFatRef.IsAlive) {  
      Console.WriteLine(((Fat) oFatRef.Target).Data); // 1  
    }  
    // 強(qiáng)制回收。  
    GC.Collect();  
    Console.WriteLine(oFatRef.IsAlive); // False  
    Console.ReadLine();  
  }  
} 

　　這里我們的Fat其實(shí)并不是很胖，但是可以體現(xiàn)示例的本意：如何使用弱引用。那如果Fat有Finalizer呢，會(huì)怎樣？如果Fat有Finalizer那么我們可能會(huì)用到WeakReference的另一個(gè)構(gòu)造函數(shù)，當(dāng)中有一參數(shù)叫做TrackResurrection，如果是True，只要Fat的內(nèi)存沒(méi)被釋放我們就可以用它，也就是說(shuō)Fat的Finalizer執(zhí)行后我們還是可以恢復(fù)Fat（相當(dāng)于第一次回收操作后還可恢復(fù)Fat）；如果TrackResurrection是False，那么第一次回收操作后就不能恢復(fù)Fat對(duì)象了。
5. 總結(jié)
　　我在這里寫(xiě)出了正篇文章的要點(diǎn)：
一個(gè)對(duì)象只當(dāng)在沒(méi)有任何引用的情況下才會(huì)被回收。
一個(gè)對(duì)象的內(nèi)存不是馬上釋放的，GC會(huì)在任何時(shí)候?qū)⑵浠厥?。一般情況下不要強(qiáng)制回收工作。
如果沒(méi)有特殊的需要不要寫(xiě)Finalizer。
不要在Finalizer中寫(xiě)一些有時(shí)間邏輯的代碼。
在任何有非托管資源或含有Dispose的成員的類中實(shí)現(xiàn)IDisposable接口。
按照給出的Dispose設(shè)計(jì)寫(xiě)自己的Dispose代碼。
當(dāng)用胖對(duì)象時(shí)可以考慮弱引用的使用。

您可能感興趣的文章: