關(guān)于.NET的集合總結(jié)
集合是一些有共同特征的獨(dú)立數(shù)據(jù)項(xiàng)組成的,通過(guò)集合,我們可以可以使用相同的調(diào)用代碼來(lái)處理一個(gè)集合的所有元素,而不用單獨(dú)處理每一個(gè)單獨(dú)的項(xiàng)。.net的集合諸如(System.Array類(lèi)以及 System.Collections命名空間)數(shù)組、列表、隊(duì)列、堆棧、哈希表、字典甚至(System.Data下)DataSet、DataTable,還有2.0中加入的集合的泛型版本(System.Collections.Generic和 System.Collections.ObjectModel),4.0中引入的有效線程安全操作的集合(System.Collections.Concurrent)。
面對(duì)這么多的集合,你了解各個(gè)集合有哪些優(yōu)勢(shì),在一個(gè)特定的場(chǎng)景中使用哪個(gè)集合嗎?本文試圖探討一下這個(gè)問(wèn)題,泛泛而談,不涉及深入的內(nèi)存數(shù)據(jù)結(jié)構(gòu)的追究,希望能給大家?guī)?lái)一些益處。
集合接口
在分別討論各種集合之前,我們先討論一下集合的共性,整個(gè)集合體系的繼承層次。
ICollection 接口是 System.Collections 命名空間中類(lèi)的基接口,而相應(yīng)的ICollection<T>是所有泛型版本集合的基接口。所有的的集合類(lèi)都直接或間接的繼承他們。
ICollection又繼承IEnumerable,來(lái)提供方便的枚舉功能,不過(guò)更值得注意ICollection提供同步訪問(wèn)的線程安全性控制:
IsSynchronized:獲取一個(gè)值,該值指示是否同步對(duì) ICollection 的訪問(wèn)(線程安全)。
SyncRoot:獲取可用于同步對(duì) ICollection 的訪問(wèn)的對(duì)象。
例如,我們可以通過(guò)以下來(lái)對(duì)集合進(jìn)行線程安全訪問(wèn),不過(guò)有些集合提供Synchronized方法來(lái)提供線程安全集合的封裝。
ICollection myCollection = someCollection;
lock(myCollection.SyncRoot)
{
// Insert your code here.
}
不過(guò)默認(rèn)情況下集合不是線程安全的。如果需要對(duì)集合進(jìn)行可伸縮的且高效的多線程訪問(wèn),請(qǐng)使用System.Collections.Concurrent命名空間中的某個(gè)類(lèi)。
而與非泛型版本不同的是,泛型版本的集合除了實(shí)現(xiàn)了泛型的接口外,也實(shí)現(xiàn)了非泛型的相應(yīng)的接口。如ICollection<T>實(shí)現(xiàn)了IEnumerable和IEnumerable<T>,但是泛型集合卻沒(méi)有提供同步訪問(wèn)的線程安全控制,也就是說(shuō)泛型集合的同步訪問(wèn),我們必須自己去處理同步或使用System.Collections.Concurrent命名空間中的某個(gè)類(lèi)。
另外,IList和IDictionary分別繼承自ICollection,IList的實(shí)現(xiàn)者(如Array、ArrayList 或 List<T>等)和ICollection的實(shí)現(xiàn)者(例如 Queue、ConcurrentQueue<T>、Stack、 ConcurrentStack<T>或 LinkedList<T>)的每個(gè)元素都是一個(gè)值,而IDictionary的實(shí)現(xiàn)者(例如 Hashtable 和 SortedList 類(lèi)、Dictionary<TKey, TValue> 和 SortedList<TKey, TValue> 泛型類(lèi))每個(gè)元素都是一個(gè)鍵值對(duì)。
接下來(lái),我們將分別討論和比較下一些常用的集合。
數(shù)組Array
Array不是System.Collections的一部分,但是它繼承自IList接口。.net的Array可以有多維數(shù)組、交錯(cuò)數(shù)組,甚至創(chuàng)建下限不是0是數(shù)組,默認(rèn)情況下推薦使用下限是0的一維數(shù)組,這常用的數(shù)組是經(jīng)過(guò)優(yōu)化的,性能最高。
與System.Collections集合不同的是,Array具有固定的容量,若要增加容量,您必須創(chuàng)建具有所需容量的新 Array 對(duì)象,將舊 Array 對(duì)象中的元素復(fù)制到新對(duì)象中,然后刪除該舊 Array。而System.Collections下的集合在達(dá)到當(dāng)前容量時(shí)可自動(dòng)擴(kuò)充容量:內(nèi)存被重新分配,元素從舊集合復(fù)制到新集合中。 這減少了使用集合所需的代碼,但是,集合的性能可能仍受到消極影響。 因此我們應(yīng)將初始容量設(shè)置為集合的估計(jì)的大小以避免因多次重新分配導(dǎo)致的不佳性能。
System.Collections下的集合類(lèi)
該類(lèi)型的集合都具有排序功能且大多數(shù)經(jīng)過(guò)了索引。能自動(dòng)處理內(nèi)存管理,容量按需擴(kuò)大。
ArrayList和List<T>:List<T>是ArrayList的泛型版本,它們和Array一樣都是基于索引訪問(wèn),每個(gè)數(shù)據(jù)項(xiàng)只保存一個(gè)數(shù)據(jù)值,但是它們提供比Array更強(qiáng)大的功能和操作,使得它們也更容易使用。性能方面,泛型版本總是比非泛型更優(yōu)先采用,除非成員類(lèi)型是object類(lèi)型,因?yàn)榉盒桶姹久獬搜b箱和拆箱的操作;在不需要重新分配集合容量的情況下,List<T>的性能與同類(lèi)型的數(shù)組十分相近。另外,ArrayList可以很方便的創(chuàng)建同步版本,但Array和List<T>的同步工作必須有自己完成。
Hashtable 和 Dictionary 集合類(lèi)型:這些集合每個(gè)項(xiàng)是一個(gè)鍵值對(duì)。Dictionary<Tkey,Tvalue>是Hashtable的泛型版本。Hashtable對(duì)象是由包含集合元素的存儲(chǔ)桶組成的,每個(gè)存儲(chǔ)桶與使用元素鍵基于哈希函數(shù)生成的一個(gè)哈希碼關(guān)聯(lián),包含多個(gè)元素。因此這類(lèi)集合比其它的大多數(shù)集合在搜索和檢索數(shù)據(jù)上更快捷。而同樣的Dictionary<Tkey,Tvalue>總是比Hashtable性能更好,因此推薦使用,多線程同步使用ConcurrentDictionary<TKey, TValue>類(lèi)。
已排序的集合類(lèi)型:System.Collections.SortedList 類(lèi)、System.Collections.Generic.SortedList<TKey, TValue> 泛型類(lèi)和System.Collections.Generic.SortedDictionary<TKey, TValue> 泛型類(lèi),它們都實(shí)現(xiàn) IDictionary 接口,兩個(gè)泛型類(lèi)還實(shí)現(xiàn)了System.Collections.Generic.IDictionary<TKey, TValue>,與Hashtable類(lèi)似每個(gè)元素都是一個(gè)鍵值對(duì),但是它們以基于鍵的排序順序維護(hù)元素,并沒(méi)有哈希表的 O(1) 插入和檢索特性。非泛型的枚舉項(xiàng)是DictionaryEntry 對(duì)象,而兩個(gè)泛型類(lèi)型返回 KeyValuePair<TKey, TValue> 對(duì)象。它們最重要的重點(diǎn)是它們是按照System.Collections.IComparer實(shí)現(xiàn)或System.Collections.Generic.IComparer<T>的實(shí)現(xiàn)排好序的。SortedList允許我們通過(guò)索引和鍵訪問(wèn),而SortedDictionary只能通過(guò)鍵訪問(wèn),SortedList還更省內(nèi)存。
隊(duì)列和堆棧:就不多做介紹了,如果要臨時(shí)存儲(chǔ)數(shù)據(jù),數(shù)據(jù)只在訪問(wèn)一次后就放棄,就可以使用這類(lèi)集合。隊(duì)列和堆棧的差別就在于訪問(wèn)的先后不一樣,相信大家都很清楚了。他們也分別有各自的泛型版本和線程安全版本:System.Collections.Queue 類(lèi)、System.Collections.Generic.Queue<T> 類(lèi)和System.Collections.Concurrent.ConcurrentQueue<T>,System.Collections.Stack類(lèi)以及 System.Collections.Generic.Stack<T> 和System.Collections.Concurrent.ConcurrentStack<T>。
Set集合:該類(lèi)型集合的兩個(gè)類(lèi)型HashSet<T> 和 SortedSet<T>,都實(shí)現(xiàn)了ISet<T>接口。Set集合最接近于數(shù)學(xué)中的集合,專(zhuān)門(mén)用于實(shí)現(xiàn)了數(shù)學(xué)的Set操作,如并集、交集等運(yùn)算。其中Hashset<T>沒(méi)有排序,不能有重復(fù)元素,可以視為Dictionary<TKey,TValue>的不包含值的版本,基于哈希鍵提供高性能的Set運(yùn)算。而SortedSet<T>提供排好序的Set操作的集合。這里要提的是有些集合也提供了Set運(yùn)算的擴(kuò)展方法和LINQ也提供的Set運(yùn)算,不過(guò)它們都返回新 的IEnumerable<T>集合,而Set集合的Set操作都是修改當(dāng)前集合,并且提供一個(gè)更大、更可靠的運(yùn)算集合。
這并不是.net集合的全部,它還有位集合和專(zhuān)用集合。
位集合
它的每個(gè)元素是一個(gè)標(biāo)識(shí)位,而不是對(duì)象。其中有BitVector32和BitArray。
BitVector32是一個(gè)結(jié)構(gòu),只能存儲(chǔ)32位數(shù)據(jù),可用來(lái)存儲(chǔ)位標(biāo)識(shí)或小整數(shù),它是值類(lèi)型,因此性能更好。
而B(niǎo)itArray是引用類(lèi)型,它的容量始終與計(jì)數(shù)相同,可以通過(guò)Length屬性來(lái)分配或刪除元素。
專(zhuān)用集合
NameValueCollection 基于 NameObjectCollectionBase;但NameValueCollection 接受一鍵多值,而 NameObjectCollectionBase 只接受一鍵一值。
System.Collections.Specialized 命名空間中的一些強(qiáng)類(lèi)型集合包括 StringCollection 和 StringDictionary,它們都包含完全是字符串的值集合和字典。
CollectionsUtil 類(lèi)提供一系列靜態(tài)方法可以用來(lái)創(chuàng)建不區(qū)分大小寫(xiě)的Hashtable或SortedList集合的實(shí)例。
有些集合可以轉(zhuǎn)換。例如,HybridDictionary 類(lèi)起初是 ListDictionary,增大后就變?yōu)?Hashtable。
另外,KeyedCollection<TKey, TItem> 是介于列表和字典之間的混合類(lèi)型,它提供了一種存儲(chǔ)包含自己鍵的對(duì)象的方法,當(dāng)元素?cái)?shù)目達(dá)到指定閾值時(shí),它也可以創(chuàng)建查找字典。
ListDictionary:使用單向鏈接列表實(shí)現(xiàn) IDictionary。建議為通常包括少于 10 個(gè)項(xiàng)目的集合,當(dāng)數(shù)據(jù)項(xiàng)較少時(shí),提供比Hashtable更好的性能。
LINQ to Objects
我們可以使用 LINQ 查詢來(lái)訪問(wèn)內(nèi)存中的實(shí)現(xiàn)了System.Collections.IEnumerable 或 System.Collections.Generic.IEnumerable<T> 接口對(duì)象。
它提供了一種通用的數(shù)據(jù)訪問(wèn)模式;與標(biāo)準(zhǔn) foreach 循環(huán)相比,它通常更加簡(jiǎn)潔,可讀性更高;提供了強(qiáng)大的篩選、排序和分組功能。
如何抉擇
我們首先要明確,如果存在泛型版本,優(yōu)先使用。
選擇之前請(qǐng)先確定幾個(gè)問(wèn)題:
是否需要按序列訪問(wèn),元素在訪問(wèn)后放棄?
訪問(wèn)的順序是先進(jìn)先出或后進(jìn)先出、隨機(jī)訪問(wèn)?
是基于索引的訪問(wèn),還是基于鍵的訪問(wèn)?
是只有值,還是鍵值對(duì)形式?
是一對(duì)一,還是一對(duì)多?
是否允許重復(fù)?
是按進(jìn)入的順序保存,還是需要按一定的規(guī)則排好序的,還是無(wú)所謂?
是否需要更快速度的檢索和訪問(wèn)?
相關(guān)文章
動(dòng)態(tài)組合SQL語(yǔ)句方式實(shí)現(xiàn)批量更新的實(shí)例
動(dòng)態(tài)組合SQL語(yǔ)句方式實(shí)現(xiàn)批量更新的實(shí)例,需要的朋友可以參考一下2013-03-03ASP.NET Core WebAPI實(shí)現(xiàn)本地化(單資源文件)
這篇文章主要介紹了ASP.NET Core WebAPI實(shí)現(xiàn)本地化(單資源文件),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-06-06ASP.NET 頁(yè)面刷新和定時(shí)跳轉(zhuǎn)代碼整理
很多是摘網(wǎng)上的但是我整理了一下。以便以后查閱。2009-12-12gridview和checkboxlist的嵌套相關(guān)應(yīng)用
gridview和checkboxlist的嵌套使用,會(huì)有效的提高開(kāi)發(fā)的效率,不過(guò)很多的童鞋們對(duì)此還是很陌生的,接下來(lái)將幫助童鞋們實(shí)現(xiàn)gridview和checkboxlist的嵌套使用,感興趣的朋友可以了解下,或許對(duì)你有所幫助2013-02-02.NET更新Xml中CDATA內(nèi)容的方法實(shí)例
這篇文章介紹了.NET更新Xml中CDATA內(nèi)容的方法實(shí)例,有需要的朋友可以參考一下2013-07-07ASP.NET 鏈接 Access 數(shù)據(jù)庫(kù)路徑問(wèn)題最終解決方案
ASP.NET 鏈接 Access 數(shù)據(jù)庫(kù)路徑問(wèn)題最終解決方案...2007-04-04ASP.NET 2.0服務(wù)器控件開(kāi)發(fā)之復(fù)雜屬性
ASP.NET 2.0服務(wù)器控件開(kāi)發(fā)之復(fù)雜屬性...2006-09-09