.NET中的字符串在內(nèi)存中的存儲方式
毫無疑問,字符串是我們使用頻率最高的類型。但是如果我問大家一個問題:“一個字符串對象在內(nèi)存中如何表示的?”,我相信絕大部分人回答不上來。我們今天就來討論這個問題。
一、字符串對象的內(nèi)存布局
從“值類型”和“引用類型”來劃分,字符串自然屬于引用類型的范疇,所以一個字符串對象自然采用引用類型的內(nèi)存布局。我在很多文章中都介紹過引用類型實(shí)例的內(nèi)存布局(《以純二進(jìn)制的形式在內(nèi)存中繪制一個對象》 和《如何將一個實(shí)例的內(nèi)存二進(jìn)制內(nèi)容讀出來?》,總的來說整個內(nèi)存布局分三塊:ObjHeader + TypeHandle + Payload。對于一般的引用類型實(shí)例來說,最后一部分存放的就是該實(shí)例所有字段的值,但是字符串有點(diǎn)特別,它有哪些字段呢?
說到這里,可能有人想去反編譯一下String類型,看看它定義了那些字段。其實(shí)沒有必要,字符串這個類型有點(diǎn)特別,它的Payload部分由兩部分組成:字符串長度(不是字節(jié)長度)+編碼的文本,下圖揭示了字符串對象的內(nèi)存布局。那么具體采用怎樣的編碼方式呢?可能很多人會認(rèn)為是UTF-8,實(shí)在不然,它采用的是UTF-16,大部分字符通過兩個字節(jié)來表示,少數(shù)的則需要使用四個字節(jié)。至于字節(jié)序,自然是使用小端字節(jié)序。

二、以二進(jìn)制的方式創(chuàng)建一個String對象
在《以純二進(jìn)制的形式在內(nèi)存中繪制一個對象》中,我們通過構(gòu)建一個字節(jié)數(shù)組來表示創(chuàng)建的對象,現(xiàn)在我們依然可以采用類似的方式來創(chuàng)建一個真正的String對象。如下所示的AsString方法用來將用于承載字符串實(shí)例的字節(jié)數(shù)組轉(zhuǎn)換成一個String對象,至于這個字節(jié)數(shù)組的構(gòu)建,則有CreateString方法完成。CreateString方法根據(jù)指定的字符串內(nèi)容創(chuàng)建一個String對象,并利用輸出參數(shù)返回該對象映射在內(nèi)存中的字節(jié)數(shù)組。
static unsafe string CreateString(string value, out byte[] bytes)
{
var byteCount = Encoding.Unicode.GetByteCount(value);
// ObjHeader + TypeHandle + Length + Encoded string
var size = sizeof(nint) + sizeof(nint) + sizeof(int) + byteCount;
bytes = new byte[size];
// TypeHandle
BinaryPrimitives.WriteInt64LittleEndian(bytes.AsSpan(sizeof(nint)), typeof(string).TypeHandle.Value.ToInt64());
// Length
BinaryPrimitives.WriteInt32LittleEndian(bytes.AsSpan(sizeof(nint) * 2), value.Length);
// Encoded string
Encoding.Unicode.GetBytes(value).CopyTo(bytes, 20);
return AsString(bytes);
}
static unsafe string AsString(byte[] bytes)
{
string s = null!;
Unsafe.Write(Unsafe.AsPointer(ref s), new IntPtr(Unsafe.AsPointer(ref bytes[8])));
return s;
}由于我們需要創(chuàng)建一個字節(jié)數(shù)組來表示String對象,所以必須先計(jì)算出這個字節(jié)數(shù)組的長度。我們在上面說過,String類型采用UTF-16/Unicode編碼方式,所以我們調(diào)用Encoding.Unicode的GetByteCont方法可以計(jì)算出指定的字符串編碼后的字節(jié)數(shù)。在此基礎(chǔ)上我們還需要加上通過一個整數(shù)(sizeof(int))表示字符串長度和TypeHandle(sizeof(nint))和ObjHeader(sizeof(nint),含padding),就是整個String實(shí)例在內(nèi)存中占用的字節(jié)數(shù)。
接下來我們填充String類型的TypeHandle的值(String類型方法表地址)、字符串長度和編碼后的字節(jié),最終將填充好的字節(jié)數(shù)組作為參數(shù)調(diào)用AsString方法,返回的就是我們創(chuàng)建的String對象。CreateString方法針字符串對象的創(chuàng)建可以通過如下的代碼來驗(yàn)證。
var literal = "foobar"; string s = CreateString(literal, out var bytes); Debug.Assert(literal == s);
對于上面定義的AsString方法來說,作為輸入?yún)?shù)的字節(jié)數(shù)組字符串實(shí)例的內(nèi)存片段,所以該方法針對同一個數(shù)組返回的都是同一個實(shí)例,如下的演示代碼證明了這一點(diǎn)。
var literal = "foobar"; CreateString(literal, out var bytes); var s1 = AsString(bytes); var s2 = AsString(bytes); Debug.Assert(ReferenceEquals(s1,s2));
三、字符串的“可變性”
我們都知道字符串一經(jīng)創(chuàng)建就不會改變,但是對于上面創(chuàng)建的字符串來說,由于我們都將承載字符串實(shí)例的內(nèi)存字節(jié)都拿捏住了,那還不是想怎么改就怎么改。比如在如下所示的代碼片段中,我們將同一個字符串的文本從“foo”改成了“bar”。
var literal = "foo";
var s = CreateString(literal, out var bytes);
Debug.Assert(s == "foo");
Encoding.Unicode.GetBytes("bar").CopyTo(bytes, 20);
Debug.Assert(s == "bar");到此這篇關(guān)于.NET的字符串在內(nèi)存中是如何存儲的嗎?的文章就介紹到這了,更多相關(guān).NET字符串內(nèi)存存儲內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- .net core EF Core調(diào)用存儲過程的方式
- C# Ado.net實(shí)現(xiàn)讀取SQLServer數(shù)據(jù)庫存儲過程列表及參數(shù)信息示例
- .net core2.0下使用Identity改用dapper存儲數(shù)據(jù)(實(shí)例講解)
- ASP.NET MVC用存儲過程批量添加修改數(shù)據(jù)操作
- asp.net中調(diào)用存儲過程的方法
- asp.net中調(diào)用oracle存儲過程的方法
- VB.NET調(diào)用MySQL存儲過程并獲得返回值的方法
- .Net下二進(jìn)制形式的文件(圖片)的存儲與讀取詳細(xì)解析
相關(guān)文章
ASP.NET Core環(huán)境變量和啟動設(shè)置的配置教程
這篇文章主要為大家詳細(xì)介紹了ASP.NET Core環(huán)境變量和啟動設(shè)置的配置教程,具有一定的參考價值,感興趣的小伙伴們可以參考一下2017-07-07
Asp.net SignalR創(chuàng)建實(shí)時聊天應(yīng)用程序
這篇文章主要介紹了Asp.net SignalR創(chuàng)建實(shí)時聊天應(yīng)用程序,具有一定的參考價值,感興趣的小伙伴們可以參考一下2016-11-11
Asp.NET Core 如何調(diào)用WebService的方法
這篇文章主要介紹了Asp.NET Core 如何調(diào)用WebService的方法,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2018-08-08

