詳解GO語言中[]byte與string的兩種轉(zhuǎn)換方式和底層實現(xiàn)
看過小許之前的文章《fasthttp是如何做到比net/http快十倍的》,相信你們還對極致的優(yōu)化方式意猶未盡。
不過你發(fā)現(xiàn)沒fasthttp關(guān)于string和[]byte的轉(zhuǎn)換方式和大家平常普遍使用的方式不一樣,fasthttp轉(zhuǎn)換實現(xiàn)如下:
//[]byte轉(zhuǎn)string func b2s(b []byte) string { return *(*string)(unsafe.Pointer(&b)) } //string轉(zhuǎn)[]byte func s2b(s string) (b []byte) { bh := (*reflect.SliceHeader)(unsafe.Pointer(&b)) sh := (*reflect.StringHeader)(unsafe.Pointer(&s)) bh.Data = sh.Data bh.Cap = sh.Len bh.Len = sh.Len return b }
為什么不用我們常見的string和[]byte的轉(zhuǎn)換方式呢?這樣做是怎么提高性能的呢?...
帶著這些疑問,今天將分享下并總結(jié)string和[]byte的轉(zhuǎn)換方式,不同的轉(zhuǎn)換方式之間的實現(xiàn)和區(qū)別!
兩種轉(zhuǎn)換方式
如果此時此刻你剛好遇到面試官問你string和[]byte如何進行轉(zhuǎn)換,有幾種方式?你能答上來嗎
反正在寫這篇文章之前小許估計是答不出來的,哈哈!
畢竟知道的越多,不知道的也越多嘛
那今天我們就來聊聊,繼續(xù)往下讀之前,我們先了解下這兩種數(shù)據(jù)類型:
string和[]byte
上圖中可以看出 stringStruct和slice還是有一些相似之處,str和array指針指向底層數(shù)組的地址,len代表的就是數(shù)組長度。
關(guān)于string類型,在go標準庫中官方說明如下:
// string is the set of all strings of 8-bit bytes, conventionally but not // necessarily representing UTF-8-encoded text. A string may be empty, but // not nil. Values of string type are immutable. type string string
string是8位字節(jié)的集合,string的定義在上圖中左側(cè),通常但不一定代表UTF-8編碼的文本。string可以為空,但是不能為nil,并且string的值是不能改變的。
為什么string類型沒有cap字段
string的不可變性,也就不能直接向底層數(shù)組追加元素,所以不需要Cap。
而[]byte就是一個byte類型的切片,切片本質(zhì)也是一個結(jié)構(gòu)體。
這里我們先記住下這兩種數(shù)據(jù)類型的特點,對后面的了解兩者的轉(zhuǎn)換有幫助!
標準方式
Golang中string與[]byte的互換,這是我們常用的,也是立馬能想到的轉(zhuǎn)換方式,這種方式稱為標準方式。
// string 轉(zhuǎn) []byte s1 := "xiaoxu" b := []byte(s1) // []byte 轉(zhuǎn) string s2 := string(b)
那還有其他方式嗎?當然有的,那就是強轉(zhuǎn)換
強轉(zhuǎn)換方式
強轉(zhuǎn)換方式是通過unsafe和reflect包來實現(xiàn)的,代碼如下:
//[]byte轉(zhuǎn)string func b2s(b []byte) string { return *(*string)(unsafe.Pointer(&b)) } //string轉(zhuǎn)[]byte func s2b(s string) (b []byte) { bh := (*reflect.SliceHeader)(unsafe.Pointer(&b)) sh := (*reflect.StringHeader)(unsafe.Pointer(&s)) bh.Data = sh.Data bh.Cap = sh.Len bh.Len = sh.Len return b }
可以看出利用reflect.SliceHeader(代表一個運行時的切片) 和 unsafe.Pointer進行指針替換。
為什么可以這么做呢?
前面我們在講string和[]byte類型的時候就提了,因為兩者的底層結(jié)構(gòu)的字段相似!
array和str的len是一致的,而唯一不同的就是cap字段,所以他們的內(nèi)存布局上是對齊的。
分析
我們看下這兩種轉(zhuǎn)換方式底層是如何實現(xiàn)的,這些實現(xiàn)代碼在標準庫中都是有的,下面底層實現(xiàn)的代碼來自Go 1.18.6版本。
標準方式底層實現(xiàn)
string轉(zhuǎn)[]byte底層實現(xiàn)
先看string轉(zhuǎn)[]byte的實現(xiàn),(實現(xiàn)源碼在 src/runtime/string.go 中)
const tmpStringBufSize = 32 //長度32的數(shù)組 type tmpBuf [tmpStringBufSize]byte //時間函數(shù) func stringtoslicebyte(buf *tmpBuf, s string) []byte { var b []byte //判斷字符串長度是否小于等于32 if buf != nil && len(s) <= len(buf) { *buf = tmpBuf{} b = buf[:len(s)] } else { //預定義數(shù)組長度不夠,重新分配內(nèi)存 b = rawbyteslice(len(s)) } copy(b, s) return b } // rawbyteslice allocates a new byte slice. The byte slice is not zeroed. //rawbyteslice函數(shù) 分配一個新的字節(jié)片。字節(jié)片未歸零 func rawbyteslice(size int) (b []byte) { cap := roundupsize(uintptr(size)) p := mallocgc(cap, nil, false) if cap != uintptr(size) { memclrNoHeapPointers(add(p, uintptr(size)), cap-uintptr(size)) } *(*slice)(unsafe.Pointer(&b)) = slice{p, size, int(cap)} return }
上面代碼可以看出string轉(zhuǎn)[]byte是,會根據(jù)字符串長度來決定是否需要重新分配一塊內(nèi)存。
• 預先定義了一個長度為32的數(shù)組
• 若字符串的長度不超過這個長度32的數(shù)組,copy函數(shù)實現(xiàn)string到[]byte的拷貝
• 若字符串的長度超過了這個長度32的數(shù)組,重新分配一塊內(nèi)存了,再進行copy
[]byte轉(zhuǎn)string底層實現(xiàn)
再看[]byte轉(zhuǎn)string的實現(xiàn),(實現(xiàn)源碼在 src/runtime/string.go 中)
const tmpStringBufSize = 32 //長度32的數(shù)組 type tmpBuf [tmpStringBufSize]byte //實現(xiàn)函數(shù) func slicebytetostring(buf *tmpBuf, ptr *byte, n int) (str string) { ... if n == 1 { p := unsafe.Pointer(&staticuint64s[*ptr]) if goarch.BigEndian { p = add(p, 7) } stringStructOf(&str).str = p stringStructOf(&str).len = 1 return } var p unsafe.Pointer //判斷字符串長度是否小于等于32 if buf != nil && n <= len(buf) { p = unsafe.Pointer(buf) } else { p = mallocgc(uintptr(n), nil, false) } stringStructOf(&str).str = p stringStructOf(&str).len = n //拷貝byte數(shù)組至字符串 memmove(p, unsafe.Pointer(ptr), uintptr(n)) return }
跟string轉(zhuǎn)[]byte一樣,當數(shù)組長度超過32時,同樣需要調(diào)用mallocgc分配一塊新內(nèi)存
強轉(zhuǎn)換底層實現(xiàn)
從標準的轉(zhuǎn)換方式中,我們知道如果字符串長度超過32的話,會重新分配一塊新內(nèi)存,進行內(nèi)存拷貝。
//string轉(zhuǎn)[]byte func s2b(s string) (b []byte) { bh := (*reflect.SliceHeader)(unsafe.Pointer(&b)) sh := (*reflect.StringHeader)(unsafe.Pointer(&s)) bh.Data = sh.Data bh.Cap = sh.Len bh.Len = sh.Len return b }
強轉(zhuǎn)換過程中,通過 神奇的unsafe.Pointer指針
• 任何類型的指針 *T 都可以轉(zhuǎn)換為unsafe.Pointer類型的指針,可以存儲任何變量的地址
• unsafe.Pointer 類型的指針也可以轉(zhuǎn)換回普通指針,并且可以和類型*T不相同
refletc包的 reflect.SliceHeader 和 reflect.StringHeader分別代表什么意思?
reflect.SliceHeader:slice類型的運行時表示形式
reflect.StringHeader:string類型的運行時表示形式
//slice在運行時的描述符 type SliceHeader struct { Data uintptr Len int Cap int } //string在運行時的描述符 type StringHeader struct { Data uintptr Len int }
*(reflect.SliceHeader)(unsafe.Pointer(&b)) 的目的就是通過unsafe.Pointer 把它們轉(zhuǎn)換為 *reflect.SliceHeader 指針。
而運行時表現(xiàn)形式 SliceHeader 和 StringHeader,而這兩個結(jié)構(gòu)體都有一個 Data 字段,用于存放指向真實內(nèi)容的指針。
[]byte 和 string之間的轉(zhuǎn)換,就可以理解為是通過 unsafe.Pointer 把 *SliceHeader 轉(zhuǎn)為 *StringHeader,也就是 *[]byte 和 *string之間的轉(zhuǎn)換。
那么我們就可以理解相對于標準轉(zhuǎn)換方式,強轉(zhuǎn)換方式的優(yōu)點在哪了!
直接替換指針的指向,避免了申請新內(nèi)存(零拷貝),因為兩者指向的底層字段Data地址相同
總結(jié)
今天和大家一起了解了[]byte和string類型,以及[]byte和string的兩種轉(zhuǎn)換方式。
不過Go語言提供給我們使用的還是標準轉(zhuǎn)換方式,主要是因為在你不確定安全隱患的情況下,使用強轉(zhuǎn)化方式可能不必要的問題。
不過像fasthttp那樣,對程序?qū)\行性能有高要求,那就可以考慮使用強轉(zhuǎn)換方式!
到此這篇關(guān)于詳解GO語言中[]byte與string的兩種轉(zhuǎn)換方式和底層實現(xiàn)的文章就介紹到這了,更多相關(guān)GO byte與string轉(zhuǎn)換內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Kubernetes上使用Jaeger分布式追蹤基礎(chǔ)設(shè)施詳解
這篇文章主要為大家介紹了Kubernetes上使用Jaeger分布式追蹤基礎(chǔ)設(shè)施詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2023-03-03Go語言實現(xiàn)廣播式并發(fā)聊天服務(wù)器
本文主要介紹了Go語言實現(xiàn)廣播式并發(fā)聊天服務(wù)器,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2024-08-08Golang運行報錯找不到包:package?xxx?is?not?in?GOROOT的解決過程
這篇文章主要給大家介紹了關(guān)于Golang運行報錯找不到包:package?xxx?is?not?in?GOROOT的解決過程,文中通過圖文介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下2022-07-07