Golang基礎(chǔ)教程之字符串string實例詳解
1、 string的定義
Golang中的string的定義在reflect包下的value.go中,定義如下:
StringHeader 是字符串的運(yùn)行時表示,其中包含了兩個字段,分別是指向數(shù)據(jù)數(shù)組的指針和數(shù)組的長度。
// StringHeader is the runtime representation of a string. // It cannot be used safely or portably and its representation may // change in a later release. // Moreover, the Data field is not sufficient to guarantee the data // it references will not be garbage collected, so programs must keep // a separate, correctly typed pointer to the underlying data. type StringHeader struct { Data uintptr Len int }
2、string不可變
Golang中的字符串是不可變的,不能通過索引下標(biāo)的方式修改字符串中的數(shù)據(jù):
運(yùn)行代碼,可以看到編譯器報錯,string是不可變的
但是能不能進(jìn)行一些騷操作來改變元素的值呢?
package main import ( "fmt" "reflect" "unsafe" ) func main() { a := "hello,world" b := a[6:] bptr := (*reflect.StringHeader) (unsafe.Pointer(&b)) fmt.Println(a) fmt.Println(b) *(*byte)(unsafe.Pointer(bptr.Data)) = '.' fmt.Println(a) fmt.Println(b) } // 運(yùn)行結(jié)果 hello,world world unexpected fault address 0x49d7e3 fatal error: fault [signal 0xc0000005 code=0x1 addr=0x49d7e3 pc=0x4779fa] goroutine 1 [running]: runtime.throw(0x49c948, 0x5) C:/Program Files/Go/src/runtime/panic.go:1117 +0x79 fp=0xc0000dbe90 sp=0xc0000dbe60 pc=0x405fd9 runtime.sigpanic() C:/Program Files/Go/src/runtime/signal_windows.go:245 +0x2d6 fp=0xc0000dbee8 sp=0xc0000dbe90 pc=0x4189f6 main.main() F:/go_workspace/src/code/string_test/main.go:20 +0x13a fp=0xc0000dbf88 sp=0xc0000dbee8 pc=0x4779fa runtime.main() C:/Program Files/Go/src/runtime/proc.go:225 +0x256 fp=0xc0000dbfe0 sp=0xc0000dbf88 pc=0x4087f6 runtime.goexit() C:/Program Files/Go/src/runtime/asm_amd64.s:1371 +0x1 fp=0xc0000dbfe8 sp=0xc0000dbfe0 pc=0x435da1 Process finished with the exit code 2
在上面的代碼中,因為在go語言中不能進(jìn)行指針的加減運(yùn)算,因此取切片,讓b的Data指針指向’,'所在的位置。然后把"hello,world"中的逗號改為點(diǎn),但是發(fā)現(xiàn)還是不行,程序直接崩潰了??磥韌o語言中的指針得到了大大的限制,設(shè)計者并不想讓程序員過度使用指針來寫出一些不安全的代碼。
3、使用string給另一個string賦值
Golang中的字符串的賦值并不是拷貝底層的字符串?dāng)?shù)組,而是數(shù)組指針和長度字段的拷貝。例如:當(dāng)我們定義了一個字符串 a := “hello,world” 然后定義了 b := a 底層所做的操作只是創(chuàng)建了兩個StringHeader的結(jié)構(gòu)體,它們的Data字段都指向同一段數(shù)據(jù),如下圖:
我們可以利用代碼來證實這一點(diǎn):
package main import ( "fmt" "reflect" "unsafe" ) func main() { a := "hello,world" b := a fmt.Println(a) fmt.Println(b) aptr := (*reflect.StringHeader) (unsafe.Pointer(&a)) bptr := (*reflect.StringHeader) (unsafe.Pointer(&b)) fmt.Println("a ptr:", unsafe.Pointer(aptr.Data)) fmt.Println("b ptr:", unsafe.Pointer(bptr.Data)) } // 運(yùn)行結(jié)果 hello, world hello, world a ptr: 0x6bdb76 b ptr: 0x6bdb76
在上面的代碼中,將a和b轉(zhuǎn)換為StringHeader類型的指針,然后分別打印出,a和b的Data指針的值,發(fā)現(xiàn)是相同的
那么如果對a做切片賦值給b呢?
func main() { a := "hello,world" b := a[6:] fmt.Println(a) fmt.Println(b) aptr := (*reflect.StringHeader) (unsafe.Pointer(&a)) bptr := (*reflect.StringHeader) (unsafe.Pointer(&b)) fmt.Println("a ptr:", unsafe.Pointer(aptr.Data)) fmt.Println("b ptr:", unsafe.Pointer(bptr.Data)) } // 運(yùn)行結(jié)果 hello,world world a ptr: 0xd4d849 b ptr: 0xd4d84f
0xd4d849 - 0xd4d84f = 0x000006
顯然,也沒有分配新的數(shù)組并拷貝數(shù)據(jù),而是將原字符數(shù)組的指針的偏移賦給了b的StringHeader的Data
4、string重新賦值
如果對一個已經(jīng)賦值的字符串重新賦值,也不會修改原內(nèi)存空間,而是申請了新的內(nèi)存空間,對其賦值,并指向新的內(nèi)存空間。如下圖:
也可以使用代碼來證實一下:
package main import ( "fmt" "reflect" "unsafe" ) func main() { a := "hello,world" aptr := (*reflect.StringHeader) (unsafe.Pointer(&a)) fmt.Println("a ptr:", unsafe.Pointer(aptr.Data)) fmt.Println("a len", aptr.Len) a = "hello,golang" newAPtr := (*reflect.StringHeader) (unsafe.Pointer(&a)) fmt.Println("b ptr:", unsafe.Pointer(newAPtr.Data)) fmt.Println("b len:", newAPtr.Len) } // 運(yùn)行結(jié)果 a ptr: 0x3ed7f4 a len 11 b ptr: 0x3edb2c b len: 12
補(bǔ)充:字符串拼接
字符串可以很方便的拼接,像下面這樣:
str := "Str1" + "Str2" + "Str3"
即便有非常多的字符串需要拼接,性能上也有比較好的保證,因為新字符串的內(nèi)存空間是一次分配完成的,所以性能消耗主要在拷貝數(shù)據(jù)上。
一個拼接語句的字符串編譯時都會被存放到一個切片中,拼接過程需要遍歷兩次切片,第一次遍歷獲取總的字符串長度,據(jù)此申請內(nèi)存,第二次遍歷會把字符串逐個拷貝過去。
字符串拼接偽代碼如下:
func concatstrings(a []string) string { // 字符串拼接 length := 0 // 拼接后總的字符串長度 for _, str := range a { length += length(str) } s, b := rawstring(length) // 生成指定大小的字符串,返回一個string和切片,二者共享內(nèi)存空間 for _, str := range a { copy(b, str) // string無法修改,只能通過切片修改 b = b[len(str):] } return s }
因為string是無法直接修改的,所以這里使用rawstring()方法初始化一個指定大小的string,同時返回一個切片,二者共享同一塊內(nèi)存空間,后面向切片中拷貝數(shù)據(jù),也就間接修改了string。
rawstring()源代碼如下:
func rawstring(size int) (s string, b []byte) { // 生成一個新的string,返回的string和切片共享相同的空間 p := mallocgc(uintptr(size), nil, false) stringStructOf(&s).str = p stringStructOf(&s).len = size *(*slice)(unsafe.Pointer(&b)) = slice{p, size, size} return }
總結(jié)
到此這篇關(guān)于Golang基礎(chǔ)教程之字符串string實例詳解的文章就介紹到這了,更多相關(guān)Golang字符串string詳解內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
golang?Gin上傳文件返回前端及中間件實現(xiàn)示例
這篇文章主要為大家介紹了golang?Gin上傳文件返回前端及中間件實現(xiàn)示例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步早日升職加薪2022-04-04Go語言實現(xiàn)互斥鎖、隨機(jī)數(shù)、time、List
這篇文章主要介紹了Go語言實現(xiàn)互斥鎖、隨機(jī)數(shù)、time、List的相關(guān)資料,需要的朋友可以參考下2018-10-10Go并發(fā)原語之SingleFlight請求合并方法實例
本文我們來學(xué)習(xí)一下 Go 語言的擴(kuò)展并發(fā)原語:SingleFlight,SingleFlight 的作用是將并發(fā)請求合并成一個請求,以減少重復(fù)的進(jìn)程來優(yōu)化 Go 代碼2023-12-12