欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Go語言循環(huán)遍歷含有中文的字符串的方法小結(jié)

 更新時間:2023年07月26日 09:30:26   作者:m舊褲子  
這篇文章主要介紹了Go語言循環(huán)遍歷含有中文的字符串的幾種方法,文章通過代碼示例講解的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴跟著小編一起來看看吧

Go語言循環(huán)遍歷含有中文字符的字符串

首先使用普通for循環(huán)遍歷含有中文的字符串

str := "hello,你好"
	for i := 0; i < len(str); i++ {
		fmt.Printf("%c", str[i])
	}

輸出結(jié)果:

hello,ä½ å¥½

可見使用普通for循環(huán)遍歷字符串中的中文字符發(fā)生了亂碼。

然后我們使用Go語言中for range

str := "hello,你好"
	for _, v := range str {
		fmt.Printf("%c", v)
	}

輸出結(jié)果:

hello,你好

可見用for range對含有中文字符的字符串進(jìn)行循環(huán)遍歷就不會出現(xiàn)亂碼的問題。中文字會正常輸出。

那為什么使用for循環(huán)中文字符部分會出現(xiàn)亂碼呢?

首先我們先來看Go語言中對字符的定義

字符在Go語言中分為兩種:

  • 一種是unint8類型,或者叫byte型,代表了ASCII碼的一個字符。
  • 另一種是rune類型,代表一個UTF-8字符。當(dāng)需要處理中文、日文或者其他符合字符時,則需要用到rune類型。rune類型實際是一個int32.

使用fmt.Printf中的"%T"可以輸出變量的實際類型,使用這個方法可以查看byte和rune的本來類型,代碼如下:

    var a byte = 'a'
	fmt.Printf("%d %T\n", a, a)
	var b rune = '你'
	fmt.Printf("%d %T\n", b, b)

輸出結(jié)果:

97 uint8
20320 int32

那普通for循環(huán)和for range兩個循環(huán)出來的字符類型是什么呢?

測試:

for循環(huán)

str := "hello,你好"
	for i := 0; i < len(str); i++ {
		fmt.Printf("%c,%T  ", str[i],str[i])
	}

輸出結(jié)果:

h,uint8
e,uint8
l,uint8
l,uint8
o,uint8
,uint8
ä,uint8
½,uint8
,uint8
å,uint8
¥,uint8
½,uint8

for range

str := "hello,你好"
	for _, v := range str {
		fmt.Printf("%c,%T \n", v, v)
	}

輸出結(jié)果:

h,int32
e,int32
l,int32
l,int32
o,int32
,int32
你,int32
好,int32

可見,使用普通循環(huán)時,得到的類型是uint8,也就是byte類型。

使用for range循環(huán)時,得到的類型是int32,也就是rune類型。

因為使用普通for循環(huán)時,得到的類型是uint8,對應(yīng)ASCII編碼表,而中文字符在ASCII編碼表中沒有相對應(yīng)的ID,那輸出中文時就會出現(xiàn)亂碼。
而在使用for range時,得到的類型時int32,對應(yīng)Unicode編碼表,中文字符在Unicode編碼表中存在中文相對應(yīng)的ID,輸出正常。

總結(jié):

  • 使用普通循環(huán)時,得到的類型是uint8,對應(yīng)ASCII字符集.
  • 使用for range時,得到類型是int32,對應(yīng)Unicode字符集.
  • Go語言中byte和rune實質(zhì)上就是uint8和int32類型。

到此這篇關(guān)于Go語言循環(huán)遍歷含有中文的字符串的方法小結(jié)的文章就介紹到這了,更多相關(guān)Go循環(huán)遍歷中文字符串內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

最新評論