欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Golang?統(tǒng)計字符串中數(shù)字字母數(shù)量的實現(xiàn)方法

 更新時間:2022年06月01日 11:01:06   作者:戀喵大鯉魚  
這篇文章主要介紹了Golang?統(tǒng)計字符串中數(shù)字字母數(shù)量,本文給出了兩種從字符串獲取數(shù)字與字母數(shù)量的方法,分別是ASCII 碼值和正則表達(dá)式,需要的朋友可以參考下

1.需求說明

記錄一下項目對用戶 UGC 文本進行字?jǐn)?shù)限制的具體實現(xiàn)。

不同的產(chǎn)品,出于種種原因,一般都會對用戶輸入的文本內(nèi)容做字?jǐn)?shù)限制。

  • 出于產(chǎn)品定位,比如 140 字符限制的 Twitter,讓內(nèi)容保持簡潔凝練,易于閱讀;
  • 出于用戶的閱讀體驗,過多的文字會造成閱讀疲勞,合適的字?jǐn)?shù)能夠提高閱讀舒適度;
  • 出于技術(shù)與成本的考慮,不設(shè)上限的 UGC 內(nèi)容會引發(fā)一些潛在的問題,比如增加存儲的成本,降低檢索效率等。

回到自己的項目,是一個用戶發(fā)帖的業(yè)務(wù)場景。產(chǎn)品同學(xué)給到的要求是:

  • 帖子名稱,限制在 25 個字;
  • 帖子正文,限制在 1500 字;
  • 關(guān)于字的說明:1 個漢字為一個字,一個 Emoji 表情相當(dāng)于 1 個字,2 個數(shù)字/英文字母相當(dāng)于 1 個字。

正常情況下,漢字,Emoji 字符,數(shù)字與英文字母都是單獨的字符。這里 2 個數(shù)字/英文算作 1 個字,所以在計算字符串長度時,不能夠使用 []rune 強轉(zhuǎn)后來獲取其長度,而是需要統(tǒng)計出數(shù)字與英文字母的數(shù)量,再加上其他字符數(shù)量,作為其長度。所以,要想實現(xiàn)產(chǎn)品同學(xué)的要求,關(guān)鍵是需要統(tǒng)計出用戶輸入文本中的數(shù)字與英文字母的數(shù)量。

2.實現(xiàn)

在 Golang,一般有兩種方法。

2.1 ASCII 碼值法

數(shù)字和英文字母的 ASCII 碼值我們是知道的,通過對原字符串遍歷,便可統(tǒng)計出數(shù)字/英文字母的數(shù)量。

// GetAlphanumericNumByASCII 根據(jù) ASCII 碼值獲取字母數(shù)字?jǐn)?shù)量。
func GetAlphanumericNumByASCII(s string) int {
	num := int(0)
	for i := 0; i < len(s); i++ {
		switch {
		case 48 <= s[i] && s[i] <= 57: // 數(shù)字
			fallthrough
		case 65 <= s[i] && s[i] <= 90: // 大寫字母
			fallthrough
		case 97 <= s[i] && s[i] <= 122: // 小寫字母
			num++
		default:
		}
	}
	return num
}

// 或者
// GetAlphanumericNumByASCIIV2 根據(jù) ASCII 碼值獲取字母數(shù)字?jǐn)?shù)量。
func GetAlphanumericNumByASCIIV2(s string) int {
	num := int(0)
	for _, c := range s {
		switch {
		case '0' <= c && c <= '9':
			fallthrough
		case 'a' <= c && c <= 'z':
			fallthrough
		case 'A' <= c && c <= 'Z':
			num++
		default:
		}
	}
	return num
}

2.2 正則表達(dá)式

我們可以利用 Golang 標(biāo)準(zhǔn)庫包 regexp 獲取指定表達(dá)式的字串?dāng)?shù)量。

// GetAlphanumericNumByRegExp 根據(jù)正則表達(dá)式獲取字母數(shù)字?jǐn)?shù)量。
func GetAlphanumericNumByRegExp(s string) int {
	rNum := regexp.MustCompile(`\d`)
	rLetter := regexp.MustCompile("[a-zA-Z]")
	return len(rNum.FindAllString(s, -1)) + len(rLetter.FindAllString(s, -1))
}

我們可以寫個單測來驗證下上面三個函數(shù)的正確性。

package string
import "testing"
func TestGetAlphanumericNumByASCII(t *testing.T) {
	type args struct {
		s string
	}
	tests := []struct {
		name string
		args args
		want int
	}{
		{
			name: "包含數(shù)字",
			args: args{"108條梁山好漢"},
			want: 3,
		},
		{
			name: "包含字母",
			args: args{"一百條梁山man"},
			want: 3,
		},
		{
			name: "包含數(shù)字與字母",
			args: args{"108條梁山man"},
			want: 6,
		},
	}
	for _, tt := range tests {
		t.Run(tt.name, func(t *testing.T) {
			if got := GetAlphanumericNumByASCII(tt.args.s); got != tt.want {
				t.Errorf("GetAlphanumericNumByASCII() = %v, want %v", got, tt.want)
			}
		})
	}
}
func TestGetAlphanumericNumByASCIIV2(t *testing.T) {
	type args struct {
		s string
	}
	tests := []struct {
		name string
		args args
		want int
	}{
		{
			name: "包含數(shù)字",
			args: args{"108條梁山好漢"},
			want: 3,
		},
		{
			name: "包含字母",
			args: args{"一百條梁山man"},
			want: 3,
		},
		{
			name: "包含數(shù)字與字母",
			args: args{"108條梁山man"},
			want: 6,
		},
	}
	for _, tt := range tests {
		t.Run(tt.name, func(t *testing.T) {
			if got := GetAlphanumericNumByASCIIV2(tt.args.s); got != tt.want {
				t.Errorf("GetAlphanumericNumByASCII() = %v, want %v", got, tt.want)
			}
		})
	}
}
func TestGetAlphanumericNumByRegExp(t *testing.T) {
	type args struct {
		s string
	}
	tests := []struct {
		name string
		args args
		want int
	}{
		{
			name: "包含數(shù)字",
			args: args{"108條梁山好漢"},
			want: 3,
		},
		{
			name: "包含字母",
			args: args{"一百條梁山man"},
			want: 3,
		},
		{
			name: "包含數(shù)字與字母",
			args: args{"108條梁山man"},
			want: 6,
		},
	}
	for _, tt := range tests {
		t.Run(tt.name, func(t *testing.T) {
			if got := GetAlphanumericNumByRegExp(tt.args.s); got != tt.want {
				t.Errorf("GetAlphanumericNumByRegExp() = %v, want %v", got, tt.want)
			}
		})
	}
}

運行go test main/string命令,其中 main/string 為單元測試所在包的路徑。輸出如下:

ok      main/string     0.355s

驗證無誤。

3.性能對比

上面提到的兩種方法都可以用來獲取字符串中數(shù)字與英文字母的數(shù)量,那么我們應(yīng)該采用哪一種方法呢?

功能上沒有差別,那么我們來看下性能對比吧。

func BenchmarkGetAlphanumericNumByASCII(b *testing.B) {
	for n := 0; n < b.N; n++ {
		GetAlphanumericNumByASCII("108條梁山man")
	}
}
func BenchmarkGetAlphanumericNumByASCIIV2(b *testing.B) {
	for n := 0; n < b.N; n++ {
		GetAlphanumericNumByASCIIV2("108條梁山man")
	}
}
func BenchmarkGetAlphanumericNumByRegExp(b *testing.B) {
	for n := 0; n < b.N; n++ {
		GetAlphanumericNumByRegExp("108條梁山man")
	}
}

運行上面的基準(zhǔn)測試,輸出如下:

go test -bench=. -benchmem main/string

goos: windows
goarch: amd64
pkg: main/string
cpu: Intel(R) Core(TM) i7-9700 CPU @ 3.00GHz
BenchmarkGetAlphanumericNumByASCII-8            89540210                12.67 ns/op            0 B/op          0 allocs/op
BenchmarkGetAlphanumericNumByASCIIV2-8          63227778                19.11 ns/op            0 B/op          0 allocs/op
BenchmarkGetAlphanumericNumByRegExp-8             465954              2430 ns/op            1907 B/op         27 allocs/op
PASS
ok      main/string     3.965s

不測不知道,一測嚇一跳。通過正則表達(dá)式的實現(xiàn)方式,代碼雖然簡潔,但是涉及多次內(nèi)存配分,性能與 ASCII 碼值法相比,差距非常之大,是 ASCII 碼值法的 200 倍左右。所以從性能的考慮,推薦使用 ASCII 碼值的方式獲取數(shù)字字母數(shù)量。

ASCII 碼值法有兩種遍歷方式,一種是按照字節(jié)遍歷,一種是按照 rune 字符遍歷。因為后者涉及 rune 字符的判斷,所以性能會差一些。推薦使用按照字節(jié)遍歷。

4.小結(jié)

本文給出了兩種從字符串獲取數(shù)字與字母數(shù)量的方法:

  • ASCII 碼值。
  • 正則表達(dá)式。

出于性能的考慮,推薦使用 ASCII 碼值法,并使用字節(jié)遍歷的方式。

此外,本文給出的兩種方法,三種實現(xiàn)方式,相關(guān)源碼已放置開源庫 go-huge-util,可 import 直接使用。

package main
import (
	"fmt"
	huge "github.com/dablelv/go-huge-util"
)
func main() {
	fmt.Println(huge.GetAlphanumericNumByASCII("108條梁山man"))  	// 6
	fmt.Println(huge.GetAlphanumericNumByASCIIV2("108條梁山man"))  	// 6
	fmt.Println(huge.GetAlphanumericNumByRegExp("108條梁山man")) 	// 6
}

參考文獻(xiàn)

golang統(tǒng)計出其中英文字母、空格、數(shù)字和其它字符的個數(shù)

到此這篇關(guān)于Golang 統(tǒng)計字符串中數(shù)字字母數(shù)量的文章就介紹到這了,更多相關(guān)Golang 統(tǒng)計字符串內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • 詳解如何使用Golang實現(xiàn)Cron定時任務(wù)

    詳解如何使用Golang實現(xiàn)Cron定時任務(wù)

    定時任務(wù)是許多應(yīng)用程序中常見的一種需求,它們可以用于執(zhí)行定期的清理任務(wù),發(fā)送通知,生成報告等,在這篇博客中,我們將介紹如何在Go語言中使用robfig/cron包來實現(xiàn)Cron定時任務(wù),需要的朋友可以參考下
    2024-04-04
  • golang context接口類型方法介紹

    golang context接口類型方法介紹

    這篇文章主要為大家介紹了golang context接口類型方法詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2023-09-09
  • 使用docker構(gòu)建golang線上部署環(huán)境的步驟詳解

    使用docker構(gòu)建golang線上部署環(huán)境的步驟詳解

    這篇文章主要介紹了使用docker構(gòu)建golang線上部署環(huán)境的步驟,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧。
    2017-11-11
  • golang1.16新特性速覽(推薦)

    golang1.16新特性速覽(推薦)

    這篇文章主要介紹了golang1.16新特性速覽,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2021-02-02
  • golang原生實現(xiàn)JWT的示例代碼

    golang原生實現(xiàn)JWT的示例代碼

    在Go中實現(xiàn)JWT驗證,可以通過標(biāo)準(zhǔn)庫crypto/hmac、crypto/sha256和encoding/base64來編寫自己的JWT,本文就詳細(xì)的來介紹一下,感興趣的可以了解下
    2023-05-05
  • 詳解如何利用GORM實現(xiàn)MySQL事務(wù)

    詳解如何利用GORM實現(xiàn)MySQL事務(wù)

    為了確保數(shù)據(jù)一致性,在項目中會經(jīng)常用到事務(wù)處理,對于MySQL事務(wù)相信大家應(yīng)該都不陌生。這篇文章主要總結(jié)一下在Go語言中Gorm是如何實現(xiàn)事務(wù)的;感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助
    2022-09-09
  • goLand Delve版本太老的問題及解決

    goLand Delve版本太老的問題及解決

    這篇文章主要介紹了goLand Delve版本太老的問題及解決方案,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
    2023-09-09
  • go xorm框架的使用

    go xorm框架的使用

    xorm框架和Spring Data Jpa有點相似,可以對比學(xué)習(xí),對于這個框架感覺還不錯,閑暇時間學(xué)習(xí)一下
    2021-05-05
  • Go快速開發(fā)一個RESTful API服務(wù)

    Go快速開發(fā)一個RESTful API服務(wù)

    這篇文章主要為大家介紹了Go快速開發(fā)一個RESTful API服務(wù),有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2022-06-06
  • Golang中的自定義函數(shù)詳解

    Golang中的自定義函數(shù)詳解

    函數(shù)構(gòu)成代碼執(zhí)行的邏輯結(jié)構(gòu)。在Go語言中,函數(shù)的基本組成為:關(guān)鍵字func、函數(shù)名、參數(shù)列表、返回值、函數(shù)體和返回語句。
    2018-10-10

最新評論