欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Go實現(xiàn)快速生成固定長度的隨機字符串

 更新時間:2022年10月16日 11:19:18   作者:阿白499  
這篇文章主要為大家詳細介紹了怎樣在Go中簡單快速地生成固定長度的隨機字符串,文中的示例代碼講解詳細,具有一定的借鑒價值,需要的可以學習一下

Q:怎樣在Go語言中簡單并快速地生成固定長度的隨機字符串?

A:

問題是“最快和最簡單的方式”,接下來我們會一步步迭代,最終實現(xiàn)最快的方式。每次迭代的基準測試代碼放在了答案的末尾。

所有解決方案和基準測試代碼都可以在 Go Playground 上找到。Playground 上的代碼是測試文件,不是可執(zhí)行文件。你需要把它保存到文件中并命名為XX_test.go然后運行

go test -bench . -benchmem

前言

如果您只需要一個隨機字符串,最快的解決方案不是首選解決方案。Paul的解決方案(下面的第一種方法)就很好。如果很關(guān)注性能,那么前兩個方法可能是可接受的折中方案:它們把性能提升了50%,而且也沒有顯著增加復雜性。

話雖如此,但就算你不需要最快生成隨機字符串的方法,通讀這篇回答相信你也應該會有所收獲。

Improvements

1. Genesis (Runes)

提醒一下,下面這個方法是我們用來改進的原始通用解決方案:

func init() {
    rand.Seed(time.Now().UnixNano())
}

var letterRunes = []rune("abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ")

func RandStringRunes(n int) string {
    b := make([]rune, n)
    for i := range b {
        b[i] = letterRunes[rand.Intn(len(letterRunes))]
    }
    return string(b)
}

2. Bytes

如果要生成的隨機字符串只包含大小寫英文字母,那么我們可以只使用英文字母字節(jié),因為英文字母和UTF8編碼的字節(jié)是一一對應的(這就是Go存儲字符串的方式)

所以可以這么寫:

// rune 替換為 byte
var letters = []byte("abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ")

或者更好的寫法是:

const letters = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ"

在這里把它寫成一個常量就已經(jīng)是一個很大的改進了(有字符串常量但沒有切片常量), 還有一點就是表達式len(letters)也將是一個常量(如果s是字符串常量,那么len(s)也就是個常量)

所以我們的第二種方法是這樣的:

const letterBytes = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ"

func RandStringBytes(n int) string {
    b := make([]byte, n)
    for i := range b {
        b[i] = letterBytes[rand.Intn(len(letterBytes))]
    }
    return string(b)
}

3. Remainder

前面的方法都是通過調(diào)用rand.Intn()來生成一個隨機數(shù)從而選擇一個隨機的字母。rand.Intn()來自于Rand.Intn(), 而后者又來自于Rand.Int31n()。

與生成一個具有 63 個隨機位的隨機數(shù)的rand.Int63()相比上面生成隨機數(shù)的方式要慢得多。

所以我們可以直接調(diào)用rand.Int63()然后對lenletterBytes)進行取余。

func RandStringBytesRmndr(n int) string {
    b := make([]byte, n)
    for i := range b {
        b[i] = letterBytes[rand.Int63() % int64(len(letterBytes))]
    }
    return string(b)
}

這么做是可以的并且要比上面的方法快很多,但是有個缺點就是所有的字母出現(xiàn)的概率不是完全相等的(假設(shè) rand.Int63() 以相等的概率產(chǎn)生所有 63 位數(shù)字)。由于字母的長度52比 1<<63 - 1要小得多,因此各個字母出現(xiàn)的概率的差異非常小,在實際使用中是完全沒問題的。

解釋下上面字母出現(xiàn)概率不相等的現(xiàn)象:假設(shè)你要生成一個0..5之間的隨機數(shù),如果使用3個隨機位,那么會導致產(chǎn)生數(shù)字0..1范圍內(nèi)的概率是2..5的兩倍;如果使用5個隨機位,那么產(chǎn)生0..1范圍的數(shù)字概率是6/32, 2..5范圍的概率位5/32,這已經(jīng)很接近了。增加位數(shù)可以使概率差異越來越小,當達到63位時,差異已經(jīng)可以忽略不計了。

4. Masking

在前面的解決方案的基礎(chǔ)上,我們可以通過只使用盡可能多的隨機數(shù)的最低位來表示字母的數(shù)量從而保持字母的均勻分布。所以我們有52個字母,那么就需要6位來表示它:52=110100b。因此我們就只使用rand.Int63()返回的數(shù)的最低六位來表示。為了保持字母的均勻粉筆,我們只接受落在0...len(letterBytes)-1范圍內(nèi)的數(shù)字。如果最低位的數(shù)字大于這個范圍,那么就丟棄它并重新生成一個新的隨機數(shù)。

注意,最低位大于等于len(letterBytes)的概率通常小于0.5(平均為0.25),這意味著重復出現(xiàn)這種情況會降低我們找到能用的隨機數(shù)字的概率。在 n 次重復后我們?nèi)匀粵]有找到一個能用的隨機數(shù)的概率遠小于pow(0.5, n),當然這是一個最壞的情況。在52個字母的情況下,最低6位不能用的可能性為 (64 - 52) / 64 = 0.19,也就是說在10次重復還沒有遇到可以用的數(shù)字的概率為 1e-8。

所以,這個解決方法是這樣的:

const letterBytes = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ"
const (
    letterIdxBits = 6                    // 6 bits to represent a letter index
    letterIdxMask = 1<<letterIdxBits - 1 // All 1-bits, as many as letterIdxBits
)

func RandStringBytesMask(n int) string {
    b := make([]byte, n)
    for i := 0; i < n; {
        if idx := int(rand.Int63() & letterIdxMask); idx < len(letterBytes) {
            b[i] = letterBytes[idx]
            i++
        }
    }
    return string(b)
}

5. Masking Improved

前面的解決方案只使用 rand.Int63() 返回的 63 個隨機位中的最低 6 位。這是一種浪費,因為獲取隨機位是我們算法中最慢的部分。

因為我們有52個字母,可以用6位來編碼一個字母索引。所以63個隨機位可以生成63/6=10個不同的索引:

const letterBytes = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ"
const (
    letterIdxBits = 6                    // 6 bits to represent a letter index
    letterIdxMask = 1<<letterIdxBits - 1 // All 1-bits, as many as letterIdxBits
    letterIdxMax  = 63 / letterIdxBits   // # of letter indices fitting in 63 bits
)

func RandStringBytesMaskImpr(n int) string {
    b := make([]byte, n)
    // A rand.Int63() generates 63 random bits, enough for letterIdxMax letters!
    for i, cache, remain := n-1, rand.Int63(), letterIdxMax; i >= 0; {
        if remain == 0 {
            cache, remain = rand.Int63(), letterIdxMax
        }
        if idx := int(cache & letterIdxMask); idx < len(letterBytes) {
            b[i] = letterBytes[idx]
            i--
        }
        cache >>= letterIdxBits
        remain--
    }

    return string(b)
}

6. Source

上面的 Masking Improved 方法已經(jīng)非常好了,我們幾乎沒辦法做更多的改進??梢缘珱]必要。

現(xiàn)在讓我們找找其他可以改進的地方:隨機數(shù)的來源。

crypto/rand 包,它提供了一個 Read(b []byte) 函數(shù),我們可以使用它來通過一次調(diào)用獲得盡可能多的字節(jié)。這對性能沒有幫助,因為 crypto/rand 實現(xiàn)了加密安全的偽隨機數(shù)生成器,因此速度要慢得多。

所以我們還是使用math/rand包。rand.Rand使用的是rand.Source作為隨機位來源。rand.Source 是一個指定 Int63() int64 方法的接口:這也正是我們在最新解決方案中唯一需要和使用的東西。

所以我們并不需要rand.Rand, 可以使用rand.Source:

var src = rand.NewSource(time.Now().UnixNano())

func RandStringBytesMaskImprSrc(n int) string {
   b := make([]byte, n)
   // A src.Int63() generates 63 random bits, enough for letterIdxMax characters!
   for i, cache, remain := n-1, src.Int63(), letterIdxMax; i >= 0; {
       if remain == 0 {
           cache, remain = src.Int63(), letterIdxMax
       }
       if idx := int(cache & letterIdxMask); idx < len(letterBytes) {
           b[i] = letterBytes[idx]
           i--
       }
       cache >>= letterIdxBits
       remain--
   }

   return string(b)
}

還要注意的是,這個方法不需要初始化(seed)math/rand包里的全局Rand,因為它沒有被用到。

還有就是:math/rand 的包文檔說明

The default Source is safe for concurrent use by multiple goroutines.(協(xié)程安全)

所以默認source要比rand.NewSource()生成的source慢,是因為默認source保證了并發(fā)使用時是安全的。而 rand.NewSource() 不提供此功能(因此它返回的 Source 更有可能更快)。

7. Utilizing strings.Builder

上面所有的方法返回的字符串都是先創(chuàng)建一個切片的(第一個是使用[]rune,后面的都是[]byte),然后轉(zhuǎn)換成string。這個轉(zhuǎn)換會對切片的內(nèi)容做一次復制,因為字符串是不可變的,如果轉(zhuǎn)換不進行復制,則不能保證字符串的內(nèi)容不會被原始切邊修改。詳細內(nèi)容可以看這里:How to convert utf8 string to []byte? golang: []byte(string) vs []byte(*string)。

Go 1.10 引入了 strings.Builder。 strings.Builder 是一種新類型,我們可以使用它像 bytes.Buffer 那樣來創(chuàng)建字符串內(nèi)容。在內(nèi)部,它使用 []byte 來構(gòu)建內(nèi)容,然后我們可以使用它的 Builder.String() 方法獲得最終的字符串值。但是它的不同之處就是不會執(zhí)行我們上面說到的復制操作。之所以可以這么做,是因為它用于構(gòu)建的字符串字節(jié)切片沒有暴露出來,所以可以保證不會有人無意或者惡意得修改它。

所以我們接下來要做的就是使用strings.Builder而不是切片來創(chuàng)建字符串,最后我們可以再無需復制操作的情況下獲得想要的結(jié)果。這在速度方面可能有所幫助,并且在內(nèi)存使用和分配方面肯定會有所幫助。

func RandStringBytesMaskImprSrcSB(n int) string {
    sb := strings.Builder{}
    sb.Grow(n)
    // A src.Int63() generates 63 random bits, enough for letterIdxMax characters!
    for i, cache, remain := n-1, src.Int63(), letterIdxMax; i >= 0; {
        if remain == 0 {
            cache, remain = src.Int63(), letterIdxMax
        }
        if idx := int(cache & letterIdxMask); idx < len(letterBytes) {
            sb.WriteByte(letterBytes[idx])
            i--
        }
        cache >>= letterIdxBits
        remain--
    }

    return sb.String()
}

8. "Mimicing" strings.Builder with package unsafe

strings.Builder本質(zhì)上做得和我們上面做得一樣,都是使用切片來創(chuàng)建字符串,我們使用它的唯一原因就是為了避免對切片的復制操作。

strings.Builder通過unsafe避免復制操作:

// String returns the accumulated string.
func (b *Builder) String() string {
    return *(*string)(unsafe.Pointer(&b.buf))
}

其實我們也可以自己來做這件事。回到之前我們使用[]byte來創(chuàng)建隨機字符串,但是在最后不是把它轉(zhuǎn)換成string然后返回,而是做一個不安全的轉(zhuǎn)換:獲取一個指向我們的字節(jié)切片的字符串作為字符串數(shù)據(jù)。

func RandStringBytesMaskImprSrcUnsafe(n int) string {
    b := make([]byte, n)
    // A src.Int63() generates 63 random bits, enough for letterIdxMax characters!
    for i, cache, remain := n-1, src.Int63(), letterIdxMax; i >= 0; {
        if remain == 0 {
            cache, remain = src.Int63(), letterIdxMax
        }
        if idx := int(cache & letterIdxMask); idx < len(letterBytes) {
            b[i] = letterBytes[idx]
            i--
        }
        cache >>= letterIdxBits
        remain--
    }

    return *(*string)(unsafe.Pointer(&b))
}

Benchmark

BenchmarkRunes-4                     2000000    723 ns/op   96 B/op   2 allocs/op
BenchmarkBytes-4                     3000000    550 ns/op   32 B/op   2 allocs/op
BenchmarkBytesRmndr-4                3000000    438 ns/op   32 B/op   2 allocs/op
BenchmarkBytesMask-4                 3000000    534 ns/op   32 B/op   2 allocs/op
BenchmarkBytesMaskImpr-4            10000000    176 ns/op   32 B/op   2 allocs/op
BenchmarkBytesMaskImprSrc-4         10000000    139 ns/op   32 B/op   2 allocs/op
BenchmarkBytesMaskImprSrcSB-4       10000000    134 ns/op   16 B/op   1 allocs/op
BenchmarkBytesMaskImprSrcUnsafe-4   10000000    115 ns/op   16 B/op   1 allocs/op

以上就是Go實現(xiàn)快速生成固定長度的隨機字符串的詳細內(nèi)容,更多關(guān)于Go生成固定長度隨機字符串的資料請關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

  • golang?gorm的關(guān)系關(guān)聯(lián)實現(xiàn)示例

    golang?gorm的關(guān)系關(guān)聯(lián)實現(xiàn)示例

    這篇文章主要為大家介紹了golang?gorm的關(guān)系關(guān)聯(lián)實現(xiàn)示例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步早日升職加薪
    2022-04-04
  • Golang中的map操作方法詳解

    Golang中的map操作方法詳解

    這篇文章主要給大家介紹了關(guān)于Golang中map操作方法的相關(guān)資料,map是一種無序的基于key-value的數(shù)據(jù)結(jié)構(gòu),Go語言中map是引用類型,必須初始化才能使用,需要的朋友可以參考下
    2023-11-11
  • Go語言異常處理案例解析

    Go語言異常處理案例解析

    這篇文章主要介紹了Go語言異常處理案例解析,本篇文章通過簡要的案例,講解了該項技術(shù)的了解與使用,以下就是詳細內(nèi)容,需要的朋友可以參考下
    2021-07-07
  • Go中sync?包Cond使用場景分析

    Go中sync?包Cond使用場景分析

    Cond?是和某個條件相關(guān),在條件還沒有滿足的時候,所有等待這個條件的協(xié)程都會被阻塞住,只有這個條件滿足的時候,等待的協(xié)程才可能繼續(xù)進行下去,這篇文章主要介紹了Go中sync?包的Cond使用場景分析,需要的朋友可以參考下
    2023-03-03
  • Golang如何快速構(gòu)建一個CLI小工具詳解

    Golang如何快速構(gòu)建一個CLI小工具詳解

    這篇文章主要為大家介紹了Golang如何快速構(gòu)建一個CLI小工具詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2022-11-11
  • Golang并發(fā)編程之GMP模型詳解

    Golang并發(fā)編程之GMP模型詳解

    傳統(tǒng)的并發(fā)編程模型是基于線程和共享內(nèi)存的同步訪問控制的,共享數(shù)據(jù)受鎖的保護,線程將爭奪這些鎖以訪問數(shù)據(jù)。本文將介紹Go并發(fā)編程中的GMP模型,感興趣的可以了解一下
    2023-03-03
  • GO語言中的Map使用方法詳解

    GO語言中的Map使用方法詳解

    這篇文章主要給大家介紹了關(guān)于GO語言中Map使用方法的相關(guān)資料,在go語言中map是散列表的引用,map的類型是map[k]v,也就是常說的k-v鍵值對,需要的朋友可以參考下
    2023-08-08
  • Golang中int,?int8,?int16,?int32,?int64和uint區(qū)別淺析

    Golang中int,?int8,?int16,?int32,?int64和uint區(qū)別淺析

    go語言中的int的大小是和操作系統(tǒng)位數(shù)相關(guān)的,如果是32位操作系統(tǒng),int類型的大小就是4字節(jié),如果是64位操作系統(tǒng),int類型的大小就是8個字節(jié),下面這篇文章主要給大家介紹了關(guān)于Golang中int,?int8,?int16,?int32,?int64和uint區(qū)別的相關(guān)資料,需要的朋友可以參考下
    2022-11-11
  • golang package time的用法具體詳解

    golang package time的用法具體詳解

    本篇文章主要介紹了golang package time的用法具體詳解,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2018-05-05
  • Go語言獲取文件的名稱、前綴、后綴

    Go語言獲取文件的名稱、前綴、后綴

    這篇文章主要介紹了Go語言獲取文件的名稱、前綴、后綴,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2021-05-05

最新評論