快捷導(dǎo)航

Go?處理大數(shù)組使用?for?range?和?for?循環(huán)的區(qū)別

更新時(shí)間：2022年05月07日 12:05:05 作者：機(jī)器鈴砍菜刀

這篇文章主要介紹了Go處理大數(shù)組使用for?range和for循環(huán)的區(qū)別，對(duì)于遍歷大數(shù)組而言，for循環(huán)能比f(wàn)or?range循環(huán)更高效與穩(wěn)定，這一點(diǎn)在數(shù)組元素為結(jié)構(gòu)體類(lèi)型更加明顯，下文具體分析感興趣得小伙伴可以參考一下

但是，經(jīng)典的三段式循環(huán)語(yǔ)句，需要獲取迭代對(duì)象的長(zhǎng)度 n。鑒于此，為了更方便 Go 開(kāi)發(fā)者對(duì)復(fù)合數(shù)據(jù)類(lèi)型進(jìn)行迭代，例如 array、slice、channel、map，Go 提供了 for 循環(huán)的變體，即 for range 循環(huán)。

副本復(fù)制問(wèn)題

range 在帶來(lái)便利的同時(shí)，也給 Go 初學(xué)者帶來(lái)了一些麻煩。因?yàn)槭褂谜咝枰靼滓稽c(diǎn)：for range 中，參與循環(huán)表達(dá)式的只是對(duì)象的副本。

func main() {
    var a = [5]int{1, 2, 3, 4, 5}
    var r [5]int
    fmt.Println("original a =", a)
    for i, v := range a {
        if i == 0 {
            a[1] = 12
            a[2] = 13
        }
        r[i] = v
    }
    fmt.Println("after for range loop, r =", r)
    fmt.Println("after for range loop, a =", a)
}

你認(rèn)為這段代碼會(huì)輸出以下結(jié)果嗎?

original a = [1 2 3 4 5]
after for range loop, r = [1 12 13 4 5]
after for range loop, a = [1 12 13 4 5]

但是，實(shí)際輸出是；

original a = [1 2 3 4 5]
after for range loop, r = [1 2 3 4 5]
after for range loop, a = [1 12 13 4 5]

為什么會(huì)這樣?原因是參與 for range 循環(huán)是 range 表達(dá)式的副本。也就是說(shuō)，在上面的例子中，實(shí)際上參與循環(huán)的是 a 的副本，而不是真正的 a。

為了讓大家更容易理解，我們把上面例子中的 for range 循環(huán)改寫(xiě)成等效的偽代碼形式。

for i, v := range ac { //ac is a value copy of a
    if i == 0 {
        a[1] = 12
        a[2] = 13
    }
    r[i] = v
}

ac 是 Go 臨時(shí)分配的連續(xù)字節(jié)序列，與 a 根本不是同一塊內(nèi)存空間。因此，無(wú)論 a 如何修改，它參與循環(huán)的副本 ac 仍然保持原始值，因此從 ac 中取出的 v 也依然是 a 的原始值，而不是修改后的值。

那么，問(wèn)題來(lái)了，既然 for range 使用的是副本數(shù)據(jù)，那 for range 會(huì)比經(jīng)典的 for 循環(huán)消耗更多的資源并且性能更差嗎?

性能對(duì)比

基于副本復(fù)制問(wèn)題，我們先使用基準(zhǔn)示例來(lái)驗(yàn)證一下：對(duì)于大型數(shù)組，for range 是否一定比經(jīng)典的 for 循環(huán)運(yùn)行得慢?

package main
import "testing"
func BenchmarkClassicForLoopIntArray(b *testing.B) {
 b.ReportAllocs()
 var arr [100000]int
 for i := 0; i < b.N; i++ {
  for j := 0; j < len(arr); j++ {
   arr[j] = j
  }
 }
}
func BenchmarkForRangeIntArray(b *testing.B) {
 b.ReportAllocs()
 var arr [100000]int
 for i := 0; i < b.N; i++ {
  for j, v := range arr {
   arr[j] = j
   _ = v
  }
 }
}

在這個(gè)例子中，我們使用 for 循環(huán)和 for range 分別遍歷一個(gè)包含 10 萬(wàn)個(gè) int 類(lèi)型元素的數(shù)組。讓我們看看基準(zhǔn)測(cè)試的結(jié)果。

$ go test -bench . forRange1_test.go
goos: darwin
goarch: amd64
cpu: Intel(R) Core(TM) i5-8279U CPU @ 2.40GHz
BenchmarkClassicForLoopIntArray-8 47404 25486 ns/op 0 B/op 0 allocs/op
BenchmarkForRangeIntArray-8 37142 31691 ns/op 0 B/op 0 allocs/op
PASS
ok command-line-arguments 2.978s

從輸出結(jié)果可以看出，for range 的確會(huì)稍劣于 for 循環(huán)，當(dāng)然這其中包含了編譯器級(jí)別優(yōu)化的結(jié)果(通常是靜態(tài)單賦值，或者 SSA 鏈接)。

讓我們關(guān)閉優(yōu)化開(kāi)關(guān)，再次運(yùn)行壓力測(cè)試。

$ go test -c -gcflags '-N -l' . -o forRange1.test
$ ./forRange1.test -test.bench .
goos: darwin
goarch: amd64
pkg: workspace/example/forRange
cpu: Intel(R) Core(TM) i5-8279U CPU @ 2.40GHz
BenchmarkClassicForLoopIntArray-8 6734 175319 ns/op 0 B/op 0 allocs/op
BenchmarkForRangeIntArray-8 5178 242977 ns/op 0 B/op 0 allocs/op
PASS

當(dāng)沒(méi)有編譯器優(yōu)化時(shí)，兩種循環(huán)的性能都明顯下降， for range 下降得更為明顯，性能也更加比經(jīng)典 for 循環(huán)差。

遍歷結(jié)構(gòu)體數(shù)組

上述性能測(cè)試中，我們的遍歷對(duì)象類(lèi)型是 int 值的數(shù)組，如果我們將 int 元素改為結(jié)構(gòu)體會(huì)怎么樣?for 和 for range 循環(huán)各自表現(xiàn)又會(huì)如何?

package main
import "testing"
type U5 struct {
 a, b, c, d, e int
}
type U4 struct {
 a, b, c, d int
}
type U3 struct {
 b, c, d int
}
type U2 struct {
 c, d int
}
type U1 struct {
 d int
}

func BenchmarkClassicForLoopLargeStructArrayU5(b *testing.B) {
 b.ReportAllocs()
 var arr [100000]U5
 for i := 0; i < b.N; i++ {
  for j := 0; j < len(arr)-1; j++ {
   arr[j].d = j
  }
 }
}
func BenchmarkClassicForLoopLargeStructArrayU4(b *testing.B) {
 b.ReportAllocs()
 var arr [100000]U4
 for i := 0; i < b.N; i++ {
  for j := 0; j < len(arr)-1; j++ {
   arr[j].d = j
  }
 }
}
func BenchmarkClassicForLoopLargeStructArrayU3(b *testing.B) {
 b.ReportAllocs()
 var arr [100000]U3
 for i := 0; i < b.N; i++ {
  for j := 0; j < len(arr)-1; j++ {
   arr[j].d = j
  }
 }
}
func BenchmarkClassicForLoopLargeStructArrayU2(b *testing.B) {
 b.ReportAllocs()
 var arr [100000]U2
 for i := 0; i < b.N; i++ {
  for j := 0; j < len(arr)-1; j++ {
   arr[j].d = j
  }
 }
}

func BenchmarkClassicForLoopLargeStructArrayU1(b *testing.B) {
 b.ReportAllocs()
 var arr [100000]U1
 for i := 0; i < b.N; i++ {
  for j := 0; j < len(arr)-1; j++ {
   arr[j].d = j
  }
 }
}

func BenchmarkForRangeLargeStructArrayU5(b *testing.B) {
 b.ReportAllocs()
 var arr [100000]U5
 for i := 0; i < b.N; i++ {
  for j, v := range arr {
   arr[j].d = j
   _ = v
  }
 }
}
func BenchmarkForRangeLargeStructArrayU4(b *testing.B) {
 b.ReportAllocs()
 var arr [100000]U4
 for i := 0; i < b.N; i++ {
  for j, v := range arr {
   arr[j].d = j
   _ = v
  }
 }
}

func BenchmarkForRangeLargeStructArrayU3(b *testing.B) {
 b.ReportAllocs()
 var arr [100000]U3
 for i := 0; i < b.N; i++ {
  for j, v := range arr {
   arr[j].d = j
   _ = v
  }
 }
}
func BenchmarkForRangeLargeStructArrayU2(b *testing.B) {
 b.ReportAllocs()
 var arr [100000]U2
 for i := 0; i < b.N; i++ {
  for j, v := range arr {
   arr[j].d = j
   _ = v
  }
 }
}
func BenchmarkForRangeLargeStructArrayU1(b *testing.B) {
 b.ReportAllocs()
 var arr [100000]U1
 for i := 0; i < b.N; i++ {
  for j, v := range arr {
   arr[j].d = j
   _ = v
  }
 }
}

在這個(gè)例子中，我們定義了 5 種類(lèi)型的結(jié)構(gòu)體：U1~U5，它們的區(qū)別在于包含的 int 類(lèi)型字段的數(shù)量。

性能測(cè)試結(jié)果如下：

$ go test -bench . forRange2_test.go
goos: darwin
goarch: amd64
cpu: Intel(R) Core(TM) i5-8279U CPU @ 2.40GHz
BenchmarkClassicForLoopLargeStructArrayU5-8 44540 26227 ns/op 0 B/op 0 allocs/op
BenchmarkClassicForLoopLargeStructArrayU4-8 45906 26312 ns/op 0 B/op 0 allocs/op
BenchmarkClassicForLoopLargeStructArrayU3-8 43315 27400 ns/op 0 B/op 0 allocs/op
BenchmarkClassicForLoopLargeStructArrayU2-8 44605 26313 ns/op 0 B/op 0 allocs/op
BenchmarkClassicForLoopLargeStructArrayU1-8 45752 26110 ns/op 0 B/op 0 allocs/op
BenchmarkForRangeLargeStructArrayU5-8 3072 388651 ns/op 0 B/op 0 allocs/op
BenchmarkForRangeLargeStructArrayU4-8 4605 261329 ns/op 0 B/op 0 allocs/op
BenchmarkForRangeLargeStructArrayU3-8 5857 182565 ns/op 0 B/op 0 allocs/op
BenchmarkForRangeLargeStructArrayU2-8 10000 108391 ns/op 0 B/op 0 allocs/op
BenchmarkForRangeLargeStructArrayU1-8 36333 32346 ns/op 0 B/op 0 allocs/op
PASS
ok command-line-arguments 16.160s

我們看到一個(gè)現(xiàn)象：不管是什么類(lèi)型的結(jié)構(gòu)體元素?cái)?shù)組，經(jīng)典的 for 循環(huán)遍歷的性能比較一致，但是 for range 的遍歷性能會(huì)隨著結(jié)構(gòu)字段數(shù)量的增加而降低。

結(jié)論

對(duì)于遍歷大數(shù)組而言， for 循環(huán)能比 for range 循環(huán)更高效與穩(wěn)定，這一點(diǎn)在數(shù)組元素為結(jié)構(gòu)體類(lèi)型更加明顯。

另外，由于在 Go 中切片的底層都是通過(guò)數(shù)組來(lái)存儲(chǔ)數(shù)據(jù)，盡管有 for range 的副本復(fù)制問(wèn)題，但是切片副本指向的底層數(shù)組與原切片是一致的。這意味著，當(dāng)我們將數(shù)組通過(guò)切片代替后，不管是通過(guò) for range 或者 for 循環(huán)均能得到一致的穩(wěn)定的遍歷性能。

到此這篇關(guān)于Go 處理大數(shù)組使用 for range 和 for 循環(huán)的區(qū)別的文章就介紹到這了,更多相關(guān)Go 處理大數(shù)組內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: