欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Go編譯原理之函數(shù)內聯(lián)

 更新時間:2022年08月05日 12:03:21   作者:書旅  
這篇文章主要為大家介紹了Go編譯原理之函數(shù)內聯(lián)示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪

前言

在前一篇文章中分享了編譯器優(yōu)化的變量捕獲部分,本文分享編譯器優(yōu)化的另一個內容—函數(shù)內聯(lián)。函數(shù)內聯(lián)是指將將較小的函數(shù)內容,直接放入到調用者函數(shù)中,從而減少函數(shù)調用的開銷

函數(shù)內聯(lián)概述

我們知道每一個高級編程語言的函數(shù)調用,成本都是在與需要為它分配棧內存來存儲參數(shù)、返回值、局部變量等等,Go的函數(shù)調用的成本在于參數(shù)與返回值棧復制、較小的棧寄存器開銷以及函數(shù)序言部分的檢查棧擴容(Go語言中的棧是可以動態(tài)擴容的,因為Go在分配棧內存不是逐漸增加的,而是一次性分配,這樣是為了避免訪問越界,它會一次性分配,當檢查到分配的棧內存不夠用時,它會擴容一個足夠大的??臻g,并將原來棧中的內容拷貝過來)

下邊寫一段代碼,通過Go的基準測試來測一下函數(shù)內聯(lián)帶來的效率提升

import "testing"
//go:noinline //禁用內聯(lián)。如果要開啟內聯(lián),將該行注釋去掉即可
func max(a, b int) int {
	if a > b {
		return a
	}
	return b
}
var Result int
func BenchmarkMax(b *testing.B)  {
	var r int
	for i:=0; i< b.N; i++ {
		r = max(-1, i)
	}
	Result = r
}

在編譯的過程中,Go的編譯器其實會計算函數(shù)內聯(lián)花費的成本,所以只有簡單的函數(shù),才會觸發(fā)函數(shù)內聯(lián)。在后邊函數(shù)內聯(lián)的源碼實現(xiàn)中,我們可以看到下邊這些情況不會被內聯(lián):

  • 遞歸函數(shù)
  • 函數(shù)前有如下注釋的:go:noinlinego:norace、go:nocheckptr、go:uintptrescapes
  • 沒有函數(shù)體
  • 函數(shù)聲明的抽象語法樹中節(jié)點數(shù)大于5000(我的Go版本是1.16.6)(也就是函數(shù)內部語句太多的情況,也不會被內聯(lián))
  • 函數(shù)中包含閉包(OCLOSURE)、range(ORANGE)、select(OSELECT)、go(OGO)、defer(ODEFER)、type(ODCLTYPE)、返回值是函數(shù)(ORETJMP)的,都不會內聯(lián)

我們也可以構建或編譯的時候,通過參數(shù)去控制它是否可以內聯(lián)。如果希望程序中所有的函數(shù)都不執(zhí)行內聯(lián)操作

go build -gcflags="-l" xxx.go
go tool compile -l xxx.go

同樣我們在編譯時,也可以查看哪些函數(shù)內聯(lián)了,哪些函數(shù)沒內聯(lián),以及原因是什么

go tool compile -m=2 xxx.go

看一個例子

package main
func test1(a, b int) int {
	return a+b
}
func step(n int) int {
	if n &lt; 2 {
		return n
	}
	return step(n-1) + step(n-2)
}
func main()  {
	test1(1, 2)
	step(5)
}

可以看到test1這個函數(shù)是可以內聯(lián)的,因為它的函數(shù)體很簡單。step這個函數(shù)因為是遞歸函數(shù),所以它不會進行內聯(lián)

函數(shù)內聯(lián)底層實現(xiàn)

這里邊其實每一個函數(shù)調用鏈都很深,我這里不會一行一行的解釋代碼的含義,僅僅會將一些核心的方法拿出來介紹一下,感興趣的小伙伴可以自己去調試一下(前邊有發(fā)相關文章)(Go源碼調試方法

還是前邊提到多次的Go編譯入口文件,你可以在入口文件中找到這段代碼

Go編譯入口文件:src/cmd/compile/main.go -> gc.Main(archInit)
// Phase 5: Inlining
if Debug.l != 0 {
		// 查找可以內聯(lián)的函數(shù)
		visitBottomUp(xtop, func(list []*Node, recursive bool) {
			numfns := numNonClosures(list)
			for _, n := range list {
				if !recursive || numfns > 1 {
					caninl(n)
				} else {
					......
				}
				inlcalls(n)
			}
		})
	}
	for _, n := range xtop {
		if n.Op == ODCLFUNC {
			devirtualize(n)
		}
	}

下邊就看一下每個方法都在做哪些事情

visitBottomUp

該方法有兩個參數(shù):

  • xtop:前邊已經見過它了,它存放的是每個聲明語句的抽象語法樹的根節(jié)點數(shù)組
  • 第二個參數(shù)是一個函數(shù)(該函數(shù)也有兩個參數(shù),一個是滿足是函數(shù)類型聲明的抽象語法樹根節(jié)點數(shù)組,一個是bool值,true表示是遞歸函數(shù),false表示不是遞歸函數(shù))

進入到visitBottomUp方法中,你會發(fā)現(xiàn)它主要是遍歷xtop,并對每個抽象語法樹的根節(jié)點調用了visit這個方法(僅針對是函數(shù)類型聲明的抽象語法樹)

func visitBottomUp(list []*Node, analyze func(list []*Node, recursive bool)) {
	var v bottomUpVisitor
	v.analyze = analyze
	v.nodeID = make(map[*Node]uint32)
	for _, n := range list {
		if n.Op == ODCLFUNC && !n.Func.IsHiddenClosure() { //是函數(shù),并且不是閉包函數(shù)
			v.visit(n)
		}
	}
}

visit方法的核心是調用了inspectList方法,通過inspectList對抽象語法樹按照深度優(yōu)先搜索進行遍歷,并將每一個節(jié)點作為inspectList方法的第二個參數(shù)(是一個函數(shù))的參數(shù),比如驗證這個函數(shù)里邊是否有遞歸調用等(具體就是下邊的switch case)

func (v *bottomUpVisitor) visit(n *Node) uint32 {
	if id := v.nodeID[n]; id > 0 {
		// already visited
		return id
	}
	......
	v.stack = append(v.stack, n)
	inspectList(n.Nbody, func(n *Node) bool {
		switch n.Op {
		case ONAME:
			if n.Class() == PFUNC {
				......
			}
		case ODOTMETH:
			fn := asNode(n.Type.Nname())
			......
			}
		case OCALLPART:
			fn := asNode(callpartMethod(n).Type.Nname())
			......
		case OCLOSURE:
			if m := v.visit(n.Func.Closure); m < min {
				min = m
			}
		}
		return true
	})
		v.analyze(block, recursive)
	}
	return min
}

后邊通過調用visitBottomUp的第二個參數(shù)傳遞的方法,對抽象語法樹進行內聯(lián)的判斷及內聯(lián)操作,具體就是caninlinlcalls這兩個方法

caninl

該方法的作用就是驗證是函數(shù)類型聲明的抽象語法樹是否可以內聯(lián)

這個方法的實現(xiàn)很簡單,首先是通過很多的if語句驗證函數(shù)前邊是否有像go:noinline等這種標記

func caninl(fn *Node) {
	if fn.Op != ODCLFUNC {
		Fatalf("caninl %v", fn)
	}
	if fn.Func.Nname == nil {
		Fatalf("caninl no nname %+v", fn)
	}
	var reason string // reason, if any, that the function was not inlined
	......
	// If marked "go:noinline", don't inline
	if fn.Func.Pragma&Noinline != 0 {
		reason = "marked go:noinline"
		return
	}
	// If marked "go:norace" and -race compilation, don't inline.
	if flag_race && fn.Func.Pragma&Norace != 0 {
		reason = "marked go:norace with -race compilation"
		return
	}
	......
	// If fn has no body (is defined outside of Go), cannot inline it.
	if fn.Nbody.Len() == 0 {
		reason = "no function body"
		return
	}
	visitor := hairyVisitor{
		budget:        inlineMaxBudget,
		extraCallCost: cc,
		usedLocals:    make(map[*Node]bool),
	}
	if visitor.visitList(fn.Nbody) {
		reason = visitor.reason
		return
	}
	if visitor.budget < 0 {
		reason = fmt.Sprintf("function too complex: cost %d exceeds budget %d", inlineMaxBudget-visitor.budget, inlineMaxBudget)
		return
	}
	n.Func.Inl = &Inline{
		Cost: inlineMaxBudget - visitor.budget,
		Dcl:  inlcopylist(pruneUnusedAutos(n.Name.Defn.Func.Dcl, &visitor)),
		Body: inlcopylist(fn.Nbody.Slice()),
	}
	......
}

這里邊還有一個主要的方法就是visitList,它是用來驗證函數(shù)里邊是否有我們上邊提到的go、select、range等等這些語句。對于滿足內聯(lián)條件的,它會將改寫該函數(shù)聲明抽閑語法樹的內聯(lián)字段(Inl)

inlcalls

該方法中就是具體的內聯(lián)操作,比如將函數(shù)的參數(shù)和返回值轉換為調用者中的聲明語句等。里邊的調用和實現(xiàn)都比較復雜,這里不粘代碼了,大家可自行去看。函數(shù)內聯(lián)的核心方法都在如下文件中

src/cmd/compile/internal/gc/inl.go

以上就是Go編譯原理之函數(shù)內聯(lián)的詳細內容,更多關于Go編譯原理函數(shù)內聯(lián)的資料請關注腳本之家其它相關文章!

相關文章

  • 在ubuntu下構建go語言開發(fā)環(huán)境的方法

    在ubuntu下構建go語言開發(fā)環(huán)境的方法

    這篇文章主要介紹了在ubuntu下構建go語言開發(fā)環(huán)境的方法,需要的朋友可以參考下
    2014-10-10
  • 深入了解Golang中的反射機制

    深入了解Golang中的反射機制

    反射是指在程序運行時動態(tài)地檢查和修改對象的能力,在Go語言中,通過反射可以在運行時檢查變量的類型、獲取結構體字段和方法的信息,以及動態(tài)調用方法等操作,本文將帶你深入了解Golang中的反射機制,感興趣的同學可以跟著小編一起來學習
    2023-05-05
  • Go語言利用接口實現(xiàn)鏈表插入功能詳解

    Go語言利用接口實現(xiàn)鏈表插入功能詳解

    這篇文章主要為大家介紹了Go語言中的接口,以及如何利用接口實現(xiàn)鏈表插入功能,文中的示例代碼講解詳細,感興趣的小伙伴可以了解一下
    2022-04-04
  • Go語言讀取YAML 配置文件的兩種方式分享

    Go語言讀取YAML 配置文件的兩種方式分享

    在日常開發(fā)中,YAML 格式的文件基本上被默認為是配置文件,其內容因為縮進帶來的層級感看起來非常直觀和整潔。本文分享了讀取YAML 配置文件的兩種方式,需要的可以參考一下
    2022-12-12
  • 淺談Golang的new與make區(qū)別是什么

    淺談Golang的new與make區(qū)別是什么

    本文主要介紹了Golang的new與make區(qū)別是什么,文中通過示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2022-04-04
  • Golang 中整數(shù)轉字符串的方法

    Golang 中整數(shù)轉字符串的方法

    這篇文章主要介紹了Golang 中整數(shù)轉字符串的方法,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2018-06-06
  • 使用 go 實現(xiàn)多線程下載器的方法

    使用 go 實現(xiàn)多線程下載器的方法

    本篇文章帶領大家學習使用go實現(xiàn)一個簡單的多線程下載器,給她家詳細介紹了多線程下載原理及實例代碼,感興趣的朋友跟隨小編一起看看吧
    2021-10-10
  • Go語言對字符串進行SHA1哈希運算的方法

    Go語言對字符串進行SHA1哈希運算的方法

    這篇文章主要介紹了Go語言對字符串進行SHA1哈希運算的方法,實例分析了Go語言針對字符串操作的技巧,具有一定參考借鑒價值,需要的朋友可以參考下
    2015-03-03
  • Golang多線程下載器實現(xiàn)高效快速地下載大文件

    Golang多線程下載器實現(xiàn)高效快速地下載大文件

    Golang多線程下載器是一種高效、快速地下載大文件的方法。Golang語言天生支持并發(fā)和多線程,可以輕松實現(xiàn)多線程下載器的開發(fā)。通過使用Golang的協(xié)程和通道,可以將下載任務分配到多個線程中并行處理,提高了下載的效率和速度
    2023-05-05
  • Go語言學習教程之指針的示例詳解

    Go語言學習教程之指針的示例詳解

    這篇文章主要通過簡單的練習來讓大家對Go語言中的指針有所了解,文中的示例代碼講解詳細,對我們學習Go語言有一定幫助,需要的可以參考一下
    2022-09-09

最新評論