func main() {
	url := "http://localhost:3000/api/v1/products"
	start := time.Now()
	for i := 0; i < 10; i++ {
		Spider(url, i)
	}
	elapsed := time.Since(start)
	fmt.Printf("Time %s", elapsed)
}

爬取函數(shù)

func Spider(url string, i int) {
	reqSpider, err := http.NewRequest("GET", url, nil)
	if err != nil {
		log.Fatal(err)
	}
	reqSpider.Header.Set("content-length", "0")
	reqSpider.Header.Set("accept", "*/*")
	reqSpider.Header.Set("x-requested-with", "XMLHttpRequest")
	respSpider, err := Client.Do(reqSpider)
	if err != nil {
		log.Fatal(err)
	}
	bodyText, _ := ioutil.ReadAll(respSpider.Body)
	var result Result
	_ = json.Unmarshal(bodyText, &result)
	fmt.Println(i,result.Data)
}

運行時間為：651.8207ms

在這里插入圖片描述

2. 多線程爬蟲

2.1 channel main函數(shù)

我們構(gòu)造一個無緩沖的通道，來阻塞主進程，等待子進程的執(zhí)行。

func main() {
	url := "http://localhost:3000/api/v1/products"
	ch := make(chan bool)
	start := time.Now()
	for i := 0; i < 10; i++ {
		go Spider(url, ch, i)
	}
	for i := 0; i < 10; i++ {
		<-ch
	}
	elapsed := time.Since(start)
	fmt.Printf("Time %s", elapsed)
}

最后記得在爬蟲的結(jié)束的時候，把值寫入到通道中，不然會一直阻塞主進程

在這里插入圖片描述

運行時間：187.7921ms 比之前快了非常多。

在這里插入圖片描述

2.2 sync.WaitGroup

定義一個進程組并加10個進程

	var wg sync.WaitGroup
	wg.Add(10)

開辟十個goruntime

	for i := 0; i < 10; i++ {
		go func(i int) {
			defer wg.Done()
			SpiderWaitGroup(url,i)
		}(i)
	}

阻塞主進程

wg.Wait()

結(jié)果：64.5246ms

在這里插入圖片描述

3. 源碼地址

GitHub地址：https://github.com/CocaineCong/Go-Spider-Demo

	NormalStart(url) // 單線程爬蟲
	ChannelStart(url) // Channel多線程爬蟲
	WaitGroupStart(url) // Wait 多線程爬蟲

其實多線程的兩種都差不多的，只是有時候會因為機器的原因而導(dǎo)致一些誤差。

在這里插入圖片描述

到此這篇關(guān)于Go語言并發(fā)爬蟲的具體實現(xiàn)的文章就介紹到這了,更多相關(guān)Go語言并發(fā)爬蟲內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

軟件下載

源碼下載

軟件編程

網(wǎng)絡(luò)編程

在線工具

數(shù)據(jù)庫

CMS

常用工具

Go語言并發(fā)爬蟲的具體實現(xiàn)

目錄

寫在前面

1. 單線程爬蟲

2. 多線程爬蟲

2.1 channel main函數(shù)

2.2 sync.WaitGroup

3. 源碼地址

相關(guān)文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具