欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

golang解析網(wǎng)頁利器goquery的使用方法

 更新時間:2017年09月30日 09:22:51   作者:Tomoya  
這篇文章主要給大家介紹了關(guān)于golang解析網(wǎng)頁利器goquery的使用方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考借鑒,下面來一起學(xué)習(xí)學(xué)習(xí)吧。

前言

本文主要給大家介紹了關(guān)于golang解析網(wǎng)頁利器goquery使用的相關(guān)內(nèi)容,分享出來供大家參考學(xué)習(xí),下面話不多說了,來一起看看詳細(xì)的介紹吧。

java里用Jsoup,nodejs里用cheerio,都可以相當(dāng)方便的解析網(wǎng)頁,在golang語言里也找到了一個網(wǎng)頁解析的利器,相當(dāng)?shù)暮糜?,選擇器跟jQuery一樣

安裝

go get github.com/PuerkitoBio/goquery

使用

其實(shí)就是項(xiàng)目的readme.md里的demo

package main

import (
 "fmt"
 "log"

 "github.com/PuerkitoBio/goquery"
)

func ExampleScrape() {
 doc, err := goquery.NewDocument("http://metalsucks.net")
 if err != nil {
 log.Fatal(err)
 }

 // Find the review items
 doc.Find(".sidebar-reviews article .content-block").Each(func(i int, s *goquery.Selection) {
 // For each item found, get the band and title
 band := s.Find("a").Text()
 title := s.Find("i").Text()
 fmt.Printf("Review %d: %s - %s\n", i, band, title)
 })
}

func main() {
 ExampleScrape()
}

亂碼問題

中文網(wǎng)頁都會有亂碼問題,因?yàn)樗J(rèn)是utf8編碼,這時候就要用到轉(zhuǎn)碼器了

安裝 iconv-go

go get github.com/djimenez/iconv-go

使用方法

func ExampleScrape() {
 res, err := http.Get(baseUrl)
 if err != nil {
 fmt.Println(err.Error())
 } else {
 defer res.Body.Close()
 utfBody, err := iconv.NewReader(res.Body, "gb2312", "utf-8")
 if err != nil {
  fmt.Println(err.Error())
 } else {
  doc, err := goquery.NewDocumentFromReader(utfBody)
  // 下面就可以用doc去獲取網(wǎng)頁里的結(jié)構(gòu)數(shù)據(jù)了
  // 比如
  doc.Find("li").Each(func(i int, s *goquery.Selection) {
  fmt.Println(i, s.Text())
  })
 }
 }
}

進(jìn)階

有些網(wǎng)站會設(shè)置Cookie, Referer等驗(yàn)證,可以在http發(fā)請求之前設(shè)置上請求的頭信息

這個不屬于goquery里的東西了,想了解更多可以查看golang里的 net/http 包下的方法等信息

baseUrl:="http://baidu.com"
client:=&http.Client{}
req, err := http.NewRequest("GET", baseUrl, nil)
req.Header.Add("User-Agent", "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36")
req.Header.Add("Referer", baseUrl)
req.Header.Add("Cookie", "your cookie") // 也可以通過req.Cookie()的方式來設(shè)置cookie
res, err := client.Do(req)
defer res.Body.Close()
//最后直接把res傳給goquery就可以來解析網(wǎng)頁了
doc, err := goquery.NewDocumentFromResponse(res)

總結(jié)

以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,如果有疑問大家可以留言交流,謝謝大家對腳本之家的支持。

參考

  • https://github.com/PuerkitoBio/goquery
  • https://github.com/PuerkitoBio/goquery/issues/185
  • https://github.com/PuerkitoBio/goquery/wiki/Tips-and-tricks#handle-non-utf8-html-pages

相關(guān)文章

  • 使用go自定義prometheus的exporter

    使用go自定義prometheus的exporter

    在prometheus中如果要監(jiān)控服務(wù)器和應(yīng)用的各種指標(biāo),需要用各種各樣的exporter服務(wù),這篇文章主要介紹了使用go自定義prometheus的exporter,需要的朋友可以參考下
    2023-03-03
  • Go語言規(guī)范context?類型的key用法示例解析

    Go語言規(guī)范context?類型的key用法示例解析

    這篇文章主要為大家介紹了Go語言規(guī)范context?類型的key用法示例解析,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2023-08-08
  • Go語言中循環(huán)Loop的用法介紹

    Go語言中循環(huán)Loop的用法介紹

    這篇文章介紹了Go語言中循環(huán)Loop的用法,文中通過示例代碼介紹的非常詳細(xì)。對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2022-07-07
  • go責(zé)任鏈行為型設(shè)計模式Chain?Of?Responsibility

    go責(zé)任鏈行為型設(shè)計模式Chain?Of?Responsibility

    這篇文章主要為大家介紹了go行為型設(shè)計模式之責(zé)任鏈Chain?Of?Responsibility使用示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2023-12-12
  • go語言goto語句跳轉(zhuǎn)到指定的標(biāo)簽實(shí)現(xiàn)方法

    go語言goto語句跳轉(zhuǎn)到指定的標(biāo)簽實(shí)現(xiàn)方法

    這篇文章主要介紹了go語言goto語句跳轉(zhuǎn)到指定的標(biāo)簽實(shí)現(xiàn)方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-05-05
  • 深入理解golang的基本類型排序與slice排序

    深入理解golang的基本類型排序與slice排序

    大家都知道排序有內(nèi)部排序和外部排序,內(nèi)部排序是數(shù)據(jù)記錄在內(nèi)存中進(jìn)行排序,而外部排序是因排序的數(shù)據(jù)很大,一次不能容納全部的排序記錄,在排序過程中需要訪問外存。下面就來詳細(xì)介紹golang的基本類型排序與slice排序,有需要的朋友們可以參考借鑒。
    2016-09-09
  • go for range坑和閉包坑的分析

    go for range坑和閉包坑的分析

    今天小編就為大家分享一篇關(guān)于go for range坑和閉包坑的分析,小編覺得內(nèi)容挺不錯的,現(xiàn)在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧
    2019-04-04
  • Golang線程池與協(xié)程池的使用

    Golang線程池與協(xié)程池的使用

    在Golang中,線程池和協(xié)程池是非常常見且重要的概念,它們可以提高應(yīng)用程序的并發(fā)處理能力和性能,減少資源的浪費(fèi),本文就來介紹一下Golang線程池與協(xié)程池的使用,感興趣的可以了解一下
    2024-04-04
  • Golang函數(shù)式編程深入分析實(shí)例

    Golang函數(shù)式編程深入分析實(shí)例

    習(xí)慣與函數(shù)式編程語言的開發(fā)者,會認(rèn)為for循環(huán)和if判斷語句是冗長的代碼,通過使用map和filter處理集合元素讓代碼更可讀。本文介紹Go閉包實(shí)現(xiàn)集合轉(zhuǎn)換和過濾功能
    2023-01-01
  • 深入理解Go語言實(shí)現(xiàn)多態(tài)?

    深入理解Go語言實(shí)現(xiàn)多態(tài)?

    本文主要介紹了Go語言實(shí)現(xiàn)多態(tài),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2022-05-05

最新評論