欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

基于node.js實現(xiàn)爬蟲的講解

 更新時間:2019年02月18日 16:49:09   作者:Inside_Zhang  
今天小編就為大家分享一篇關(guān)于基于node.js實現(xiàn)爬蟲的講解,小編覺得內(nèi)容挺不錯的,現(xiàn)在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧

1. cheerio 與 request

  • request:模擬客戶端行為,對頁面進行請求
  • cheerio:對服務(wù)器端返回的頁面進行解析;
var cheerio = require('cheerio');
var request = require('request');
var startUrl = 'http://www.baidu.com'
request(startUrl, function(err, response) {
  if (err) {
    console.log(err);
  }
  var $ = cheerio.load(response.body);
  var title = $('title').text();
  console.log(title);
}

2. 認識 cheerio

獲取 element 位置

通過 class 屬性進行匹配:

var $=cheerio.load('<div class="container"></div>'); 
$('.container')

取其鏈接:<a class="downbtn" href="http://mov.bn.netease.com/mobilev/2013/1/F/G/S8KTEF7FG.mp4" id="M8KTEKR84" target="_blank"></a>

$('a.downbtn').attr('href')

某一頁面下的全部可鏈接:

var url = 
var $ = cheerio.load(data);
  $("a.downbtn").each(function(i, e) {
    console.log($(e).attr("href"));
  });
  console.log("done");
 } else {
   console.log("error");
 } 

總結(jié)

以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,謝謝大家對腳本之家的支持。如果你想了解更多相關(guān)內(nèi)容請查看下面相關(guān)鏈接

相關(guān)文章

最新評論