詳解50行代碼,Node爬蟲(chóng)練手項(xiàng)目
First
項(xiàng)目地址:Crawler-for-Github-Trending
項(xiàng)目中基本每一句代碼都寫(xiě)有注釋(因?yàn)榫瓦@么幾行😂),適合對(duì)Node爬蟲(chóng)感興趣的同學(xué)入入門(mén)。
Introduction
50 lines, minimalist node crawler for Trending.
一個(gè)50行的node爬蟲(chóng),一個(gè)簡(jiǎn)單的 axios, express, cheerio 體驗(yàn)項(xiàng)目。
Usage
首先保證電腦已存在node環(huán)境,然后
1.拉取本項(xiàng)目
git clone https://github.com/ZY2071/Crawler-for-Github-Trending.git cd Crawler-for-Github-Trending npm i node index.js
2.或者下載本項(xiàng)目壓縮包,解壓
cd Crawler-for-Github-Trending-master // 進(jìn)入項(xiàng)目文件夾 npm i node index.js
Examples
當(dāng)啟動(dòng)項(xiàng)目后,可以看到控制臺(tái)輸出
Listening on port 3000!
此時(shí)打開(kāi)瀏覽器,進(jìn)入本地服務(wù) http://localhost:3000/daily
http://localhost:3000/time-language // time表示周期,language代表語(yǔ)言 例如:
http://localhost:3000/daily // 代表今日 可選參數(shù):weekly,monthly
http://localhost:3000/daily-JavaScript// 代表今日的java分類 可選參數(shù):任意語(yǔ)言
稍微等待即可看到爬取完畢的返回?cái)?shù)據(jù):
[ { "title": "lib-pku / libpku", "links": "https://github.com/lib-pku/libpku", "description": "貴校課程資料民間整理", "language": "JavaScript", "stars": "14,297", "forks": "4,360", "info": "3,121 stars this week" }, { "title": "SqueezerIO / squeezer", "links": "https://github.com/SqueezerIO/squeezer", "description": "Squeezer Framework - Build serverless dApps", "language": "JavaScript", "stars": "3,212", "forks": "80", "info": "2,807 stars this week" }, ... ]
More
本項(xiàng)目?jī)H供爬取體驗(yàn),每次訪問(wèn)都會(huì)實(shí)時(shí)爬取數(shù)據(jù),所以數(shù)據(jù)返回速度會(huì)比較慢,實(shí)際操作應(yīng)該是定時(shí)爬取數(shù)據(jù)然后將數(shù)據(jù)存進(jìn)數(shù)據(jù)庫(kù),數(shù)據(jù)從數(shù)據(jù)庫(kù)返回從而提高數(shù)據(jù)返回效率。
但項(xiàng)目很基礎(chǔ),可以作為以上各個(gè)node模塊最基礎(chǔ)的練手使用,希望可以幫到大家 😀
- 詳解Node使用Puppeteer完成一次復(fù)雜的爬蟲(chóng)
- nodejs制作爬蟲(chóng)實(shí)現(xiàn)批量下載圖片
- 利用node.js寫(xiě)一個(gè)爬取知乎妹紙圖的小爬蟲(chóng)
- 詳解nodejs爬蟲(chóng)程序解決gbk等中文編碼問(wèn)題
- 簡(jiǎn)單好用的nodejs 爬蟲(chóng)框架分享
- 利用Node.js制作爬取大眾點(diǎn)評(píng)的爬蟲(chóng)
- nodeJs爬蟲(chóng)獲取數(shù)據(jù)簡(jiǎn)單實(shí)現(xiàn)代碼
- Node.js編寫(xiě)爬蟲(chóng)的基本思路及抓取百度圖片的實(shí)例分享
- 基于Node.js的強(qiáng)大爬蟲(chóng) 能直接發(fā)布抓取的文章哦
- NodeJS制作爬蟲(chóng)全過(guò)程(續(xù))
相關(guān)文章
Node.js的模塊化機(jī)制和Buffer對(duì)象詳解
這篇文章主要為大家詳細(xì)介紹了Node.js的模塊化機(jī)制和Buffer對(duì)象,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下,希望能夠給你帶來(lái)幫助2022-02-02node.js使用zlib模塊進(jìn)行數(shù)據(jù)壓縮和解壓操作示例
這篇文章主要介紹了node.js使用zlib模塊進(jìn)行數(shù)據(jù)壓縮和解壓操作,結(jié)合實(shí)例形式詳細(xì)分析了node.js基于zlib模塊創(chuàng)建數(shù)據(jù)流以及壓縮和解壓縮等相關(guān)操作技巧,需要的朋友可以參考下2020-02-02Node.js定時(shí)任務(wù)之node-schedule使用詳解
這篇文章主要介紹了Node.js定時(shí)任務(wù)之node-schedule使用詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-08-08node.js在Linux下執(zhí)行shell命令、.sh腳本的問(wèn)題
很多時(shí)候需要多個(gè)命令來(lái)完成一項(xiàng)工作,而這個(gè)工作又常常是重復(fù)的,這個(gè)時(shí)候我們自然會(huì)想到將這些命令寫(xiě)成sh腳本,下次執(zhí)行下這個(gè)腳本一切就都搞定了,下面就是發(fā)布代碼的一個(gè)腳本示例2022-01-01node.js多個(gè)異步過(guò)程中判斷執(zhí)行是否完成的解決方案
這篇文章主要給大家介紹了關(guān)于node.js多個(gè)異步過(guò)程中判斷執(zhí)行是否完成的幾種解決方案,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來(lái)一起看看吧。2017-12-12nodeJS(express4.x)+vue(vue-cli)構(gòu)建前后端分離實(shí)例(帶跨域)
這篇文章主要介紹了nodeJS(express4.x)+vue(vue-cli)構(gòu)建前后端分離實(shí)例(帶跨域) ,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2017-07-07如何優(yōu)雅地在Node應(yīng)用中進(jìn)行錯(cuò)誤異常處理
這篇文章主要介紹了如何優(yōu)雅地在Node應(yīng)用中進(jìn)行錯(cuò)誤處理,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-11-11從零學(xué)習(xí)node.js之mysql數(shù)據(jù)庫(kù)的操作(五)
因?yàn)榻佑|Node.JS已經(jīng)有一段時(shí)間了,最近粗略的研究了一下node.js操作數(shù)據(jù)庫(kù)的包,覺(jué)得node.js連接數(shù)據(jù)庫(kù)不錯(cuò)。下面這篇文章主要給大家介紹了node.js之mysql數(shù)據(jù)庫(kù)操作的相關(guān)資料,需要的朋友可以參考下。2017-02-02基于Node.js實(shí)現(xiàn)nodemailer郵件發(fā)送
Nodemailer 是一個(gè)簡(jiǎn)單易用的 Node.JS 郵件發(fā)送模塊(通過(guò) SMTP,sendmail,或者 Amazon SES),支持 unicode,你可以使用任何你喜歡的字符集。Nodemailer是一個(gè)簡(jiǎn)單易用的Node.js郵件發(fā)送組件,需要的朋友可以參考下2016-01-01