欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

java實(shí)現(xiàn)一個(gè)簡(jiǎn)單的網(wǎng)絡(luò)爬蟲(chóng)代碼示例

 更新時(shí)間:2017年11月13日 08:50:04   作者:在遠(yuǎn)行的路上  
這篇文章主要介紹了java實(shí)現(xiàn)一個(gè)簡(jiǎn)單的網(wǎng)絡(luò)爬蟲(chóng)代碼示例,還是挺不錯(cuò)的,這里分享給大家,需要的朋友可以參考下。

目前市面上流行的爬蟲(chóng)以python居多,簡(jiǎn)單了解之后,覺(jué)得簡(jiǎn)單的一些頁(yè)面的爬蟲(chóng),主要就是去解析目標(biāo)頁(yè)面(html)。那么就在想,java有沒(méi)有用戶方便解析html頁(yè)面呢?找到了一個(gè)jsoup包,一個(gè)非常方便解析html的工具呢。

使用方式也非常簡(jiǎn)單,引入jar包:

<dependency>
  <groupId>org.jsoup</groupId>
  <artifactId>jsoup</artifactId>
  <version>1.8.3</version>
</dependency>

使用http工具,請(qǐng)求獲取目標(biāo)頁(yè)面的整個(gè)html頁(yè)面信息,然后使用jsoup解析:

//獲取html頁(yè)面信息
String html = getHtml();
//使用jsoup將html解析為Document對(duì)象
Document doc = Jsoup.parse(html);
//后續(xù)操作就可以解析這個(gè)DOM樹(shù)了,非常簡(jiǎn)單。

總結(jié)

以上就是本文關(guān)于java實(shí)現(xiàn)一個(gè)簡(jiǎn)單的網(wǎng)絡(luò)爬蟲(chóng)代碼示例的全部?jī)?nèi)容,希望對(duì)大家有所幫助。感興趣的朋友可以繼續(xù)參閱本站:

分享一個(gè)簡(jiǎn)單的java爬蟲(chóng)框架

Java NIO實(shí)例UDP發(fā)送接收數(shù)據(jù)代碼分享

Javaweb應(yīng)用使用限流處理大量的并發(fā)請(qǐng)求詳解

如有不足之處,歡迎留言指出。感謝朋友們對(duì)本站的支持!

相關(guān)文章

最新評(píng)論