欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

使用webmagic實現(xiàn)爬蟲程序示例分享

 更新時間:2014年04月17日 09:19:01   作者:  
這篇文章主要介紹了使用webmagic實現(xiàn)爬蟲程序示例,需要的朋友可以參考下

復制代碼 代碼如下:

package com.letv.cloud.spider;

import java.util.HashSet;
import java.util.List;

import us.codecraft.webmagic.Page;
import us.codecraft.webmagic.Site;
import us.codecraft.webmagic.Spider;
import us.codecraft.webmagic.processor.PageProcessor;

public class MoviePaperPageProcessor implements PageProcessor {
 private Site page = Site.me().setRetryTimes(3).setSleepTime(1000);

 public Site getSite() {
  return page;
 }

 public void process(Page page) {
  List<String> links = page.getHtml().links().regex(
    "http://posters.aa.com/poster/\\d+").all();
  links = removeDuplicate(links);
  page.addTargetRequests(links);
  page.putField("title", page.getHtml().xpath(
    "http://div[@id='imdbleftsecc']/center/h1/text()").toString());
  page.putField("imgurl", page.getHtml().xpath(
    "http://div[@id='imdbleftsecc']/center/img/@src").toString());
 }

 public static void main(String[] args) {
  for (int i = 1; i <= 3; i++) {
   Spider.create(new MoviePaperPageProcessor()).addUrl(
     "http://posters.aa.co/poster_page/" + i).thread(5).run();
  }
 }

 public static List removeDuplicate(List list) {
  HashSet hs = new HashSet(list);
  list.clear();
  list.addAll(hs);
  return list;
 }
}

相關(guān)文章

  • java多線程Future和Callable類示例分享

    java多線程Future和Callable類示例分享

    JAVA多線程實現(xiàn)方式主要有三種:繼承Thread類、實現(xiàn)Runnable接口、使用ExecutorService、Callable、Future實現(xiàn)有返回結(jié)果的多線程。其中前兩種方式線程執(zhí)行完后都沒有返回值,只有最后一種是帶返回值的。今天我們就來研究下Future和Callable的實現(xiàn)方法
    2016-01-01
  • java 中 String format 和Math類實例詳解

    java 中 String format 和Math類實例詳解

    這篇文章主要介紹了java 中 String format 和Math類實例詳解的相關(guān)資料,需要的朋友可以參考下
    2017-06-06
  • Java的long和bigint長度對比詳解

    Java的long和bigint長度對比詳解

    在本文中小編給大家分享了關(guān)于Java的long和bigint長度比較的知識點內(nèi)容,有興趣的朋友們學習參考下。
    2019-07-07
  • java  中OkHttp的使用方法及實例

    java 中OkHttp的使用方法及實例

    這篇文章主要介紹了java 中OkHttp的使用方法及實例的相關(guān)資料,需要的朋友可以參考下
    2017-06-06
  • 詳解spring自動掃描包

    詳解spring自動掃描包

    這篇文章主要介紹了spring自動掃描包的相關(guān)知識,本文通過實例相結(jié)合的形式給大家介紹的非常詳細,感興趣的朋友跟隨腳本之家小編一起看看吧
    2018-06-06
  • springmvc json類型轉(zhuǎn)換錯誤解決方案

    springmvc json類型轉(zhuǎn)換錯誤解決方案

    這篇文章主要介紹了springmvc json類型轉(zhuǎn)換錯誤解決方案,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2019-12-12
  • 實例詳解SpringMVC入門使用

    實例詳解SpringMVC入門使用

    大家好,本篇文章主要講的是實例詳解SpringMVC入門使用,感興趣的同學趕快來看一看吧,對你有幫助的話記得收藏一下,方便下次瀏覽
    2021-12-12
  • mybatis-plus QueryWrapper and or 連用并且實現(xiàn)分頁

    mybatis-plus QueryWrapper and or 連用并且實現(xiàn)分

    這篇文章主要介紹了mybatis-plus QueryWrapper and or 連用并且實現(xiàn)分頁,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2022-01-01
  • java 中動態(tài)代理詳解及實例

    java 中動態(tài)代理詳解及實例

    這篇文章主要介紹了java 中動態(tài)代理詳解及實例的相關(guān)資料,需要的朋友可以參考下
    2017-06-06
  • transactionAttributes各屬性意義及配置

    transactionAttributes各屬性意義及配置

    這篇文章主要介紹了transactionAttributes各屬性意義及配置,具有一定參考價值,需要的朋友可以了解下。
    2017-09-09

最新評論