crawler4j對(duì)已有編碼的頁(yè)面抓取效果不錯(cuò),用jsoup解析,很多會(huì)jquery的程序員都可以操作。但是,crawler4j對(duì)response沒(méi)有指定編碼的頁(yè)面,解析成亂碼,很讓人煩惱。在找了苦悶之中,無(wú)意間發(fā)現(xiàn)一年代已久的博文,可以解決問(wèn)題,修改 Page.load() 中的 contentData 編碼即可,這讓我心中頓時(shí)舒坦了很多,接下來(lái)的問(wèn)題都引刃
www.dbjr.com.cn/article/487...htm 2025-5-26