dede3.1分頁(yè)文字采集過(guò)濾規(guī)則詳說(shuō)(圖文教程)續(xù)二
更新時(shí)間:2007年04月03日 00:00:00 作者:
稍微了解dede采集規(guī)則的朋友上篇內(nèi)容完全可以略過(guò),下面看看如何以靜制動(dòng)、以不變就萬(wàn)變地解決分頁(yè)采集問(wèn)題。
二、采集新目標(biāo)
目標(biāo)地址:
1、http://www.tiansou.net/Html/Y_CYFW/R_Gzzj/F_Gzjh/index.html
2、http://www.tiansou.net/Html/Y_CYFW/R_Gzzj/F_Gzjh/2007-2/9/20070209110903558.html
之所以選取兩個(gè)目標(biāo)頁(yè)面,是因?yàn)橐陨系膬蓚€(gè)頁(yè)面一個(gè)有分頁(yè),而另一個(gè)沒(méi)有,并且在分頁(yè)和全文取樣部分有較大的差別。以下的說(shuō)明是在為采集目標(biāo)地址(首頁(yè))全部鏈接的基礎(chǔ)上改動(dòng)的,個(gè)別地方會(huì)顯得蛇足,只為說(shuō)明的方便。
目標(biāo)文字部分頭部代碼1:
目標(biāo)文字部分頭部代碼2:
通過(guò)比較不難發(fā)現(xiàn),兩個(gè)文字部分的開始采集部分能確定下來(lái)為描黑部分,開頭部分好說(shuō),代碼如下:
<TR>
<TD height="8"></TD>
</TR>
<TR>
<TD valign="top" class=Connet><p>
目標(biāo)文尾及分頁(yè)區(qū)域代碼1:
目標(biāo)文尾及分頁(yè)區(qū)域代碼2:

比較一下兩個(gè)結(jié)尾,盡管想把第一個(gè)的結(jié)尾再往前提一點(diǎn),但沒(méi)法子,要考慮到全部鏈接的共同部分,就只好取描黑的部分了,這也給今后確定過(guò)濾規(guī)則添了點(diǎn)麻煩,這是后話。先把結(jié)尾部分確定了吧:
</p>
</TD>
</TR>
二、采集新目標(biāo)
目標(biāo)地址:
1、http://www.tiansou.net/Html/Y_CYFW/R_Gzzj/F_Gzjh/index.html
2、http://www.tiansou.net/Html/Y_CYFW/R_Gzzj/F_Gzjh/2007-2/9/20070209110903558.html
之所以選取兩個(gè)目標(biāo)頁(yè)面,是因?yàn)橐陨系膬蓚€(gè)頁(yè)面一個(gè)有分頁(yè),而另一個(gè)沒(méi)有,并且在分頁(yè)和全文取樣部分有較大的差別。以下的說(shuō)明是在為采集目標(biāo)地址(首頁(yè))全部鏈接的基礎(chǔ)上改動(dòng)的,個(gè)別地方會(huì)顯得蛇足,只為說(shuō)明的方便。
目標(biāo)文字部分頭部代碼1:

目標(biāo)文字部分頭部代碼2:

通過(guò)比較不難發(fā)現(xiàn),兩個(gè)文字部分的開始采集部分能確定下來(lái)為描黑部分,開頭部分好說(shuō),代碼如下:
復(fù)制代碼 代碼如下:
<TR>
<TD height="8"></TD>
</TR>
<TR>
<TD valign="top" class=Connet><p>
目標(biāo)文尾及分頁(yè)區(qū)域代碼1:

目標(biāo)文尾及分頁(yè)區(qū)域代碼2:

比較一下兩個(gè)結(jié)尾,盡管想把第一個(gè)的結(jié)尾再往前提一點(diǎn),但沒(méi)法子,要考慮到全部鏈接的共同部分,就只好取描黑的部分了,這也給今后確定過(guò)濾規(guī)則添了點(diǎn)麻煩,這是后話。先把結(jié)尾部分確定了吧:
復(fù)制代碼 代碼如下:
</p>
</TD>
</TR>
相關(guān)文章
php使用redis的有序集合zset實(shí)現(xiàn)延遲隊(duì)列應(yīng)用示例
這篇文章主要介紹了php使用redis的有序集合zset實(shí)現(xiàn)延遲隊(duì)列,結(jié)合具體實(shí)例形式分析了PHP基于redis的有序集合zset實(shí)現(xiàn)延遲隊(duì)列的具體原理、應(yīng)用場(chǎng)景及相關(guān)操作技巧,需要的朋友可以參考下2020-02-02晉城吧對(duì)DiscuzX進(jìn)行的前端優(yōu)化要點(diǎn)
晉城吧的服務(wù)器在美國(guó),延遲相對(duì)國(guó)內(nèi)略微要高一些,所以優(yōu)化就顯得非常重要。2010-09-09PHP實(shí)現(xiàn)的pdo連接數(shù)據(jù)庫(kù)并插入數(shù)據(jù)功能簡(jiǎn)單示例
這篇文章主要介紹了PHP實(shí)現(xiàn)的pdo連接數(shù)據(jù)庫(kù)并插入數(shù)據(jù)功能,結(jié)合簡(jiǎn)單示例形式分析了pdo數(shù)據(jù)庫(kù)連接及執(zhí)行基本的插入SQL語(yǔ)句相關(guān)操作技巧,需要的朋友可以參考下2019-03-03PHP判斷IP并轉(zhuǎn)跳到相應(yīng)城市分站的方法
這篇文章主要介紹了PHP判斷IP并轉(zhuǎn)跳到相應(yīng)城市分站的方法,實(shí)例分析了php解析URL及跳轉(zhuǎn)的技巧,具有一定參考借鑒價(jià)值,需要的朋友可以參考下2015-03-03