易語言用正則采集百度知道的代碼
更新時間:2018年12月04日 08:55:18 作者:易語言源碼教程
今天小編就為大家分享一篇關于易語言用正則采集百度知道的代碼,小編覺得內容挺不錯的,現在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧
常量數據表
.版本 2 .常量 標題, "<文本長度: 25>", , "ti"((\r\n|\s*).*>.*)</a> .常量 標題需替換的內容, "<文本長度: 17>", , target="_blank"> .常量 提問時間, "<文本長度: 36>", , "mr-8">(\d{4,}-\d{1,}-\d{1,})</span> .常量 帖子鏈接與回答數量, "<文本長度: 93>", , <a href="(http:.*)" rel="external nofollow" target="_blank" class="f-light nod" data- log="pos:ans,si:\d{1,}">(.*)</a> .常量 回答內容, "<文本長度: 40>", , <i class="i-answer-text">答:</i>.*</dd> .常量 回答內容需替換的, "<文本長度: 25>", , <i class="i-answer-text"> .常量 回答者, "<文本長度: 27>", , 回答者:<a href=.*>(.*)</a>
百度知道采集器
此功能需要加載精易模塊5.6
.版本 2 .支持庫 iext .程序集 窗口程序集1 .程序集變量 搜索的內容, 文本型 .程序集變量 網頁源碼, 文本型 .程序集變量 頁碼變量, 整數型 .程序集變量 網址, 文本型 .子程序 _按鈕_搜索_被單擊 .局部變量 i, 整數型 .局部變量 i2, 整數型 .局部變量 i3, 整數型 .如果 (編輯框_搜索內容.內容 ≠ “”) 超級列表框1.全部刪除 () .判斷循環(huán)首 (頁碼變量 < 21) 搜索內容 () 正則 () 頁碼變量 = 頁碼變量 + 10 .判斷循環(huán)尾 () .計次循環(huán)首 (超級列表框1.取表項數 (), i2) 超級列表框1.置標題 (i2 - 1, 0, 到文本 (i2)) .計次循環(huán)尾 () 頁碼變量 = 0 .否則 信息框 (“請先輸入要搜索的問題”, #信息圖標, “提示”) 編輯框_搜索內容.獲取焦點 () .如果結束 .子程序 搜索內容 按鈕_搜索.標題 = “正在搜索中...” 搜索的內容 = 編輯框_搜索內容.內容 網址 = “http://zhidao.baidu.com/search?word=” + 編碼_URL編碼 (搜索的內容) + “&ie=gbk&site=-1&sites=0&date=0&pn=” + 到文本 (頁碼變量) 網頁源碼 = 網頁_取網頁源碼 (網址) .子程序 正則 .局部變量 正則標題與序號, 正則表達式類 .局部變量 局_計次, 整數型 .局部變量 表項索引, 整數型 .局部變量 正則鏈接與回答數, 正則表達式類 .局部變量 正則回答, 正則表達式類 .局部變量 正則回答時間, 正則表達式類 .局部變量 正則回答者, 正則表達式類 正則標題與序號.創(chuàng)建 (#標題, 網頁源碼) 正則鏈接與回答數.創(chuàng)建 (#帖子鏈接與回答數量, 網頁源碼) 正則回答.創(chuàng)建 (#回答內容, 網頁源碼) 正則回答時間.創(chuàng)建 (#提問時間, 網頁源碼) 正則回答者.創(chuàng)建 (#回答者, 網頁源碼) .計次循環(huán)首 (正則標題與序號.取匹配數量 (), 局_計次) 表項索引 = 超級列表框1.插入表項 (, , , , , ) 超級列表框1.置標題 (表項索引, 1, 文本_替換 (正則標題與序號.取子匹配文本 (局_計次, 1), , , , “>”, “”, “<em>”, “”, “</em>”, “</a>”, “<em”, “”, “</em”, “”)) ' 標題 .如果 (尋找文本 (正則鏈接與回答數.取子匹配文本 (局_計次, 1), “html”, , 假) = -1) 超級列表框1.置標題 (表項索引, 4, “”) .否則 超級列表框1.置標題 (表項索引, 4, 正則鏈接與回答數.取子匹配文本 (局_計次, 1)) ' 鏈接 .如果結束 超級列表框1.置標題 (表項索引, 2, 文本_替換 (正則回答.取匹配文本 (局_計次, ), , , , #回答內容需替換的, “”, “</i>”, “”, “<em>”, “”, “</em>”, “”, “</dd>”, “”)) ' 回答 超級列表框1.置標題 (表項索引, 3, 正則鏈接與回答數.取子匹配文本 (局_計次, 2)) ' 回答的數量 超級列表框1.置標題 (表項索引, 5, 正則回答時間.取子匹配文本 (局_計次, 1)) ' 回答的時間 .計次循環(huán)尾 () 按鈕_搜索.標題 = “搜索答案” .子程序 _超級列表框1_被雙擊, 邏輯型 .參數 橫向位置, 整數型 .參數 縱向位置, 整數型 .參數 功能鍵狀態(tài), 整數型 _預覽此內容_被選擇 () .子程序 _預覽此內容_被選擇 .如果真 (信息框 (_啟動窗口.超級列表框1.取標題 (_啟動窗口.超級列表框1.現行選中項, 2) + #換行符 + “-------------------------------” + #換行符 + “是否瀏覽更多回答?”, #是否鈕 + #詢問圖標, 超級列表框1.取標題 (超級列表框1.現行選中項, 1)) = #是鈕) _打開此鏈接_被選擇 () .如果真結束 .子程序 _超級列表框1_鼠標右鍵被按下, 邏輯型 .參數 橫向位置, 整數型 .參數 縱向位置, 整數型 .參數 功能鍵狀態(tài), 整數型 .如果真 (超級列表框1.取表項數 () ≠ 0) 彈出菜單 (菜單, , ) .如果真結束 .子程序 _打開此鏈接_被選擇 網頁_打開指定網址 (超級列表框1.取標題 (超級列表框1.現行選中項, 4)) .子程序 _復制回答_被選擇 .如果真 (置剪輯板文本 (超級列表框1.取標題 (超級列表框1.現行選中項, 2)) = 真) 信息框 (“成功復制!”, #信息圖標, “復制成功”) .如果真結束 .子程序 __啟動窗口_創(chuàng)建完畢 頁碼變量 = 0 編輯框_搜索內容.獲取焦點 () .子程序 _復制此鏈接_被選擇 .如果真 (置剪輯板文本 (超級列表框1.取標題 (超級列表框1.現行選中項, 4)) = 真) 信息框 (“成功復制!”, #信息圖標, “復制成功”) .如果真結束 .子程序 _編輯框_搜索內容_內容被改變 .如果真 (編輯框_搜索內容.內容 = “”) 頁碼變量 = 0 .如果真結束 .子程序 _編輯框_搜索內容_按下某鍵, 邏輯型 .參數 鍵代碼, 整數型 .參數 功能鍵狀態(tài), 整數型 .如果真 (鍵代碼 = #回車鍵) _按鈕_搜索_被單擊 () .如果真結束 .子程序 _獲取更多回答_被選擇 網頁_打開指定網址 (“http://zhidao.baidu.com/search?word=” + 編碼_URL編碼 (搜索的內容) + “&ie=gbk&site=-1&sites=0&date=0&pn=0”) .子程序 _按鈕_關閉_被單擊 結束 () .子程序 _按鈕_獲取更多回答_被單擊 _獲取更多回答_被選擇 ()
運行結果:
總結
以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對腳本之家的支持。如果你想了解更多相關內容請查看下面相關鏈接