火車采集器(LocoySpider) 9.4 破解特別安裝版
23.4MB / 09-28
火車采集器(LocoySpider) 網頁數據采集利器 V10.23 中文免費安裝
49.3MB / 07-18
火車采集器(LocoySpider) v2009 炎黃網絡合作版 商業(yè)版
26.76MB / 06-11
火車采集器(LocoySpider) v2009 sp2 Build 20090428
26MB / 04-12
火車采集器 V2008 官方正式最新版
21MB / 04-10
-
訊飛繪文(智能寫作分析軟件)v3.3.0 官方安裝版 站長工具 / 102MB
-
Octoparse(數據采集軟件) v8.7.6 官方免費安裝版 站長工具 / 82.7 MB
-
搜外內容管家(關鍵詞挖掘采集)v1.8.7 官方綠色版 站長工具 / 16.9MB
-
八爪魚采集器(網頁數據采集器) v8.7.7 正式安裝版 站長工具 / 81MB
-
后羿采集器 linux版 v4.0.4 官方免費版 站長工具 / 113MB
-
后羿采集器 v4.0.4 官方免費安裝版 站長工具 / 82.8MB
-
-
-
-
VovSoft Broken Link Detector(網站死鏈檢測)v4.2 綠色便攜版 站長工具 / 2.19MB
詳情介紹
火車采集器V7正式版新版本對程序進行了完全的重構,是一個全新的采集平臺。火車頭采集器v7.6企業(yè)版包含了數據采集最常用的計劃任務,數據發(fā)布,正文識別、OCR圖形圖像識別,采集入庫等模塊,可以支持其它采集軟件快速穩(wěn)定在平臺上使用。
火車采集器的產品特點:
1、無限級多頁采集,可以實現無限深度的采集
2、任務隊列運行管理,支持Cron表達式
3、無限級分組任務管理,任務回收站功能
4、RSS地址采集功能
5、列表頁分頁采集獲取功能
6、列表頁附加參數獲取功能
7、列表頁及標簽XPath可視化提取功能
8、標簽純正則替換功能
9、Http接口查看運行情況
10、導出記錄為單個或多個Txt、html 文件
11、標簽間自由組合功能
12、針對標簽內容繼續(xù)發(fā)送Http請求功能
13、無限級列表網址采集
14、從Http頭信息中獲取數據
15、標題內容正文提取功能
16、Aspx列表分頁自識別
17、多網站站群式web發(fā)布
18、導出記錄為Word格式
19、導出所有記錄為Excel格式
20、使用隨機二級代理服務器(支持Socket代理)
21、多擴展間數據交換功能
22、下載的圖片自動加增強型水印功能
23、Ocr識別(圖片轉化為文字)
24、Http接口管理采集器運行
25、Mongodb數據庫保存數據
26、主從服務器分布式采集
更新日志
火車采集器v7.6綠色正式版更新列表:
1、gif的圖片不再加水印,修復加水印文字時沒有判斷加水印條件的問題;
2、增加了迅雷快傳,YunFile,千腦,金山網盤文件上傳功能;
3、增加了用戶可以選擇刪除記錄時是否刪除下載文件的選項;
4、增加了日志記錄,通過上傳文件功能;
5、增加了批量導入數據導入網址功能;
6、添加了發(fā)布時使用代理功能;
7、修復當使用一般采一邊發(fā)方式時保存為本地excel不起作用的bug;
8、文件保存格式中支持[標簽:ID],可以將記錄的id做為目錄的一部分了;
9、處理了一個將$編碼錯誤的問題;
10、增加若干個錯誤檢查,防止采集器退出;
11、更換漢字轉拼音詞庫,漢字增加到1萬8;
12、更新自動補全鏈接中迅雷地址補全不對的問題。
軟件安裝使用說明:
火車頭采集平臺定義了統(tǒng)一的接口規(guī)范并提供了大量的api,用戶可以很方便的開發(fā)自己的應用并在該平臺上運行,可以減少開發(fā)上時間和成本。目前平臺上有官方自帶火車采集器。
此軟件版本為火車采集器v7.7綠色正式版,軟件下載后直接解壓即可。注意:軟件運行時,要有.net2.0框架,vista及win7系統(tǒng)用戶可能會提示請求管理員權限,請放行。如果沒有請下載!
安裝說明★★
火車頭數據采集平臺要求:您的電腦必須安裝.net framework2.0或2.0以上框架.如果您的采集器打不開,請下載并安裝該框架
附windows .net framework 2.0
升級說明
若要從3.2sp5,2008,2009或2010版直接升級到火車頭數據采集平臺最新版,請運行程序目錄下的 UpdateToV7.exe,按提示進行升級。升級程序不會對原來的數據進行任何的修改,但為了防止用戶誤操作,請在升級前備份舊版本數據和配置。備份方法是將原采集器完整復制一份。
采集相關術語
1.采集規(guī)則
簡稱規(guī)則,V7以前版本采集規(guī)則分為站點規(guī)則和任務規(guī)則,通常是指任務規(guī)則。V7版及以后采用無限級分組管理任務規(guī)則,所以不再有站點規(guī)則的概念。所謂采集規(guī)則就是要采集一個網站或某一網站欄目網頁需要在軟件里進行的設置。這個設置可以從軟件里導出保存成一個文件并可以再導入到軟件里。V7版的任務規(guī)則文件后綴名為.ljobx,以前的站點規(guī)則文件的后綴名為:.lsite;任務規(guī)則文件的后綴名為:.ljob。
2.采集任務
采集任務又簡稱為任務。它是采集規(guī)則和發(fā)布規(guī)則的總和。也是采集規(guī)則和發(fā)布規(guī)則的載體。采集規(guī)則和發(fā)布規(guī)則的設置通過在任務編輯框里進行設置。從采集器里導出的采集規(guī)則文件(.ljobx后綴的)也可稱為任務規(guī)則。導入導出任務規(guī)則就是指導入導出.ljobx文件。
3.發(fā)布模塊
發(fā)布模塊又稱模塊、發(fā)布規(guī)則,分為WEB發(fā)布模塊和數據庫發(fā)布模塊。所謂發(fā)布模塊就是在需要將已經采集的數據發(fā)布到目的地(比如:網站/后臺中或指定數據庫中)時在軟件里進行的設置。這個設置可以保存成一個文件并可以導入到采集器里使用。數據庫發(fā)布模塊文件的后綴名為:.dpm;WEB在線發(fā)布模塊文件的后綴名為:.wpm。(采集規(guī)則和發(fā)布模塊都可以從采集器里導出,也都可以導入到采集器中使用。采集規(guī)則負責將網頁上的數據采集下來,發(fā)布模塊負責將采集的數據發(fā)布到網站中??梢?,采集規(guī)則的編寫和修改和被采集的網站有關系,而發(fā)布模塊的編寫和修改和要發(fā)布數據的網站有關系。如從不同的網站欄目采集數據往同一個網站的某個板塊(頻道)里發(fā)布,需要多個采集規(guī)則和一個發(fā)布模塊。從一個網站欄目采集數據往不同的網站系統(tǒng)里發(fā)布,需要一個采集規(guī)則和多個發(fā)布模塊。注意這里的說的采集規(guī)則是指采集網站和抓取內容的設置。)
下載地址
人氣軟件
相關文章
-
搜外內容管家(關鍵詞挖掘采集)v1.8.7 官方綠色版
搜外內容管家支持鍵詞挖掘、文章采集、問答組合功能,同時支持將文章自動發(fā)布到網站上,本站提供的是這款軟件的安裝版本...
-
水淼網站權重查詢助手 V1.0.0.0 綠色便攜版
水淼網站權重查詢助手支持查詢百度PC、百度移動、搜狗PC、搜狗移動等,本站提供的是這款軟件的綠色版本...
-
訊飛繪文(智能寫作分析軟件)v3.3.0 官方安裝版
訊飛繪文是一款AI智能寫作軟件,支持選題、寫作、配圖、排版、潤色、發(fā)布、數據分析等功能,適用于公眾號、頭條號和新聞等多種場景,該軟件集成了內容運營的全流程,能夠實時捕...
-
網站爬蟲實時分析 VovSoft SEO Checker v9.4 多語綠色便攜版
VovSoft SEO Checker是一款易于使用的網站爬蟲,能夠高效地爬取小型和超大型網站,同時讓您找到失效鏈接,實時分析結果,收集現場數據,歡迎需要的朋友下載使用...
-
全網熱點要聞采集器 V2.0 綠色便攜版
全網熱點要聞采集器支持一鍵采集全網熱點要聞,是自媒體從業(yè)者必備神器等...
-
VovSoft Bulk Domain Appraisal 破解補丁/注冊機 v3.4 綠色版 附激活教程
VovSoft Bulk Domain Appraisal 激活補丁,域名評估軟件,VovSoft Bulk Domain Appraisal是一款域名評估軟件,也是站長必備工具之一,但是VovSoft Bulk Domain Appraisal需...
下載聲明
☉ 解壓密碼:www.dbjr.com.cn 就是本站主域名,希望大家看清楚,[ 分享碼的獲取方法 ]可以參考這篇文章
☉ 推薦使用 [ 迅雷 ] 下載,使用 [ WinRAR v5 ] 以上版本解壓本站軟件。
☉ 如果這個軟件總是不能下載的請在評論中留言,我們會盡快修復,謝謝!
☉ 下載本站資源,如果服務器暫不能下載請過一段時間重試!或者多試試幾個下載地址
☉ 如果遇到什么問題,請評論留言,我們定會解決問題,謝謝大家支持!
☉ 本站提供的一些商業(yè)軟件是供學習研究之用,如用于商業(yè)用途,請購買正版。
☉ 本站提供的火車采集器(LocoySpider)網絡數據采集器 v7.6 正式綠色免費版資源來源互聯網,版權歸該下載資源的合法擁有者所有。