京東賣家信息采集器 V3.0.1.0 綠色便攜版
2.4MB / 02-03
百度貼吧關(guān)鍵詞篩選工具 v0.0.1 官方綠色免費(fèi)版
32.1MB / 06-23
B站新番動(dòng)漫前50排行榜軟件 v1.0 免費(fèi)綠色版
356KB / 06-22
悟空問答自動(dòng)答題軟件 v1.0 免費(fèi)版
139MB / 06-21
北京四中網(wǎng)校問題抓取器 v1.0 免費(fèi)綠色版
401KB / 06-25
-
-
神斧小助手(公眾號(hào)多賬號(hào)管理) v5.9.4 免費(fèi)安裝版 網(wǎng)絡(luò)輔助 / 222 MB
-
推將軍自媒體管家(短視頻圖文批量發(fā)布工具) v3.1.0.7403 官方安 網(wǎng)絡(luò)輔助 / 25.6MB
-
-
-
小紅書解封助手 V1.1.2.1 綠色便攜版 網(wǎng)絡(luò)輔助 / 5.26MB
-
Listary Pro(文件瀏覽/搜索增強(qiáng)工具) v6.3.2.88 中文免費(fèi)最新版 網(wǎng)絡(luò)輔助 / 12.8MB
-
黑馬超級(jí)遠(yuǎn)程桌面 V10.12.0 免費(fèi)安裝版 網(wǎng)絡(luò)輔助 / 39.6MB
-
DU Meter網(wǎng)絡(luò)流量監(jiān)控軟件 v8.10 多國(guó)語(yǔ)言安裝版 網(wǎng)絡(luò)輔助 / 10.01MB
-
詳情介紹
XPath2Doc是一款實(shí)用的數(shù)據(jù)采集軟件。這款軟件支持自動(dòng)采集網(wǎng)頁(yè)生成Word docx文件,還可以讀取瀏覽器打開的網(wǎng)站頁(yè)面源代碼,功能非常豐富實(shí)用。感興趣的朋友不要錯(cuò)過(guò)了。
軟件說(shuō)明
XPath2Doc(通用網(wǎng)站數(shù)據(jù)采集及Doc生成工具)是一個(gè)半自動(dòng)采集網(wǎng)頁(yè)生成Word docx文件的工具,帶企查查、天眼查采集配置,使用XPath2Doc需要自己在WebBrowser窗口里面手工登錄,并找到需要的數(shù)據(jù)頁(yè)面,然后點(diǎn)擊程序按鈕進(jìn)行采集,所以是個(gè)半自動(dòng)的網(wǎng)頁(yè)數(shù)據(jù)填充Docx工具。
工作原理
網(wǎng)頁(yè)的每個(gè)元素,都可以表示成為XPath語(yǔ)句,所以我們可以讀取瀏覽器打開的網(wǎng)站頁(yè)面源代碼,通過(guò)XPath語(yǔ)句得到網(wǎng)頁(yè)元素中的文本。
XPath語(yǔ)句的獲取辦法:
通常我們可以使用谷歌的Chrome瀏覽器打開網(wǎng)站頁(yè)面,按F12調(diào)出開發(fā)者工具界面,在ELements選項(xiàng)卡下,隨著鼠標(biāo)的移動(dòng)可以看到網(wǎng)頁(yè)內(nèi)容被陰影覆蓋,點(diǎn)開三角符號(hào),可以更進(jìn)一步定位準(zhǔn)確的位置,直到找到最終需要的數(shù)據(jù)位置。在找到的文本上點(diǎn)鼠標(biāo)右鍵,在彈出的菜單中,選擇Copy-Copy XPath,然后粘貼到記事本即可得到需要的XPath語(yǔ)句。
這里需要說(shuō)明一點(diǎn):如果拷貝出來(lái)的XPath語(yǔ)句中有/tbody會(huì)影響采集,程序內(nèi)部對(duì)此問題進(jìn)行了處理,但可能會(huì)在某些特殊情況下還是會(huì)影響數(shù)據(jù)采集,可以手工去掉。
運(yùn)行環(huán)境
Windows7 Sp1操作系統(tǒng)請(qǐng)安裝下面的組件(重要:VC庫(kù)如果不安裝,本程序無(wú)法啟動(dòng)):
VC2017往上
.net framework 4.5.2
在Windows10系統(tǒng)下上述組件一般自帶,不需要單獨(dú)安裝。Windows10 1903運(yùn)行通過(guò)。
不支持Windows XP操作系統(tǒng)。
操作說(shuō)明
1、本程序工作需要三個(gè)配置文件:General.ini,自定義.ini,自定義模板.docx。后兩個(gè)文件名自己定義。
General.ini文件中定義了INI文件和Docx模板文件的存放目錄,可以不填,默認(rèn)是程序所在目錄。
自定義.ini、自定義模板.docx是軟件使用者自己創(chuàng)建的網(wǎng)頁(yè)采集XPath語(yǔ)句及最后生成文件所用的Docx模板,具體設(shè)置方法請(qǐng)看ini文件中的說(shuō)明。注意,Docx模板文件中的“@<#0001#>@”之類的字符是在INI文件中定義的用于替換網(wǎng)頁(yè)采集內(nèi)容的標(biāo)記字符串。ini文件中定義了替換關(guān)鍵字的前后綴和模板文件名。
2、使用本程序前,請(qǐng)先建立好你自己的INI配置文件和Docx模板文件。(具體可以參見附帶的企查查、天眼查兩個(gè)配置文件和起訴書模板)
需要說(shuō)明的是,模板文件支持對(duì)文檔的不同部分使用不同的網(wǎng)址進(jìn)行采集,注意Url的設(shè)置。
使用方法
啟動(dòng)程序--選擇模板--點(diǎn)擊采集數(shù)據(jù)按鈕旁邊的黑色三角符號(hào),點(diǎn)開下拉菜單,點(diǎn)擊需要采集的部分。等候?yàn)g覽器加載網(wǎng)頁(yè)完畢,手工輸入需要查詢的內(nèi)容,點(diǎn)擊查詢,找到數(shù)據(jù)的具體頁(yè)面,然后點(diǎn)擊采集數(shù)據(jù)按鈕,觀察右側(cè)的列表中是不是已經(jīng)得到需要的數(shù)據(jù)。繼續(xù)點(diǎn)開下拉菜單,選擇下一個(gè)需要采集的部分,如果網(wǎng)址發(fā)生了變化要等候?yàn)g覽器加載完畢,找到需要的數(shù)據(jù)頁(yè)面。點(diǎn)擊采集數(shù)據(jù)按鈕觀察右側(cè)列表中是不是得到了第二部分的數(shù)據(jù)。如此反復(fù),直到數(shù)據(jù)全部采集完畢。
如果前后兩部分的網(wǎng)址相同,在點(diǎn)擊下一部分的下拉菜單之前,要先在瀏覽器中重新查詢新的數(shù)據(jù),等新數(shù)據(jù)頁(yè)面出來(lái)之后在點(diǎn)擊下拉菜單選擇下一部分進(jìn)行采集。(網(wǎng)址相同的情況下,點(diǎn)擊下一部分會(huì)直接從網(wǎng)頁(yè)取數(shù)據(jù),如果瀏覽器沒有換頁(yè)面,數(shù)據(jù)就錯(cuò)了。)如果某個(gè)部分需要重新采集,請(qǐng)先點(diǎn)擊下拉菜單中的該部分名稱,然后點(diǎn)擊采集按鈕重復(fù)采集該部分(此時(shí)可以隨意改變?yōu)g覽器的數(shù)據(jù)頁(yè)面,得到的就是不同公司數(shù)據(jù))。
列表中采集得到的數(shù)據(jù)結(jié)果如果有偏差,可以單擊自行修改。XPath語(yǔ)句如果有什么錯(cuò)誤,也可以自己修改看測(cè)試結(jié)果(XPath語(yǔ)句在修改后會(huì)立即重新抓取瀏覽器的數(shù)據(jù),所以瀏覽器最好是有效數(shù)據(jù)頁(yè)面),在程序中修改的XPath語(yǔ)句,不會(huì)保存到INI文件中,請(qǐng)自行手工保存。
如果列表中數(shù)據(jù)無(wú)誤,預(yù)覽窗口中的Docx模板內(nèi)容也正確,則可以點(diǎn)擊創(chuàng)建文檔按鈕,填寫要生成的文件名,本軟件會(huì)使用抓取到的網(wǎng)頁(yè)數(shù)據(jù)替換模板中的索引字符串,自動(dòng)生成Docx文檔。
需要說(shuō)明的是,右下角的Docx預(yù)覽窗口不能完整的支持Word文檔,對(duì)不標(biāo)準(zhǔn)的文檔可能會(huì)出現(xiàn)文本缺失或者錯(cuò)位現(xiàn)象。遇到這種情況,可以忽略,或者將模板文件改成規(guī)范的文本格式(單倍行距)。
下載地址
人氣軟件
下拉通刷詞軟件 v3.1 官方最新綠色版
自動(dòng)投票工具2014 自動(dòng)投票軟件 v1.0 綠色版
淘寶助理 v5.6.8.0 綠色免費(fèi)版
江蘇交通學(xué)習(xí)網(wǎng)插件(jsjtxx.exe插件) v5.1 官方中文綠色版
圖吧工具箱附帶超多功能 v2024.08 免費(fèi)綠色版
NetSpot(無(wú)線網(wǎng)絡(luò)管理軟件) v2.15.790.0 官方免費(fèi)安裝版
百度下拉框(百度推薦詞)優(yōu)化精靈 v2.55 綠色版
360離線搶票 8.1.0.295 官方版
Echo回聲網(wǎng)App音樂外鏈下載解析助手 v1.2 最新綠色中文版
新浪微博自動(dòng)發(fā)布工具 v8.7 綠色免費(fèi)版 實(shí)現(xiàn)微博定時(shí)發(fā)送功能
相關(guān)文章
-
菠蘿云端口映射工具(支持IPV6) v1.0 免費(fèi)綠色版
菠蘿云端口映射工具是一款功能強(qiáng)大 永久免費(fèi) 的全功能端口轉(zhuǎn)發(fā)工具(支持IPV4、支持IPV6),需要的朋友可以收藏一下...
-
無(wú)線分析工具WinFi v2.0 安裝免費(fèi)版
WinFi是一個(gè)WiFi分析和故障排除工具,可以用來(lái)檢測(cè)無(wú)線網(wǎng)絡(luò)的強(qiáng)度、干擾和連接問題,歡迎需要的朋友下載使用...
-
推將軍自媒體管家(短視頻圖文批量發(fā)布工具) v3.1.0.7403 官方安裝版
推將軍自媒體管家是一款功能強(qiáng)大的免費(fèi)自媒體發(fā)布與賬號(hào)管理軟件,專為內(nèi)容創(chuàng)作者和自媒體從業(yè)者打造,它支持70多個(gè)主流自媒體平臺(tái),支持短視頻、圖文的一鍵批量發(fā)布,讓用...
-
Wi-Fi Filter Tool過(guò)濾工具 V1.1 綠色便攜版
Wi-Fi Filter Tool過(guò)濾工具在電腦中使用的網(wǎng)絡(luò)軟件,該軟件支持只顯示需要的WiFi,自動(dòng)屏蔽其他信號(hào)等...
-
公眾號(hào)文章封面圖提取下載器(自媒體必備神器) v2.0 綠色免費(fèi)版
公眾號(hào)文章封面圖提取下載器(自媒體必備神器)是一款一鍵批量下載公眾號(hào)文章內(nèi)容/圖片/封面提取器,該工具可輕松提取公眾號(hào)文章面,歡迎需要的朋友下載使用...
-
藍(lán)牛窗口自動(dòng)關(guān)閉助手 V1.0.0 綠色便攜版
藍(lán)牛窗口自動(dòng)關(guān)閉助手將會(huì)自動(dòng)檢測(cè)并關(guān)閉掉彈窗,界面簡(jiǎn)潔,易于上手,本站提供的是這款軟件的綠色版本...
下載聲明
☉ 解壓密碼:www.dbjr.com.cn 就是本站主域名,希望大家看清楚,[ 分享碼的獲取方法 ]可以參考這篇文章
☉ 推薦使用 [ 迅雷 ] 下載,使用 [ WinRAR v5 ] 以上版本解壓本站軟件。
☉ 如果這個(gè)軟件總是不能下載的請(qǐng)?jiān)谠u(píng)論中留言,我們會(huì)盡快修復(fù),謝謝!
☉ 下載本站資源,如果服務(wù)器暫不能下載請(qǐng)過(guò)一段時(shí)間重試!或者多試試幾個(gè)下載地址
☉ 如果遇到什么問題,請(qǐng)?jiān)u論留言,我們定會(huì)解決問題,謝謝大家支持!
☉ 本站提供的一些商業(yè)軟件是供學(xué)習(xí)研究之用,如用于商業(yè)用途,請(qǐng)購(gòu)買正版。
☉ 本站提供的XPath2Doc(數(shù)據(jù)采集軟件) v1.0.0.0 免費(fèi)安裝版 資源來(lái)源互聯(lián)網(wǎng),版權(quán)歸該下載資源的合法擁有者所有。