京東賣家信息采集器 V3.0.1.0 綠色便攜版
2.4MB / 02-03
百度貼吧關(guān)鍵詞篩選工具 v0.0.1 官方綠色免費版
32.1MB / 06-23
B站新番動漫前50排行榜軟件 v1.0 免費綠色版
356KB / 06-22
悟空問答自動答題軟件 v1.0 免費版
139MB / 06-21
北京四中網(wǎng)校問題抓取器 v1.0 免費綠色版
401KB / 06-25
-
-
-
推將軍自媒體管家(短視頻圖文批量發(fā)布工具) v3.1.0.7403 官方安 網(wǎng)絡(luò)輔助 / 25.6MB
-
-
-
小紅書解封助手 V1.1.2.1 綠色便攜版 網(wǎng)絡(luò)輔助 / 5.26MB
-
Listary Pro(文件瀏覽/搜索增強工具) v6.3.2.88 中文免費最新版 網(wǎng)絡(luò)輔助 / 12.8MB
-
黑馬超級遠程桌面 V10.12.0 免費安裝版 網(wǎng)絡(luò)輔助 / 39.6MB
-
DU Meter網(wǎng)絡(luò)流量監(jiān)控軟件 v8.10 多國語言安裝版 網(wǎng)絡(luò)輔助 / 10.01MB
-
詳情介紹
XPath2Doc是一款實用的數(shù)據(jù)采集軟件。這款軟件支持自動采集網(wǎng)頁生成Word docx文件,還可以讀取瀏覽器打開的網(wǎng)站頁面源代碼,功能非常豐富實用。感興趣的朋友不要錯過了。
軟件說明
XPath2Doc(通用網(wǎng)站數(shù)據(jù)采集及Doc生成工具)是一個半自動采集網(wǎng)頁生成Word docx文件的工具,帶企查查、天眼查采集配置,使用XPath2Doc需要自己在WebBrowser窗口里面手工登錄,并找到需要的數(shù)據(jù)頁面,然后點擊程序按鈕進行采集,所以是個半自動的網(wǎng)頁數(shù)據(jù)填充Docx工具。
工作原理
網(wǎng)頁的每個元素,都可以表示成為XPath語句,所以我們可以讀取瀏覽器打開的網(wǎng)站頁面源代碼,通過XPath語句得到網(wǎng)頁元素中的文本。
XPath語句的獲取辦法:
通常我們可以使用谷歌的Chrome瀏覽器打開網(wǎng)站頁面,按F12調(diào)出開發(fā)者工具界面,在ELements選項卡下,隨著鼠標的移動可以看到網(wǎng)頁內(nèi)容被陰影覆蓋,點開三角符號,可以更進一步定位準確的位置,直到找到最終需要的數(shù)據(jù)位置。在找到的文本上點鼠標右鍵,在彈出的菜單中,選擇Copy-Copy XPath,然后粘貼到記事本即可得到需要的XPath語句。
這里需要說明一點:如果拷貝出來的XPath語句中有/tbody會影響采集,程序內(nèi)部對此問題進行了處理,但可能會在某些特殊情況下還是會影響數(shù)據(jù)采集,可以手工去掉。
運行環(huán)境
Windows7 Sp1操作系統(tǒng)請安裝下面的組件(重要:VC庫如果不安裝,本程序無法啟動):
VC2017往上
.net framework 4.5.2
在Windows10系統(tǒng)下上述組件一般自帶,不需要單獨安裝。Windows10 1903運行通過。
不支持Windows XP操作系統(tǒng)。
操作說明
1、本程序工作需要三個配置文件:General.ini,自定義.ini,自定義模板.docx。后兩個文件名自己定義。
General.ini文件中定義了INI文件和Docx模板文件的存放目錄,可以不填,默認是程序所在目錄。
自定義.ini、自定義模板.docx是軟件使用者自己創(chuàng)建的網(wǎng)頁采集XPath語句及最后生成文件所用的Docx模板,具體設(shè)置方法請看ini文件中的說明。注意,Docx模板文件中的“@<#0001#>@”之類的字符是在INI文件中定義的用于替換網(wǎng)頁采集內(nèi)容的標記字符串。ini文件中定義了替換關(guān)鍵字的前后綴和模板文件名。
2、使用本程序前,請先建立好你自己的INI配置文件和Docx模板文件。(具體可以參見附帶的企查查、天眼查兩個配置文件和起訴書模板)
需要說明的是,模板文件支持對文檔的不同部分使用不同的網(wǎng)址進行采集,注意Url的設(shè)置。
使用方法
啟動程序--選擇模板--點擊采集數(shù)據(jù)按鈕旁邊的黑色三角符號,點開下拉菜單,點擊需要采集的部分。等候瀏覽器加載網(wǎng)頁完畢,手工輸入需要查詢的內(nèi)容,點擊查詢,找到數(shù)據(jù)的具體頁面,然后點擊采集數(shù)據(jù)按鈕,觀察右側(cè)的列表中是不是已經(jīng)得到需要的數(shù)據(jù)。繼續(xù)點開下拉菜單,選擇下一個需要采集的部分,如果網(wǎng)址發(fā)生了變化要等候瀏覽器加載完畢,找到需要的數(shù)據(jù)頁面。點擊采集數(shù)據(jù)按鈕觀察右側(cè)列表中是不是得到了第二部分的數(shù)據(jù)。如此反復(fù),直到數(shù)據(jù)全部采集完畢。
如果前后兩部分的網(wǎng)址相同,在點擊下一部分的下拉菜單之前,要先在瀏覽器中重新查詢新的數(shù)據(jù),等新數(shù)據(jù)頁面出來之后在點擊下拉菜單選擇下一部分進行采集。(網(wǎng)址相同的情況下,點擊下一部分會直接從網(wǎng)頁取數(shù)據(jù),如果瀏覽器沒有換頁面,數(shù)據(jù)就錯了。)如果某個部分需要重新采集,請先點擊下拉菜單中的該部分名稱,然后點擊采集按鈕重復(fù)采集該部分(此時可以隨意改變?yōu)g覽器的數(shù)據(jù)頁面,得到的就是不同公司數(shù)據(jù))。
列表中采集得到的數(shù)據(jù)結(jié)果如果有偏差,可以單擊自行修改。XPath語句如果有什么錯誤,也可以自己修改看測試結(jié)果(XPath語句在修改后會立即重新抓取瀏覽器的數(shù)據(jù),所以瀏覽器最好是有效數(shù)據(jù)頁面),在程序中修改的XPath語句,不會保存到INI文件中,請自行手工保存。
如果列表中數(shù)據(jù)無誤,預(yù)覽窗口中的Docx模板內(nèi)容也正確,則可以點擊創(chuàng)建文檔按鈕,填寫要生成的文件名,本軟件會使用抓取到的網(wǎng)頁數(shù)據(jù)替換模板中的索引字符串,自動生成Docx文檔。
需要說明的是,右下角的Docx預(yù)覽窗口不能完整的支持Word文檔,對不標準的文檔可能會出現(xiàn)文本缺失或者錯位現(xiàn)象。遇到這種情況,可以忽略,或者將模板文件改成規(guī)范的文本格式(單倍行距)。
下載地址
人氣軟件
下拉通刷詞軟件 v3.1 官方最新綠色版
自動投票工具2014 自動投票軟件 v1.0 綠色版
淘寶助理 v5.6.8.0 綠色免費版
江蘇交通學(xué)習(xí)網(wǎng)插件(jsjtxx.exe插件) v5.1 官方中文綠色版
圖吧工具箱附帶超多功能 v2024.08 免費綠色版
NetSpot(無線網(wǎng)絡(luò)管理軟件) v2.15.790.0 官方免費安裝版
百度下拉框(百度推薦詞)優(yōu)化精靈 v2.55 綠色版
360離線搶票 8.1.0.295 官方版
Echo回聲網(wǎng)App音樂外鏈下載解析助手 v1.2 最新綠色中文版
新浪微博自動發(fā)布工具 v8.7 綠色免費版 實現(xiàn)微博定時發(fā)送功能
相關(guān)文章
-
菠蘿云端口映射工具(支持IPV6) v1.0 免費綠色版
菠蘿云端口映射工具是一款功能強大 永久免費 的全功能端口轉(zhuǎn)發(fā)工具(支持IPV4、支持IPV6),需要的朋友可以收藏一下...
-
無線分析工具WinFi v2.0 安裝免費版
WinFi是一個WiFi分析和故障排除工具,可以用來檢測無線網(wǎng)絡(luò)的強度、干擾和連接問題,歡迎需要的朋友下載使用...
-
推將軍自媒體管家(短視頻圖文批量發(fā)布工具) v3.1.0.7403 官方安裝版
推將軍自媒體管家是一款功能強大的免費自媒體發(fā)布與賬號管理軟件,專為內(nèi)容創(chuàng)作者和自媒體從業(yè)者打造,它支持70多個主流自媒體平臺,支持短視頻、圖文的一鍵批量發(fā)布,讓用...
-
Wi-Fi Filter Tool過濾工具 V1.1 綠色便攜版
Wi-Fi Filter Tool過濾工具在電腦中使用的網(wǎng)絡(luò)軟件,該軟件支持只顯示需要的WiFi,自動屏蔽其他信號等...
-
公眾號文章封面圖提取下載器(自媒體必備神器) v2.0 綠色免費版
公眾號文章封面圖提取下載器(自媒體必備神器)是一款一鍵批量下載公眾號文章內(nèi)容/圖片/封面提取器,該工具可輕松提取公眾號文章面,歡迎需要的朋友下載使用...
-
藍牛窗口自動關(guān)閉助手 V1.0.0 綠色便攜版
藍牛窗口自動關(guān)閉助手將會自動檢測并關(guān)閉掉彈窗,界面簡潔,易于上手,本站提供的是這款軟件的綠色版本...
下載聲明
☉ 解壓密碼:www.dbjr.com.cn 就是本站主域名,希望大家看清楚,[ 分享碼的獲取方法 ]可以參考這篇文章
☉ 推薦使用 [ 迅雷 ] 下載,使用 [ WinRAR v5 ] 以上版本解壓本站軟件。
☉ 如果這個軟件總是不能下載的請在評論中留言,我們會盡快修復(fù),謝謝!
☉ 下載本站資源,如果服務(wù)器暫不能下載請過一段時間重試!或者多試試幾個下載地址
☉ 如果遇到什么問題,請評論留言,我們定會解決問題,謝謝大家支持!
☉ 本站提供的一些商業(yè)軟件是供學(xué)習(xí)研究之用,如用于商業(yè)用途,請購買正版。
☉ 本站提供的XPath2Doc(數(shù)據(jù)采集軟件) v1.0.0.0 免費安裝版 資源來源互聯(lián)網(wǎng),版權(quán)歸該下載資源的合法擁有者所有。