欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

XPath2Doc(數(shù)據(jù)采集軟件) v1.0.0.0 免費(fèi)安裝版

數(shù)據(jù)采集工具下載

  • 軟件大?。?span>14.6MB
  • 軟件語(yǔ)言:簡(jiǎn)體中文
  • 軟件類型:國(guó)產(chǎn)軟件
  • 軟件授權(quán):免費(fèi)軟件
  • 軟件類別:網(wǎng)絡(luò)輔助
  • 應(yīng)用平臺(tái):Windows平臺(tái)
  • 更新時(shí)間:2019-06-25
  • 網(wǎng)友評(píng)分:
360通過(guò) 騰訊通過(guò) 金山通過(guò)

情介紹

XPath2Doc是一款實(shí)用的數(shù)據(jù)采集軟件。這款軟件支持自動(dòng)采集網(wǎng)頁(yè)生成Word docx文件,還可以讀取瀏覽器打開的網(wǎng)站頁(yè)面源代碼,功能非常豐富實(shí)用。感興趣的朋友不要錯(cuò)過(guò)了。

軟件說(shuō)明

XPath2Doc(通用網(wǎng)站數(shù)據(jù)采集及Doc生成工具)是一個(gè)半自動(dòng)采集網(wǎng)頁(yè)生成Word docx文件的工具,帶企查查、天眼查采集配置,使用XPath2Doc需要自己在WebBrowser窗口里面手工登錄,并找到需要的數(shù)據(jù)頁(yè)面,然后點(diǎn)擊程序按鈕進(jìn)行采集,所以是個(gè)半自動(dòng)的網(wǎng)頁(yè)數(shù)據(jù)填充Docx工具。

工作原理

網(wǎng)頁(yè)的每個(gè)元素,都可以表示成為XPath語(yǔ)句,所以我們可以讀取瀏覽器打開的網(wǎng)站頁(yè)面源代碼,通過(guò)XPath語(yǔ)句得到網(wǎng)頁(yè)元素中的文本。

XPath語(yǔ)句的獲取辦法:

通常我們可以使用谷歌的Chrome瀏覽器打開網(wǎng)站頁(yè)面,按F12調(diào)出開發(fā)者工具界面,在ELements選項(xiàng)卡下,隨著鼠標(biāo)的移動(dòng)可以看到網(wǎng)頁(yè)內(nèi)容被陰影覆蓋,點(diǎn)開三角符號(hào),可以更進(jìn)一步定位準(zhǔn)確的位置,直到找到最終需要的數(shù)據(jù)位置。在找到的文本上點(diǎn)鼠標(biāo)右鍵,在彈出的菜單中,選擇Copy-Copy XPath,然后粘貼到記事本即可得到需要的XPath語(yǔ)句。

這里需要說(shuō)明一點(diǎn):如果拷貝出來(lái)的XPath語(yǔ)句中有/tbody會(huì)影響采集,程序內(nèi)部對(duì)此問題進(jìn)行了處理,但可能會(huì)在某些特殊情況下還是會(huì)影響數(shù)據(jù)采集,可以手工去掉。

運(yùn)行環(huán)境

Windows7 Sp1操作系統(tǒng)請(qǐng)安裝下面的組件(重要:VC庫(kù)如果不安裝,本程序無(wú)法啟動(dòng)):

VC2017往上

.net framework 4.5.2

在Windows10系統(tǒng)下上述組件一般自帶,不需要單獨(dú)安裝。Windows10 1903運(yùn)行通過(guò)。

不支持Windows XP操作系統(tǒng)。

操作說(shuō)明

1、本程序工作需要三個(gè)配置文件:General.ini,自定義.ini,自定義模板.docx。后兩個(gè)文件名自己定義。

General.ini文件中定義了INI文件和Docx模板文件的存放目錄,可以不填,默認(rèn)是程序所在目錄。

自定義.ini、自定義模板.docx是軟件使用者自己創(chuàng)建的網(wǎng)頁(yè)采集XPath語(yǔ)句及最后生成文件所用的Docx模板,具體設(shè)置方法請(qǐng)看ini文件中的說(shuō)明。注意,Docx模板文件中的“@<#0001#>@”之類的字符是在INI文件中定義的用于替換網(wǎng)頁(yè)采集內(nèi)容的標(biāo)記字符串。ini文件中定義了替換關(guān)鍵字的前后綴和模板文件名。

2、使用本程序前,請(qǐng)先建立好你自己的INI配置文件和Docx模板文件。(具體可以參見附帶的企查查、天眼查兩個(gè)配置文件和起訴書模板)

需要說(shuō)明的是,模板文件支持對(duì)文檔的不同部分使用不同的網(wǎng)址進(jìn)行采集,注意Url的設(shè)置。

使用方法

啟動(dòng)程序--選擇模板--點(diǎn)擊采集數(shù)據(jù)按鈕旁邊的黑色三角符號(hào),點(diǎn)開下拉菜單,點(diǎn)擊需要采集的部分。等候?yàn)g覽器加載網(wǎng)頁(yè)完畢,手工輸入需要查詢的內(nèi)容,點(diǎn)擊查詢,找到數(shù)據(jù)的具體頁(yè)面,然后點(diǎn)擊采集數(shù)據(jù)按鈕,觀察右側(cè)的列表中是不是已經(jīng)得到需要的數(shù)據(jù)。繼續(xù)點(diǎn)開下拉菜單,選擇下一個(gè)需要采集的部分,如果網(wǎng)址發(fā)生了變化要等候?yàn)g覽器加載完畢,找到需要的數(shù)據(jù)頁(yè)面。點(diǎn)擊采集數(shù)據(jù)按鈕觀察右側(cè)列表中是不是得到了第二部分的數(shù)據(jù)。如此反復(fù),直到數(shù)據(jù)全部采集完畢。

如果前后兩部分的網(wǎng)址相同,在點(diǎn)擊下一部分的下拉菜單之前,要先在瀏覽器中重新查詢新的數(shù)據(jù),等新數(shù)據(jù)頁(yè)面出來(lái)之后在點(diǎn)擊下拉菜單選擇下一部分進(jìn)行采集。(網(wǎng)址相同的情況下,點(diǎn)擊下一部分會(huì)直接從網(wǎng)頁(yè)取數(shù)據(jù),如果瀏覽器沒有換頁(yè)面,數(shù)據(jù)就錯(cuò)了。)如果某個(gè)部分需要重新采集,請(qǐng)先點(diǎn)擊下拉菜單中的該部分名稱,然后點(diǎn)擊采集按鈕重復(fù)采集該部分(此時(shí)可以隨意改變?yōu)g覽器的數(shù)據(jù)頁(yè)面,得到的就是不同公司數(shù)據(jù))。

列表中采集得到的數(shù)據(jù)結(jié)果如果有偏差,可以單擊自行修改。XPath語(yǔ)句如果有什么錯(cuò)誤,也可以自己修改看測(cè)試結(jié)果(XPath語(yǔ)句在修改后會(huì)立即重新抓取瀏覽器的數(shù)據(jù),所以瀏覽器最好是有效數(shù)據(jù)頁(yè)面),在程序中修改的XPath語(yǔ)句,不會(huì)保存到INI文件中,請(qǐng)自行手工保存。

如果列表中數(shù)據(jù)無(wú)誤,預(yù)覽窗口中的Docx模板內(nèi)容也正確,則可以點(diǎn)擊創(chuàng)建文檔按鈕,填寫要生成的文件名,本軟件會(huì)使用抓取到的網(wǎng)頁(yè)數(shù)據(jù)替換模板中的索引字符串,自動(dòng)生成Docx文檔。

需要說(shuō)明的是,右下角的Docx預(yù)覽窗口不能完整的支持Word文檔,對(duì)不標(biāo)準(zhǔn)的文檔可能會(huì)出現(xiàn)文本缺失或者錯(cuò)位現(xiàn)象。遇到這種情況,可以忽略,或者將模板文件改成規(guī)范的文本格式(單倍行距)。

載地址

下載錯(cuò)誤?【投訴報(bào)錯(cuò)】

XPath2Doc(數(shù)據(jù)采集軟件) v1.0.0.0 免費(fèi)安裝版

      氣軟件

      關(guān)文章

      載聲明

      ☉ 解壓密碼:www.dbjr.com.cn 就是本站主域名,希望大家看清楚,[ 分享碼的獲取方法 ]可以參考這篇文章
      ☉ 推薦使用 [ 迅雷 ] 下載,使用 [ WinRAR v5 ] 以上版本解壓本站軟件。
      ☉ 如果這個(gè)軟件總是不能下載的請(qǐng)?jiān)谠u(píng)論中留言,我們會(huì)盡快修復(fù),謝謝!
      ☉ 下載本站資源,如果服務(wù)器暫不能下載請(qǐng)過(guò)一段時(shí)間重試!或者多試試幾個(gè)下載地址
      ☉ 如果遇到什么問題,請(qǐng)?jiān)u論留言,我們定會(huì)解決問題,謝謝大家支持!
      ☉ 本站提供的一些商業(yè)軟件是供學(xué)習(xí)研究之用,如用于商業(yè)用途,請(qǐng)購(gòu)買正版。
      ☉ 本站提供的XPath2Doc(數(shù)據(jù)采集軟件) v1.0.0.0 免費(fèi)安裝版 資源來(lái)源互聯(lián)網(wǎng),版權(quán)歸該下載資源的合法擁有者所有。