Python如何提取chm數(shù)據(jù)
Python提取chm數(shù)據(jù)
需求場(chǎng)景
chm格式文檔中的內(nèi)容,提取保存為html
- 方法一 使用在線轉(zhuǎn)換工具或者軟件
- 方法二 腳本編譯
step 1:.bat腳本反編譯
使用該腳本, 可以將chm文件反編譯,類似解壓,獲取文件。有些文檔可以直接轉(zhuǎn)換為txt,有些會(huì)轉(zhuǎn)化為html. 這個(gè)跟生成chm文件有關(guān)系。
1 新建txt文檔, 參照示例寫(xiě)入命令。保存后文件另存為.bat格式
hh -decompile 轉(zhuǎn)換結(jié)果輸出路徑 待轉(zhuǎn)換文件(相對(duì)/絕對(duì)路徑) # 示例 hh -decompile D:\Desktop\ 123.chm
2 右鍵 管理員身份運(yùn)行該文件即可,結(jié)果輸出到命令指定的目錄
step 2: html轉(zhuǎn)txt
【html】Python提取html中文本到txt
查用python自帶的.chm官方文檔
1.去python的官方網(wǎng)站去下載對(duì)應(yīng)版本的python,在這里下載的python會(huì)自帶一份官方文檔(根據(jù)操作系統(tǒng)選擇的不同,會(huì)有不同的格式),下載windows版本的會(huì)有一個(gè)(*.chm)格式的說(shuō)明文檔
下載好后進(jìn)入下載目錄,找到Doc目錄,進(jìn)入
我的是windows系統(tǒng),可以看到有個(gè)5-6兆的(*.chm)說(shuō)明文檔
windows下可以直接雙擊打開(kāi)。
打開(kāi)后的樣子,可以看到很多目錄,充滿了知識(shí),等待著去發(fā)掘。
如果我對(duì)python自帶的某個(gè)庫(kù)的使用十分不解,比如copy,
我應(yīng)該這樣查
想找python基本的數(shù)據(jù)類型以及使用來(lái)學(xué)習(xí)
可以這樣來(lái)找
python自帶的(內(nèi)建的)函數(shù)有很多,了解一下
python自帶了的各種異常,快來(lái)捕獲吧
python語(yǔ)言是一種解釋型語(yǔ)言,很大程度上解決了跨平臺(tái)開(kāi)發(fā)的難度,關(guān)于python的各種接口(interface)調(diào)用,以及對(duì)操作系統(tǒng)的支持,都可以查到。
關(guān)于英語(yǔ)的問(wèn)題,大可不必?fù)?dān)心,有道云翻譯提供截屏翻譯,鼠標(biāo)取詞翻譯,是十分方便的,快去學(xué)習(xí)吧!
總結(jié)
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python利用shutil模塊實(shí)現(xiàn)文件夾的復(fù)制刪除與裁剪
shutil模塊是對(duì)os模塊的補(bǔ)充,主要針對(duì)文件的拷貝、刪除、移動(dòng)、壓縮和解壓操作。本文將利用shutil模塊實(shí)現(xiàn)文件夾的復(fù)制刪除與裁剪,需要的可以參考一下2022-05-05對(duì)numpy Array [: ,] 的取值方法詳解
今天小編就為大家分享一篇對(duì)numpy Array [: ,] 的取值方法詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-07-07python把數(shù)據(jù)框?qū)懭隡ySQL的方法
這篇文章主要介紹了如何讓python把數(shù)據(jù)框?qū)懭隡ySQL,下文利用上海市2016年9月1日公共交通卡刷卡數(shù)據(jù)的一份數(shù)據(jù)單展開(kāi)其方法,需要的小伙伴可以參考一下2022-03-03Python實(shí)現(xiàn)的讀取電腦硬件信息功能示例
這篇文章主要介紹了Python實(shí)現(xiàn)的讀取電腦硬件信息功能,結(jié)合實(shí)例形式分析了Python基于wmi庫(kù)讀取電腦CPU、磁盤(pán)、網(wǎng)絡(luò)、進(jìn)程等硬件信息相關(guān)操作技巧,需要的朋友可以參考下2018-05-05pytorch中model.train()和model.eval()用法及說(shuō)明
在PyTorch中,model.train()用于啟用BatchNormalization和Dropout,保證模型在訓(xùn)練階段能夠有效地利用這些層的特性,而model.eval()則是用于測(cè)試階段,確保BatchNormalization和Dropout不會(huì)影響測(cè)試結(jié)果,保持模型的穩(wěn)定性2024-09-09Django用戶認(rèn)證系統(tǒng) 組與權(quán)限解析
這篇文章主要介紹了Django用戶認(rèn)證系統(tǒng) 組與權(quán)限解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-08-08Django如何實(shí)現(xiàn)密碼錯(cuò)誤報(bào)錯(cuò)提醒
這篇文章主要介紹了Django如何實(shí)現(xiàn)密碼錯(cuò)誤報(bào)錯(cuò)提醒,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值2020-09-09