Python如何提取chm數(shù)據(jù)
Python提取chm數(shù)據(jù)
需求場景
chm格式文檔中的內(nèi)容,提取保存為html
- 方法一 使用在線轉換工具或者軟件
- 方法二 腳本編譯
step 1:.bat腳本反編譯
使用該腳本, 可以將chm文件反編譯,類似解壓,獲取文件。有些文檔可以直接轉換為txt,有些會轉化為html. 這個跟生成chm文件有關系。
1 新建txt文檔, 參照示例寫入命令。保存后文件另存為.bat格式
hh -decompile 轉換結果輸出路徑 待轉換文件(相對/絕對路徑) # 示例 hh -decompile D:\Desktop\ 123.chm
2 右鍵 管理員身份運行該文件即可,結果輸出到命令指定的目錄
step 2: html轉txt
【html】Python提取html中文本到txt
查用python自帶的.chm官方文檔
1.去python的官方網(wǎng)站去下載對應版本的python,在這里下載的python會自帶一份官方文檔(根據(jù)操作系統(tǒng)選擇的不同,會有不同的格式),下載windows版本的會有一個(*.chm)格式的說明文檔
下載好后進入下載目錄,找到Doc目錄,進入
我的是windows系統(tǒng),可以看到有個5-6兆的(*.chm)說明文檔
windows下可以直接雙擊打開。
打開后的樣子,可以看到很多目錄,充滿了知識,等待著去發(fā)掘。
如果我對python自帶的某個庫的使用十分不解,比如copy,
我應該這樣查
想找python基本的數(shù)據(jù)類型以及使用來學習
可以這樣來找
python自帶的(內(nèi)建的)函數(shù)有很多,了解一下
python自帶了的各種異常,快來捕獲吧
python語言是一種解釋型語言,很大程度上解決了跨平臺開發(fā)的難度,關于python的各種接口(interface)調(diào)用,以及對操作系統(tǒng)的支持,都可以查到。
關于英語的問題,大可不必擔心,有道云翻譯提供截屏翻譯,鼠標取詞翻譯,是十分方便的,快去學習吧!
總結
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關文章
Python利用shutil模塊實現(xiàn)文件夾的復制刪除與裁剪
shutil模塊是對os模塊的補充,主要針對文件的拷貝、刪除、移動、壓縮和解壓操作。本文將利用shutil模塊實現(xiàn)文件夾的復制刪除與裁剪,需要的可以參考一下2022-05-05pytorch中model.train()和model.eval()用法及說明
在PyTorch中,model.train()用于啟用BatchNormalization和Dropout,保證模型在訓練階段能夠有效地利用這些層的特性,而model.eval()則是用于測試階段,確保BatchNormalization和Dropout不會影響測試結果,保持模型的穩(wěn)定性2024-09-09