Python3 讀取Word文件方式
我的環(huán)境,Windows10,Python3.6.3
查詢了很多有關(guān)資料,發(fā)現(xiàn)都是Python2版本操作Word文件的,所以就寫了這篇短小的文章。
一、安裝 docx
pip install docx
完了之后,導(dǎo)入:import docx
發(fā)現(xiàn)報錯:ModuleNotFoundError: No module named ‘exceptions'
說沒有 exceptions 這個模塊,由于Python3已經(jīng)取消了這個模塊,而 PendingDeprecationWarning 是內(nèi)置
可以直接使用的,所以我們直接進(jìn)入文件(這個要看你報錯顯示的路徑):
D:\ProgramFiles\Anaconda3\lib\site-packages\docx.py
把 from exceptions import PendingDeprecationWarning 注釋掉即可
示例代碼:
import docx def get_docx(file_name): d = docx.opendocx(file_name) doc = docx.getdocumenttext(d) return doc doc = get_docx('tt.docx') print(doc) # 輸出行數(shù):1075 for d in doc[:5]: print(d) # 打印前5行 '''輸出: 一、補(bǔ)益之劑 1.四君子湯 四君子湯中和義,參術(shù)茯苓甘草比 益以夏陳名六君,祛痰補(bǔ)氣陽虛餌 除卻半夏名異功,或加香砂胃寒使 '''
以上這篇Python3 讀取Word文件方式就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python字典刪除鍵值對和元素的四種方法(小結(jié))
刪除列表或者字符串元素的方法不止一種,同樣,刪除字典元素的方法也不止一種,本文主要介紹python中刪除字典元素的四種方法:1、使用del語句;2、使用clear();3、使用pop();4、使用popitem()。感興趣的可以了解一下2021-12-12使用Python實現(xiàn)監(jiān)聽html點擊事件教程
在Web開發(fā)中,經(jīng)常需要在用戶與頁面交互時執(zhí)行一些操作,本文將介紹如何使用Python來監(jiān)聽HTML點擊事件,有需要的小伙伴可以跟隨小編一起了解下2024-04-04python之線程池map()方法傳遞多參數(shù)list
這篇文章主要介紹了python之線程池map()方法傳遞多參數(shù)list問題,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2023-03-03Python中defaultdict與lambda表達(dá)式用法實例小結(jié)
這篇文章主要介紹了Python中defaultdict與lambda表達(dá)式用法,結(jié)合實例形式分析了Python中defaultdict與lambda表達(dá)式的功能、使用方法及相關(guān)注意事項,需要的朋友可以參考下2018-04-04