欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python讀取多類型文件夾中的文檔內(nèi)容

 更新時間:2024年03月31日 10:21:33   作者:學(xué)地理的小胖砸  
無論我們使用哪種編程語言,處理文件對于每個程序員都是必不可少的,本文主要介紹了python讀取多類型文件夾中的文檔內(nèi)容,具有一定的參考價值,感興趣的可以了解一下

突發(fā)奇想,想使用python讀取多類型文件夾中的文檔內(nèi)容,在Python中,讀取多類型文件夾中的文檔內(nèi)容通常涉及幾個步驟:

  • 遍歷文件夾以獲取文件列表。
  • 根據(jù)文件擴(kuò)展名判斷文件類型。
  • 使用適當(dāng)?shù)膸旎蚍椒▉碜x取每種文件類型的內(nèi)容。

以下是一個簡單的示例,展示如何使用Python讀取一個文件夾中所有.txt.docx文件的內(nèi)容:

首先,你需要安裝python-docx庫來讀取.docx文件。你可以使用pip來安裝:

pip install python-docx

然后,你可以使用以下Python腳本來讀取文件夾中的文檔內(nèi)容:

import os
from docx import Document

def read_txt_file(file_path):
    with open(file_path, 'r', encoding='utf-8') as file:
        content = file.read()
    return content

def read_docx_file(file_path):
    doc = Document(file_path)
    content = '\n'.join([para.text for para in doc.paragraphs])
    return content

def read_folder_contents(folder_path):
    for root, dirs, files in os.walk(folder_path):
        for file in files:
            file_path = os.path.join(root, file)
            if file_path.endswith('.txt'):
                content = read_txt_file(file_path)
                print(f"File: {file_path}")
                print(f"Content:\n{content}\n")
            elif file_path.endswith('.docx'):
                content = read_docx_file(file_path)
                print(f"File: {file_path}")
                print(f"Content:\n{content}\n")
            # 你可以根據(jù)需要添加更多文件類型的處理邏輯

# 使用示例
folder_to_read = 'path/to/your/folder'  # 替換為你的文件夾路徑
read_folder_contents(folder_to_read)

這個腳本首先定義了讀取.txt.docx文件的函數(shù)。然后,它遍歷指定的文件夾,并根據(jù)文件擴(kuò)展名調(diào)用相應(yīng)的讀取函數(shù)。對于每種文件類型,它都會打印文件名和內(nèi)容。你可以根據(jù)需要添加更多文件類型的處理邏輯。

請注意,處理不同類型的文件(如PDF、Excel等)可能需要使用不同的庫和方法。對于每種文件類型,你可能需要查找適當(dāng)?shù)腜ython庫來讀取其內(nèi)容。

ps:補(bǔ)

1 讀取Excel

通過pandas包來讀取

data = pd.read_excel('data.xlsx', sheet_name="Sheet1", header = 1)  # header是第幾行數(shù)據(jù)作為列名

2 讀取csv文件

csv_data= pd.read_csv('/路徑/文件名.csv')

3 讀取txt文件

read_csv讀取時會自動識別表頭,數(shù)據(jù)有表頭時不能設(shè)置header為空(默認(rèn)讀取第一行,即header=0);數(shù)據(jù)無表頭時,若不設(shè)置header,第一行數(shù)據(jù)會被視為表頭,應(yīng)傳入names參數(shù)設(shè)置表頭名稱或設(shè)置header=None。

data = pd.read_csv(r'stdout', sep='\t', header=0) # stdout是txt文件

到此這篇關(guān)于python讀取多類型文件夾中的文檔內(nèi)容的文章就介紹到這了,更多相關(guān)python讀取多類型文件內(nèi)容內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • pandas.read_csv參數(shù)詳解(小結(jié))

    pandas.read_csv參數(shù)詳解(小結(jié))

    這篇文章主要介紹了pandas.read_csv參數(shù)詳解(小結(jié)),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-06-06
  • python?pygame英雄循環(huán)飛行及作業(yè)示例

    python?pygame英雄循環(huán)飛行及作業(yè)示例

    這篇文章主要為大家介紹了python?pygame英雄循環(huán)飛行及作業(yè)實(shí)現(xiàn)示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2022-08-08
  • PyCharm Python Console中文輸出亂碼問題及解決

    PyCharm Python Console中文輸出亂碼問題及解決

    這篇文章主要介紹了PyCharm Python Console中文輸出亂碼問題及解決方案,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2023-07-07
  • 利用python制作俄羅斯方塊詳細(xì)圖文教程

    利用python制作俄羅斯方塊詳細(xì)圖文教程

    俄羅斯方塊是一款經(jīng)典的游戲,它可以用多種編程語言來實(shí)現(xiàn),這篇文章主要給大家介紹了關(guān)于利用python制作俄羅斯方塊的詳細(xì)圖文教程,文中通過代碼介紹的非常詳細(xì),需要的朋友可以參考下
    2023-10-10
  • Python中循環(huán)依賴問題及其解決方案

    Python中循環(huán)依賴問題及其解決方案

    在軟件開發(fā)中,循環(huán)依賴是一個常見的問題,尤其是在使用 Python 這樣的動態(tài)語言時,循環(huán)依賴指的是兩個或多個模塊或組件相互依賴,形成一個閉環(huán),本文將探討 Python 中循環(huán)依賴的問題,并提供一些解決方案,需要的朋友可以參考下
    2024-06-06
  • Python定時爬取微博熱搜示例介紹

    Python定時爬取微博熱搜示例介紹

    大家好,本篇文章主要講的是Python定時爬取微博熱搜示例介紹,感興趣的同學(xué)趕快來看一看吧,對你有幫助的話記得收藏一下,方便下次瀏覽
    2021-12-12
  • 利用Python微信群發(fā)英語每日一句

    利用Python微信群發(fā)英語每日一句

    這篇文章主要為大家詳細(xì)介紹了Python如何利用wxauto實(shí)現(xiàn)微信群發(fā)消息,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下
    2024-11-11
  • 詳細(xì)探究Python中的字典容器

    詳細(xì)探究Python中的字典容器

    這篇文章主要介紹了Python中的字典容器,本文來自于IBM官方網(wǎng)站技術(shù)文檔,需要的朋友可以參考下
    2015-04-04
  • 手把手教你使用Python創(chuàng)建微信機(jī)器人

    手把手教你使用Python創(chuàng)建微信機(jī)器人

    微信,一個日活10億的超級app,不僅在國內(nèi)社交獨(dú)領(lǐng)風(fēng)騷,在國外社交也同樣占有一席之地,今天我們要將便是如何用Python來生成一個微信機(jī)器人,感興趣的朋友跟隨小編一起看看吧
    2019-04-04
  • 用Python編寫一個簡單的Lisp解釋器的教程

    用Python編寫一個簡單的Lisp解釋器的教程

    這篇文章主要介紹了用Python編寫一個簡單的Lisp解釋器的教程,Lisp是一種源碼簡單的函數(shù)式編程語言,本文主要介紹對其中的一個子集Scheme的解釋器開發(fā),需要的朋友可以參考下
    2015-04-04

最新評論