欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python實(shí)現(xiàn)批量合并多個(gè)txt文件并生成Excel文件

 更新時(shí)間:2023年12月12日 09:45:28   作者:Sitin濤哥  
在數(shù)據(jù)處理中,有時(shí)會(huì)面臨合并多個(gè)文本文件的任務(wù),本文將詳細(xì)介紹如何使用Python批量合并多個(gè)txt文件,并將其生成為一個(gè)Excel文件,需要的可以參考下

在數(shù)據(jù)處理中,有時(shí)會(huì)面臨合并多個(gè)文本文件的任務(wù),尤其是當(dāng)數(shù)據(jù)分散在多個(gè)txt文件中時(shí)。本文將詳細(xì)介紹如何使用Python批量合并多個(gè)txt文件,并將其生成為一個(gè)Excel文件,以提高數(shù)據(jù)整理的效率。通過(guò)豐富的示例代碼和詳細(xì)解釋,將能夠掌握這一實(shí)用的數(shù)據(jù)處理技能。

準(zhǔn)備工作

首先,需要準(zhǔn)備多個(gè)txt文件,并確保它們具有相同的數(shù)據(jù)結(jié)構(gòu)。為了簡(jiǎn)化示例,創(chuàng)建了三個(gè)樣本文件:data1.txt,data2.txt和data3.txt。

# data1.txt
Name, Age, City
Alice, 25, New York
Bob, 30, San Francisco

# data2.txt
Name, Age, City
Charlie, 22, Los Angeles
David, 35, Chicago

# data3.txt
Name, Age, City
Eva, 28, Miami
Frank, 40, Seattle

使用Pandas庫(kù)合并txt文件

Pandas是一個(gè)強(qiáng)大的數(shù)據(jù)處理庫(kù),對(duì)于合并多個(gè)txt文件并生成Excel文件非常方便。

import pandas as pd
import glob

# 獲取所有txt文件
files = glob.glob('data*.txt')

# 初始化一個(gè)空的DataFrame
merged_data = pd.DataFrame()

# 逐個(gè)讀取并合并文件
for file in files:
    df = pd.read_csv(file)
    merged_data = pd.concat([merged_data, df], ignore_index=True)

# 生成Excel文件
merged_data.to_excel('merged_data.xlsx', index=False)

定制化合并過(guò)程

有時(shí),可能需要定制化合并過(guò)程,例如處理不同的分隔符或選擇性地合并特定列。下面的示例展示了如何通過(guò)指定不同的分隔符和僅合并特定列來(lái)實(shí)現(xiàn)。

# 定制化合并過(guò)程
custom_merged_data = pd.DataFrame()

for file in files:
    df = pd.read_csv(file, sep='\t', usecols=['Name', 'City'])
    custom_merged_data = pd.concat([custom_merged_data, df], ignore_index=True)

# 生成定制化Excel文件
custom_merged_data.to_excel('custom_merged_data.xlsx', index=False)

使用Openpyxl庫(kù)創(chuàng)建Excel文件

除了Pandas,還可以使用Openpyxl庫(kù)直接操作Excel文件,創(chuàng)建和寫(xiě)入數(shù)據(jù)。

from openpyxl import Workbook

# 創(chuàng)建工作簿和工作表
wb = Workbook()
ws = wb.active

# 逐個(gè)讀取文件,寫(xiě)入Excel
for file in files:
    with open(file, 'r') as f:
        lines = f.readlines()
        for row in lines:
            ws.append(row.strip().split(','))

# 保存Excel文件
wb.save('manual_merged_data.xlsx')

總結(jié)

在本文中,深入研究了如何使用Python在數(shù)據(jù)處理中批量合并多個(gè)txt文件,并將它們整理成一個(gè)Excel文件。通過(guò)示例代碼,展示了兩種主要方法:使用Pandas庫(kù)和Openpyxl庫(kù)。

首先,學(xué)習(xí)了如何使用Pandas庫(kù)輕松實(shí)現(xiàn)多個(gè)txt文件的合并,借助pd.concat()函數(shù),可以在不同數(shù)據(jù)結(jié)構(gòu)和列的情況下靈活地整合數(shù)據(jù)。還演示了如何在合并過(guò)程中定制分隔符和選擇性地合并特定列,以滿足特定需求。其次,介紹了使用Openpyxl庫(kù)直接操作Excel文件的方法。通過(guò)創(chuàng)建工作簿和工作表,逐行讀取txt文件并將其寫(xiě)入Excel,提供了另一種靈活、底層的處理方式。

這兩種方法各有優(yōu)劣,可以根據(jù)具體場(chǎng)景和需求選擇合適的方法。通過(guò)掌握這些技能,將能夠更高效地處理大量分散的數(shù)據(jù)文件,提高數(shù)據(jù)整理的效率。合并和整理數(shù)據(jù)是數(shù)據(jù)科學(xué)和數(shù)據(jù)分析中的重要步驟,通過(guò)本文學(xué)到的知識(shí),將更自信地應(yīng)對(duì)實(shí)際數(shù)據(jù)處理任務(wù),確保工作流程更為流暢。

到此這篇關(guān)于Python實(shí)現(xiàn)批量合并多個(gè)txt文件并生成Excel文件的文章就介紹到這了,更多相關(guān)Python合并多個(gè)txt內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Python中collections模塊的基本使用教程

    Python中collections模塊的基本使用教程

    collections是Python內(nèi)建的一個(gè)集合模塊,提供了許多有用的集合類(lèi)。下面這篇文章主要給大家介紹了關(guān)于Python中collections模塊的基本使用,文中通過(guò)示例代碼介紹的非常詳細(xì),需要的朋友可以參考下
    2018-12-12
  • Python初學(xué)者必備的文件讀寫(xiě)指南

    Python初學(xué)者必備的文件讀寫(xiě)指南

    今天給大家?guī)?lái)的是關(guān)于Python基礎(chǔ)的相關(guān)知識(shí),文章圍繞著Python文件讀寫(xiě)展開(kāi),文中有非常詳細(xì)的介紹及代碼示例,需要的朋友可以參考下
    2021-06-06
  • Python文件打包工具一站式指南

    Python文件打包工具一站式指南

    這篇文章主要為大家介紹了Python文件打包工具一站式指南,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2024-01-01
  • 零基礎(chǔ)寫(xiě)python爬蟲(chóng)之神器正則表達(dá)式

    零基礎(chǔ)寫(xiě)python爬蟲(chóng)之神器正則表達(dá)式

    正則表達(dá)式在Python爬蟲(chóng)中的作用就像是老師點(diǎn)名時(shí)用的花名冊(cè)一樣,是必不可少的神兵利器。正則表達(dá)式是用于處理字符串的強(qiáng)大工具,它并不是Python的一部分。其他編程語(yǔ)言中也有正則表達(dá)式的概念,區(qū)別只在于不同的編程語(yǔ)言實(shí)現(xiàn)支持的語(yǔ)法數(shù)量不同。
    2014-11-11
  • pyinstaller還原python代碼過(guò)程圖解

    pyinstaller還原python代碼過(guò)程圖解

    這篇文章主要介紹了pyinstaller還原python代碼過(guò)程圖解,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-01-01
  • Python 3.x基于Xml數(shù)據(jù)的Http請(qǐng)求方法

    Python 3.x基于Xml數(shù)據(jù)的Http請(qǐng)求方法

    今天小編就為大家分享一篇Python 3.x基于Xml數(shù)據(jù)的Http請(qǐng)求方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2018-12-12
  • 圖文詳解Python中如何簡(jiǎn)單地解決Microsoft?Visual?C++?14.0報(bào)錯(cuò)

    圖文詳解Python中如何簡(jiǎn)單地解決Microsoft?Visual?C++?14.0報(bào)錯(cuò)

    有的時(shí)候安裝python依賴包的時(shí)候,報(bào)錯(cuò)信息"Microsoft?visual?c++?14.0?is?required"的解決辦法,下面這篇文章主要給大家介紹了關(guān)于Python中如何簡(jiǎn)單地解決Microsoft?Visual?C++?14.0報(bào)錯(cuò)的相關(guān)資料,需要的朋友可以參考下
    2023-02-02
  • github配置使用指南

    github配置使用指南

    Git是一個(gè)分布式的版本控制系統(tǒng),最初由Linus Torvalds編寫(xiě),用作Linux內(nèi)核代碼的管理。在推出后,Git在其它項(xiàng)目中也取得了很大成功,尤其是在Ruby社區(qū)中。目前,包括Rubinius、Merb和Bitcoin在內(nèi)的很多知名項(xiàng)目都使用了Git,作為一個(gè)程序猿,不會(huì)github那確實(shí)有點(diǎn)坑了
    2014-11-11
  • python Pillow圖像處理方法匯總

    python Pillow圖像處理方法匯總

    這篇文章主要介紹了python Pillow圖像處理方法匯總,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2019-10-10
  • 如何利用Matplotlib庫(kù)繪制動(dòng)畫(huà)及保存GIF圖片

    如何利用Matplotlib庫(kù)繪制動(dòng)畫(huà)及保存GIF圖片

    這篇文章主要給大家介紹了關(guān)于如何利用Matplotlib庫(kù)繪制動(dòng)畫(huà)及保存GIF圖片的相關(guān)資料,matplotlib模塊提供了很高級(jí)和非常友好的使用方式,使用起來(lái)也是非常方便的,需要的朋友可以參考下
    2021-06-06

最新評(píng)論