欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python實(shí)現(xiàn)文本文件拆分寫入到多個(gè)文本文件的方法

 更新時(shí)間:2021年04月18日 10:24:15   作者:si_en_hao  
這篇文章主要介紹了Python實(shí)現(xiàn)文本文件拆分寫入到多個(gè)文本文件的方法,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

引言

將一個(gè)txt文本文件中的內(nèi)容行拆分固定的行數(shù),自動(dòng)分批寫入到多個(gè)文本文件。
比如:一個(gè)源txt文件有5100行數(shù)據(jù),每1000行插入到一個(gè)txt文件,最后獲得6個(gè)txt文件(5個(gè)文本文件有1000行數(shù)據(jù),第6個(gè)文本文件有100行數(shù)據(jù))。

步驟

1、先建立一個(gè)目錄用于存放分割后的txt文件(這里的目錄名為:dataText)
2、修改拆分的數(shù)目(這里是每5000行數(shù)據(jù)存入一個(gè)txt文件)
3、運(yùn)行python文件,查看生成的txt文件

代碼

open_diff = open('data.txt', 'r') # 源文本文件
diff_line = open_diff.readlines()

line_list = []
for line in diff_line:
    line_list.append(line)

count = len(line_list) # 文件行數(shù)
print('源文件數(shù)據(jù)行數(shù):',count)
# 切分diff
diff_match_split = [line_list[i:i+5000] for i in range(0,len(line_list),5000)]# 每個(gè)文件的數(shù)據(jù)行數(shù)

# 將切分的寫入多個(gè)txt中
for i,j in zip(range(0,int(count/5000+1)),range(0,int(count/5000+1))): # 寫入txt,計(jì)算需要寫入的文件數(shù)
    with open('./dataText/ImageData%d.txt'% j,'w+') as temp:
        for line in diff_match_split[i]:
            temp.write(line)
print('拆分后文件的個(gè)數(shù):',i+1)

結(jié)果

在這里插入圖片描述

在這里插入圖片描述

應(yīng)用:

將txt文件中的數(shù)據(jù)拆分成多個(gè)文本文件,可以解決由于文本文件數(shù)據(jù)過大而無法導(dǎo)入某些軟件的問。

這里是將一個(gè)url文本文件(約15M)導(dǎo)入idm下載url中的內(nèi)容,但由于文本文件過大,數(shù)據(jù)量過多,就拆分成多個(gè)文本文件分批次導(dǎo)入idm。

注意:
1、程序中的5000為寫入每個(gè)文件的數(shù)據(jù)行數(shù),最后一個(gè)文件的行數(shù)不足5000,也用一個(gè)文本文件存儲(chǔ)。
2、根據(jù)需要,修改存儲(chǔ)數(shù)據(jù)的行數(shù)(兩個(gè)地方的5000都需要修改)。

到此這篇關(guān)于Python實(shí)現(xiàn)文本文件拆分寫入到多個(gè)文本文件的方法的文章就介紹到這了,更多相關(guān)Python 文本文件拆分內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Python模塊包中__init__.py文件功能分析

    Python模塊包中__init__.py文件功能分析

    這篇文章主要介紹了Python模塊包中__init__.py文件功能,簡(jiǎn)單分析了__init__.py在調(diào)入模塊和包的過程中的作用,需要的朋友可以參考下
    2016-06-06
  • Python計(jì)算一個(gè)文件里字?jǐn)?shù)的方法

    Python計(jì)算一個(gè)文件里字?jǐn)?shù)的方法

    這篇文章主要介紹了Python計(jì)算一個(gè)文件里字?jǐn)?shù)的方法,涉及Python文件操作及內(nèi)容遍歷的相關(guān)技巧,需要的朋友可以參考下
    2015-06-06
  • matplotlib事件處理基礎(chǔ)(事件綁定、事件屬性)

    matplotlib事件處理基礎(chǔ)(事件綁定、事件屬性)

    這篇文章主要介紹了matplotlib事件處理基礎(chǔ)(事件綁定、事件屬性),文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2021-02-02
  • Django多進(jìn)程滾動(dòng)日志問題解決方案

    Django多進(jìn)程滾動(dòng)日志問題解決方案

    這篇文章主要介紹了Django多進(jìn)程滾動(dòng)日志問題解決方案,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2019-12-12
  • 利用Python統(tǒng)計(jì)Jira數(shù)據(jù)并可視化

    利用Python統(tǒng)計(jì)Jira數(shù)據(jù)并可視化

    目前公司使用 Jira 作為項(xiàng)目管理工具,在每一次迭代完成后的復(fù)盤會(huì)上,我們都需要針對(duì)本次迭代的 Bug 進(jìn)行數(shù)據(jù)統(tǒng)計(jì),以幫助管理層能更直觀的了解研發(fā)的代碼質(zhì)量。本篇文章將介紹如何利用統(tǒng)計(jì) Jira 數(shù)據(jù),并進(jìn)行可視化,需要的可以參考一下
    2022-07-07
  • Python API 操作Hadoop hdfs詳解

    Python API 操作Hadoop hdfs詳解

    這篇文章主要介紹了Python API 操作Hadoop hdfs詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2020-06-06
  • pytest用例間參數(shù)傳遞的兩種實(shí)現(xiàn)方式示例

    pytest用例間參數(shù)傳遞的兩種實(shí)現(xiàn)方式示例

    pytest提供了許多運(yùn)行命令以供定制化運(yùn)行某一類測(cè)試用例或者某個(gè)測(cè)試用例等,下面這篇文章主要給大家介紹了關(guān)于pytest用例間參數(shù)傳遞的兩種實(shí)現(xiàn)方式,文中通過示例代碼介紹的非常詳細(xì),需要的朋友可以參考下
    2021-12-12
  • pygame實(shí)現(xiàn)滑塊接小球游戲

    pygame實(shí)現(xiàn)滑塊接小球游戲

    這篇文章主要為大家詳細(xì)介紹了pygame實(shí)現(xiàn)滑塊接小球游戲,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2021-06-06
  • 探索Python數(shù)據(jù)可視化庫(kù)中Plotly Express的使用方法

    探索Python數(shù)據(jù)可視化庫(kù)中Plotly Express的使用方法

    在數(shù)據(jù)分析和可視化領(lǐng)域,數(shù)據(jù)的有效呈現(xiàn)是至關(guān)重要的,python作為一種強(qiáng)大的編程語言,提供了多種數(shù)據(jù)可視化工具和庫(kù),本文將介紹Plotly Express的基本概念和使用方法,幫助讀者快速入門并掌握數(shù)據(jù)可視化的技巧
    2023-06-06
  • 關(guān)于Python自動(dòng)化操作Excel

    關(guān)于Python自動(dòng)化操作Excel

    這篇文章主要介紹了關(guān)于Python自動(dòng)化操作Excel, Python 是一種功能強(qiáng)大的編程語言,可以用于許多任務(wù),包括處理 Excel 文件,需要的朋友可以參考下
    2023-04-04

最新評(píng)論