欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

解決python 使用openpyxl讀寫大文件的坑

 更新時(shí)間:2021年03月13日 09:47:39   作者:valark  
這篇文章主要介紹了解決python 使用openpyxl讀寫大文件的坑,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧

由于需要處理xlsx類型的文件,我使用了openpyxl來處理,然而文件比較大,大約有60多MB。讀文件的時(shí)候雖然慢了一點(diǎn),但還是能夠讀出來,但是當(dāng)我想寫入時(shí)卻報(bào)錯(cuò)了。

顯示設(shè)備沒有多余的空間,百度了一下,發(fā)現(xiàn)有不少關(guān)于openpyxl讀寫大文件的問題。總結(jié)來看,解決方案主要有以下兩種,當(dāng)然,我兩種都用上了。

手動(dòng)釋放內(nèi)存

del wb, ws
gc.collect()

這一招還算有用,在讀完文件后可以看到內(nèi)存占用明顯下降了一點(diǎn)。

安裝lxml

使用命令·pip install lxml安裝依賴

這個(gè)依賴并非必須安裝的依賴,但是可以使openpyxl流式處理數(shù)據(jù)。

總之使用了以上兩種方案后,終于可以成功處理數(shù)據(jù)了。

補(bǔ)充:openpyxl讀取大文件的若干問題

需要編寫一個(gè)EXCEL文件對(duì)比工具

excel文件通常8MB,300張左右的表,每張表實(shí)際范圍為ZZ500.

使用openpyxl對(duì)表格進(jìn)行遍歷,完成兩個(gè)表之間的對(duì)比,找出公式不相同的單元格編程中遇到若干問題

1、讀取時(shí)報(bào)錯(cuò),錯(cuò)誤代碼忘記了,原因是通過數(shù)組的方式讀取了一個(gè)不存在的數(shù)值

如 SS['AA'],這個(gè)數(shù)值沒有定義,因此報(bào)錯(cuò)(PHP直接返回空值),使用SS.get('AA',null)進(jìn)行修改

D:\Python34\Lib\site-packages\openpyxl\reader\style.py

164: format_code = builtin_formats.get(numFmtId,'General')

2、讀取時(shí)內(nèi)存占用過大

基本就是內(nèi)存占用了2G以上以后,程序就不動(dòng)了,原因是某些表格的表格范圍識(shí)別的非常大,最大可為ZZ65535

通過研究,代碼進(jìn)行了如下修改

1:使用X64版本,X64版本在運(yùn)行時(shí),可以運(yùn)行4G以內(nèi)內(nèi)存占用的程序,比2G大一倍,能夠完成大部分表格的讀取,如ZZ5000,但是遇到ZZ65535范圍的表格,內(nèi)存占用達(dá)到了4G+,也會(huì)導(dǎo)致程序停止運(yùn)行.

2:限制最大單元格遍歷范圍,最大限制為ZZ5000,能夠有效降低內(nèi)存占用

3:定時(shí)重新讀取EXCEL文件(如每對(duì)比30張表),釋放內(nèi)存,(Python內(nèi)存釋放真的很痛苦,全部是指針引用,A=B,DEL A;是不會(huì)釋放空間的,要DEL B才行).

4:雖然openpyxl讀取文件時(shí)有個(gè)只讀模式(性能模式),但是速度實(shí)在是太慢了.

通過代碼修改,現(xiàn)在完成文件對(duì)比所用的內(nèi)存通常在2G以內(nèi)

以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。

相關(guān)文章

  • Python腳本實(shí)現(xiàn)蝦米網(wǎng)簽到功能

    Python腳本實(shí)現(xiàn)蝦米網(wǎng)簽到功能

    這篇文章主要介紹了Python腳本實(shí)現(xiàn)蝦米網(wǎng)簽到功能的方法,涉及Python調(diào)用URL模塊實(shí)現(xiàn)數(shù)據(jù)傳輸與處理的相關(guān)技巧,需要的朋友可以參考下
    2016-04-04
  • 對(duì)python3 sort sorted 函數(shù)的應(yīng)用詳解

    對(duì)python3 sort sorted 函數(shù)的應(yīng)用詳解

    今天小編就為大家分享一篇對(duì)python3 sort sorted 函數(shù)的應(yīng)用詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2019-06-06
  • Python程序慢的重要原因

    Python程序慢的重要原因

    在本篇內(nèi)容里小編給大家整理的是一篇關(guān)于Python程序慢的重要原因分析內(nèi)容,有興趣的朋友們可以參考下。
    2020-09-09
  • 如何在python字符串中輸入純粹的{}

    如何在python字符串中輸入純粹的{}

    這篇文章主要介紹了如何在python字符串中輸入純粹的{}以及python字符串連接的三種方法,需要的朋友可以參考下
    2018-08-08
  • python中對(duì)list去重的多種方法

    python中對(duì)list去重的多種方法

    這篇文章主要介紹了python中對(duì)list去重的多種方法,本文去重的前提是要保證順序不變,本文給出了多種實(shí)現(xiàn)方法,需要的朋友可以參考下
    2014-09-09
  • python讀寫csv文件方法詳細(xì)總結(jié)

    python讀寫csv文件方法詳細(xì)總結(jié)

    在本文中小編給各位分享的是關(guān)于python讀寫csv文件方法的詳細(xì)內(nèi)容,對(duì)此有需要的朋友們跟著學(xué)習(xí)參考下。
    2019-07-07
  • Python判斷List中是否包含某個(gè)元素

    Python判斷List中是否包含某個(gè)元素

    在Python中,判斷一個(gè)列表(List)是否包含某個(gè)特定元素是常見的任務(wù)之一,本文就來介紹一下多種判斷List成員包含性的方法,并提供豐富的示例代碼,以幫助大家更好地理解和運(yùn)用這些技術(shù)
    2023-12-12
  • python 獲取指定文件夾下所有文件名稱并寫入列表的實(shí)例

    python 獲取指定文件夾下所有文件名稱并寫入列表的實(shí)例

    下面小編就為大家分享一篇python 獲取指定文件夾下所有文件名稱并寫入列表的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2018-04-04
  • python深度學(xué)習(xí)tensorflow訓(xùn)練好的模型進(jìn)行圖像分類

    python深度學(xué)習(xí)tensorflow訓(xùn)練好的模型進(jìn)行圖像分類

    這篇文章主要為大家介紹了python深度學(xué)習(xí)tensorflow訓(xùn)練好的模型進(jìn)行圖像分類示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2022-06-06
  • python如何更新包

    python如何更新包

    在本篇文章里小編給大家整理的是關(guān)于python更新包的相關(guān)知識(shí)點(diǎn)內(nèi)容,有興趣的朋友們可以參考下。
    2020-06-06

最新評(píng)論