欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

解決python執(zhí)行較大excel文件openpyxl慢問題

 更新時(shí)間:2020年05月15日 15:15:54   作者:Pcject  
這篇文章主要介紹了解決python執(zhí)行較大excel文件openpyxl慢問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧

我就廢話不多說了,大家還是直接看代碼吧!

talk is cheap

  from openpyxl import Workbook
  from openpyxl.utils import get_column_letter
  from openpyxl import load_workbook
  import time
  wb = load_workbook("E:/a.xlsx", read_only=True)
  sh = wb["Sheet"]
  # rowItem = {}
  # for j in range(1,2000):
  #   for i in range(1, 30):
  #     rowItem[get_column_letter(i)] = i
  #   sh.append(rowItem)
  # wb.save("E:/a.xlsx")
  t0 = time.time()
  print(sh['V500'].value)
  t1 = time.time()
  print("openpyxl所用時(shí)間:", str(t1-t0))

  import xlrd
  xlsPath = "E:/a.xlsx"
  WorkBook = xlrd.open_workbook(xlsPath)
  sh = WorkBook.sheet_by_name("Sheet")

  t0 = time.time()
  print(sh.cell(499,22).value)
  t1 = time.time()
  print("xlrd所用時(shí)間:", str(t1-t0))

測(cè)試結(jié)果:

22
openpyxl所用時(shí)間: 0.44217610359191895
23.0
xlrd所用時(shí)間: 0.0010063648223876953

結(jié)論

openpyxl的慢是讀取慢,可以選擇xlrd代替,詳細(xì)測(cè)試下面繼續(xù)

不直接使用xlwt+xlrd是因?yàn)閤lwt僅支持2003及以下版本,最大行數(shù)限制在65536,不夠用,而openpyxl大概在一百多萬

主要的說完了,下面詳細(xì)說了:在寫工具的時(shí)候遇到的這個(gè)問題,開始是用的xlwt+xlrd,然后行數(shù)超標(biāo)了,沒辦法換成openpyxl使用excel2007的版本,原本測(cè)試不到三萬行的數(shù)據(jù),只要三四秒,換成openpyxl以后,花了好幾分鐘,具體沒看多少了,然后加上函數(shù)運(yùn)行時(shí)間的監(jiān)視器以后,才看到是讀取的時(shí)候出的問題

推測(cè)原因:

推測(cè)的話,openpyxl的根據(jù)行號(hào)列號(hào)讀取的時(shí)候,是從第一行第一列開始遍歷,直到行號(hào)等于指定行號(hào),列號(hào)等于指定列號(hào),所以要讀取的行號(hào)列號(hào)越多就越慢,(也可能是從第一個(gè)有數(shù)據(jù)的行或列),而xlrd則是類似與數(shù)組一樣,我們要取第幾個(gè)元素,直接根據(jù)下標(biāo)找到內(nèi)存中對(duì)應(yīng)地址的元素即可,所以無論excel總量多少,速度基本都是不變的

留下的坑

xlwt寫入僅支持65536行,那xlrd的讀取很可能也是,也就是超過這么多的數(shù)據(jù)可能也會(huì)出錯(cuò)

我這里因?yàn)槭亲x多表數(shù)據(jù)生成單表數(shù)據(jù),生成方式大概是Na*Nb這樣,所以實(shí)際讀取的不會(huì)太多,但生成的很多,所以基本可以用考慮這個(gè)問題

另外,據(jù)說xlrd讀取xlsx格式的偶爾會(huì)出現(xiàn)問題,具體沒測(cè)試,暫時(shí)用還沒毛病

最后,順帶上一下監(jiān)控函數(shù)運(yùn)行時(shí)間的裝飾器吧:

import time
from functools import wraps

def fn_timer(function):
  @wraps(function)
  def function_timer(*args, **kwargs):
    t0 = time.time()
    result = function(*args, **kwargs)
    t1 = time.time()
    print ("Total time running %s: %s seconds" %
      (function.__name__, str(t1-t0))
      )
    return result
  return function_timer

使用方式的話,就是在要監(jiān)控的函數(shù)定義上面加上 @fn_timer 就行了

以上這篇解決python執(zhí)行較大excel文件openpyxl慢問題就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。

相關(guān)文章

  • 讓python的Cookie.py模塊支持冒號(hào)做key的方法

    讓python的Cookie.py模塊支持冒號(hào)做key的方法

    雖然Cookie的標(biāo)準(zhǔn)是不允許:冒號(hào)出現(xiàn)在key里面的,但是我們的開發(fā)人員是很可愛的,常常會(huì)讓我們意想不到。
    2010-12-12
  • python中的decimal類型轉(zhuǎn)換實(shí)例詳解

    python中的decimal類型轉(zhuǎn)換實(shí)例詳解

    decimal 模塊實(shí)現(xiàn)了定點(diǎn)和浮點(diǎn)算術(shù)運(yùn)算符,使用的是大多數(shù)人所熟悉的模型,而不是程序員熟悉的模型,即大多數(shù)計(jì)算機(jī)硬件實(shí)現(xiàn)的 IEEE 浮點(diǎn)數(shù)運(yùn)算。這篇文章主要介紹了python里的decimal類型轉(zhuǎn)換,需要的朋友可以參考下
    2019-06-06
  • pandas實(shí)現(xiàn)datetime64與unix時(shí)間戳互轉(zhuǎn)

    pandas實(shí)現(xiàn)datetime64與unix時(shí)間戳互轉(zhuǎn)

    這篇文章主要介紹了pandas實(shí)現(xiàn)datetime64與unix時(shí)間戳互轉(zhuǎn),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2022-07-07
  • Python中的并發(fā)編程asyncio庫(kù)入門使用

    Python中的并發(fā)編程asyncio庫(kù)入門使用

    這篇文章主要為大家介紹了Python中的并發(fā)編程asyncio庫(kù)入門的使用示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2023-05-05
  • Python和Sublime整合過程圖示

    Python和Sublime整合過程圖示

    這篇文章主要介紹了Python和Sublime整合過程圖示,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2019-12-12
  • 詳解Python+Matplotlib繪制面積圖&熱力圖

    詳解Python+Matplotlib繪制面積圖&熱力圖

    這篇文章主要介紹了如何利用Python+Matplotlib繪制面積圖喝熱力圖,文中的示例代碼講解詳細(xì),對(duì)我們學(xué)習(xí)Python有一定幫助,需要的可以參考一下
    2022-04-04
  • Pycharm Available Package無法顯示/安裝包的問題Error Loading Package List解決

    Pycharm Available Package無法顯示/安裝包的問題Error Loading Package Li

    這篇文章主要介紹了Pycharm Available Package無法顯示/安裝包的問題Error Loading Package List解決,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-09-09
  • pytorch 實(shí)現(xiàn)L2和L1正則化regularization的操作

    pytorch 實(shí)現(xiàn)L2和L1正則化regularization的操作

    這篇文章主要介紹了pytorch 實(shí)現(xiàn)L2和L1正則化regularization的操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2021-03-03
  • 解決pycharm啟動(dòng)后總是不停的updating indices...indexing的問題

    解決pycharm啟動(dòng)后總是不停的updating indices...indexing的問題

    今天小編就為大家分享一篇解決pycharm啟動(dòng)后總是不停的updating indices...indexing的問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2019-11-11
  • 虛擬環(huán)境及venv和virtualenv的區(qū)別說明

    虛擬環(huán)境及venv和virtualenv的區(qū)別說明

    這篇文章主要介紹了虛擬環(huán)境及venv和virtualenv的區(qū)別說明,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2021-02-02

最新評(píng)論