欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python 使用xlwt模塊將多行多列數(shù)據(jù)循環(huán)寫入excel文檔的操作

 更新時(shí)間:2020年11月10日 08:44:10   作者:Quincy379  
這篇文章主要介紹了Python 使用xlwt模塊將多行多列數(shù)據(jù)循環(huán)寫入excel文檔的操作,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧

我就廢話不多說了,大家還是直接看代碼吧~

#!/usr/bin/python
# -*- coding: utf-8 -*-

import xlwt
import re

def host_regex(dataline):
 host_regex = r"<host>(.*?)</host>"
 host = re.findall(host_regex, dataline)
 if host:
  return host[0]

def ip_regex(dataline):
 ip_regex = r"<ip>(.*?)</ip>"
 ip = re.findall(ip_regex, dataline)
 if ip:
  return ip[0]

with open("zbx_export_hosts.xml", "r", encoding="utf8") as f:
 lines = f.readlines()
 alldatas = []
 hostlist = []
 iplist = []
 for line in lines:
  host = host_regex(line)
  ip = ip_regex(line)

  if host is not None:
   hostlist.append(host)
  if ip is not None:
   iplist.append(ip)
 hosts_ip = []
 # 構(gòu)造數(shù)據(jù)結(jié)構(gòu),形如:[[a,b],[c,d],...]
 multi_list = map(list, zip(hostlist, iplist))
 for multi in multi_list:
  hosts_ip.append(multi)
 workbook = xlwt.Workbook()
 worksheet = workbook.add_sheet('test')
 # 關(guān)鍵代碼
 for hi in enumerate(hosts_ip):
  for num in range(len(hi[1])):
   # 行、列、值
   worksheet.write(hi[0], num, hi[1][num])

 workbook.save('excelwrite.xls')

PS:其實(shí)有兩行代碼冗余,就不刪了!

補(bǔ)充知識:通過python寫入xlsx大量數(shù)據(jù)問題簡述

以前批處理生成數(shù)據(jù)文件都是通過c程序直接按照逗號分隔方式寫文本文件以csv保存的。但是由于有些處理的數(shù)據(jù)表直接給業(yè)務(wù)人員看,業(yè)務(wù)人員習(xí)慣使用xls,因此提了些需求改造,對于一些小于100w的數(shù)據(jù)均要求改為xlsx文件格式的報(bào)表。

考慮報(bào)表文件數(shù)據(jù)處理便捷,因此決定用python實(shí)現(xiàn),最初使用了openpyxl庫,這個(gè)python庫擁有非常強(qiáng)大的xlsx的讀寫api,能夠很方便的實(shí)現(xiàn)讀寫。但是在實(shí)際使用中發(fā)現(xiàn)在處理較大行數(shù)的xlsx時(shí),占用內(nèi)存非常嚴(yán)重,8個(gè)字段50w行數(shù)據(jù)在運(yùn)行中內(nèi)存高達(dá)10G,這不是我們應(yīng)用服務(wù)器能夠接受的范圍。

因此尋求改善,在網(wǎng)上了解后,發(fā)現(xiàn)創(chuàng)建xlsx表時(shí),指定write_only參數(shù)是openpyxl提供的大數(shù)據(jù)寫入解決方案,以下摘自官網(wǎng)范例,在選擇了此參數(shù)后,無法通過ws.cell(row=i, column=j).value = ? 的方式復(fù)制,只能通過append的方式追加行。關(guān)于設(shè)置只寫cell設(shè)置樣式,可以直接查看官網(wǎng)

>>> from openpyxl import Workbook
>>> wb = Workbook(write_only=True)
>>> ws = wb.create_sheet()
>>>
>>> # now we'll fill it with 100 rows x 200 columns
>>>
>>> for irow in range(100):
...  ws.append(['%d' % i for i in range(200)]) #可以先將一行的數(shù)據(jù)寫在一個(gè)list中,直接ws.append(list)
>>> # save the file
>>> wb.save('new_big_file.xlsx') # doctest: +SKIP

不過僅僅按上述范例修改write_only跑數(shù)時(shí)發(fā)現(xiàn)內(nèi)存占用并沒有緩解,再仔細(xì)閱讀官網(wǎng)說明時(shí)才發(fā)現(xiàn)這么一句話“When you want to dump large amounts of data make sure you have lxml installed.”原來在openpyxl安裝時(shí),并沒有把lxml作為強(qiáng)依賴,只是一個(gè)可選包,然后查實(shí)發(fā)現(xiàn)確實(shí)服務(wù)器上并沒有安裝lxml包。

于是與為了解決這個(gè)問題先在測試環(huán)境上安裝lxml,安裝過程也不是很順利。

首先先要裝libxml2以及l(fā)ibxslt,因?yàn)闆]有root權(quán)限,均為源碼安裝,且只能安裝在用戶目錄。需要注意的是libxml2在安裝時(shí)需要--with-python='python安裝目錄',libxslt安裝的時(shí)候需要指定libxml2安裝目錄。

尤其最后的lxml安裝也是坑挺多的,主要是指定libxml2和libxslt,安裝lxml時(shí)先python3 setup.py build_ext -i -I${libxml2includepath} -L${libxml2libpath} -I${libxsltincludepath} -L${libxsltlibpath} ,再python3 setup.py install。

全部安裝完之后,確實(shí)openpyxl寫xlsx不再增加內(nèi)存,先在tmp目錄一個(gè)臨時(shí)文件中寫,待調(diào)用save方法時(shí),保存到正式文件。

此外在這個(gè)問題解決中,還了解到writexlsx庫也可以處理大文件xlsx的寫入,并且安裝沒有這么多的依賴,其實(shí)還是非常推薦,也很簡介,官網(wǎng)有介紹。

操作大文件時(shí)指定{'constant_memory': True}即可。

filename = 'test.xlsx'
wb = xlsxwriter.Workbook(filename, {'constant_memory': True})
ws = wb.add_worksheet('大文件')
i = 0
data= []
data.append('中文')
data.append(1323)
data.append('abc')
ws.write_row(i, 0, data)
i = i + 1
wb.close() #直接關(guān)閉即可,不需要額外save

以上這篇Python 使用xlwt模塊將多行多列數(shù)據(jù)循環(huán)寫入excel文檔的操作就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。

相關(guān)文章

  • python3.7 sys模塊的具體使用

    python3.7 sys模塊的具體使用

    這篇文章主要介紹了python3.7 sys模塊的具體使用,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-07-07
  • python3.4用循環(huán)往mysql5.7中寫數(shù)據(jù)并輸出的實(shí)現(xiàn)方法

    python3.4用循環(huán)往mysql5.7中寫數(shù)據(jù)并輸出的實(shí)現(xiàn)方法

    下面小編就為大家?guī)硪黄猵ython3.4用循環(huán)往mysql5.7中寫數(shù)據(jù)并輸出的實(shí)現(xiàn)方法。小編覺得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧
    2017-06-06
  • C#返回當(dāng)前系統(tǒng)所有可用驅(qū)動器符號的方法

    C#返回當(dāng)前系統(tǒng)所有可用驅(qū)動器符號的方法

    這篇文章主要介紹了C#返回當(dāng)前系統(tǒng)所有可用驅(qū)動器符號的方法,涉及C#操作系統(tǒng)硬件驅(qū)動的相關(guān)技巧,需要的朋友可以參考下
    2015-04-04
  • Django渲染Markdown文章目錄的方法示例

    Django渲染Markdown文章目錄的方法示例

    這篇文章主要介紹了Django渲染Markdown文章目錄的方法示例,小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧
    2019-01-01
  • Python Django搭建網(wǎng)站流程圖解

    Python Django搭建網(wǎng)站流程圖解

    這篇文章主要介紹了Python Django搭建網(wǎng)站流程圖解,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-06-06
  • python求質(zhì)數(shù)的3種方法

    python求質(zhì)數(shù)的3種方法

    這篇文章主要為大家詳細(xì)介紹了python求質(zhì)數(shù)的多種方法,多種方法求質(zhì)數(shù)的實(shí)現(xiàn)代碼,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2018-09-09
  • Pytorch 的 LSTM 模型的示例教程

    Pytorch 的 LSTM 模型的示例教程

    本文給大家介紹了Pytorch 的 LSTM 模型的示例教程,文中結(jié)合實(shí)例代碼給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友參考下吧
    2023-06-06
  • 解決PyCharm控制臺輸出亂碼的問題

    解決PyCharm控制臺輸出亂碼的問題

    今天小編就為大家分享一篇解決PyCharm控制臺輸出亂碼的問題,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-01-01
  • GitHub?AI編程工具copilot在Pycharm的應(yīng)用

    GitHub?AI編程工具copilot在Pycharm的應(yīng)用

    最近聽說github出了一種最新的插件叫做copilot,這篇文章主要給大家介紹了關(guān)于GitHub?AI編程工具copilot在Pycharm的應(yīng)用,目前感覺確實(shí)不錯(cuò),建議大家也去使用,需要的朋友可以參考下
    2022-04-04
  • Python實(shí)現(xiàn)天氣查詢軟件

    Python實(shí)現(xiàn)天氣查詢軟件

    今天給大家?guī)硪粋€(gè)不是那么實(shí)用的小工具-天氣查詢,文中詳細(xì)介紹了如何實(shí)用Python實(shí)現(xiàn)天氣查詢系統(tǒng),需要的朋友可以參考下
    2021-06-06

最新評論