python3 循環(huán)讀取excel文件并寫入json操作
文件內(nèi)容:
excel內(nèi)容:
代碼:
import xlrd import json import operator def read_xlsx(filename): # 打開excel文件 data1 = xlrd.open_workbook(filename) # 讀取第一個工作表 table = data1.sheets()[0] # 統(tǒng)計(jì)行數(shù) n_rows = table.nrows data = [] # 微信文章屬性:wechat_name wechat_id title abstract url time read like number for v in range(1, n_rows-1): # 每一行數(shù)據(jù)形成一個列表 values = table.row_values(v) # 列表形成字典 data.append({'wechat_name': values[0], 'wechat_id': values[1], 'title': values[2], 'abstract': values[3], 'url': values[4], 'time': values[5], 'read': values[6], 'like': values[7], 'number': values[8], }) # 返回所有數(shù)據(jù) return data if __name__ == '__main__': d = [] # 循環(huán)打開每個excel for i in range(1, 16): d1 = read_xlsx('./excel data/'+str(i)+'.xlsx') d.extend(d1) # 微信文章屬性 # 按時間升序排列 d = sorted(d, key=operator.itemgetter('time')) # 寫入json文件 with open('article.json', 'w', encoding='utf-8') as f: f.write(json.dumps(d, ensure_ascii=False, indent=2)) name = [] # 微信id寫文件 f1 = open('wechat_id.txt', 'w') for i in d: if i['wechat_id'] not in name: name.append(i['wechat_id']) f1.writelines(i['wechat_id']) f1.writelines('\n') print(len(name))
結(jié)果:
補(bǔ)充知識:Python mysql數(shù)據(jù) 讀取時間參數(shù) for循環(huán)寫入Excel文件
最近在利用Python 實(shí)現(xiàn)自動化表報(bào)時,有個功能是mysql的業(yè)務(wù)時間是讀取模板文件的時間參數(shù),需要用到for循環(huán)功能,基本思路是:
1.自動創(chuàng)建一個輸出文件的文件夾
2.根據(jù)模板文件創(chuàng)建一個新的excel文件到新創(chuàng)建的文件夾中
3.每次寫入時返回sheet的最大行數(shù)max_row,下次寫入時從最大行的下一行開始繼續(xù)寫入
4.每次讀取必須為同一個文件
代碼如下:
#! /usr/bin/env python # -*- coding:utf-8 -*- import MySQLdb from openpyxl import load_workbook import sys import time import os reload(sys) sys.setdefaultencoding('utf8') # 打開數(shù)據(jù)庫連接 db = MySQLdb.connect(host="localhost", user="zimu", passwd="zimu", db="xxx", port=0000,charset='utf8') template_file_demo = r"D:\path\demo.xlsx" # makedirs 創(chuàng)建文件時如果路徑不存在會創(chuàng)建這個路徑 output_path = r"D:\output\demo"+"_"+ time.strftime("%Y%m%d", time.localtime()) +"_" + str(int(time.time()))+"\\" os.makedirs(output_path) #創(chuàng)建文件到新創(chuàng)建的文件夾中 book_demo = load_workbook(template_file_demo) book_demo.save(output_path + "demo" +"_"+time.strftime("%Y%m%d", time.localtime())+".xlsx") #讀取指定文件夾下的文件 demo_file = output_path+"demo"+"_"+time.strftime("%Y%m%d", time.localtime())+".xlsx" def savedata(start_time,end_time): demosql = '''select * from demo where start_date<='%s' and end_date>='%s''''%(start_time,end_time) cursor = db.cursor() cursor.execute(demosql) demodata = cursor.fetchall() demo_book = load_workbook(demo_file) demosheet = demo_book['demo'] row_t = demosheet.max_row i = 0 while i < len(demodata): for j in range(0, 8): demosheet.cell(row_t + i + 1, j + 1).value = demodata[i][j] i += 1 demo_book.save(output_path+"demo"+"_"+time.strftime("%Y%m%d", time.localtime())+".xlsx") book_template = load_workbook(template_file_demo) timet = book_template['時間配置'] for t in range(2, timet.max_row + 1): # 讀取配置表中的時間 savedata(timet.cell(t, 1).value, timet.cell(t, 2).value)
5.模板文件的時間參數(shù)設(shè)置如下:
以上這篇python3 循環(huán)讀取excel文件并寫入json操作就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
用Python編寫生成樹狀結(jié)構(gòu)的文件目錄的腳本的教程
這篇文章主要介紹了用Python編寫生成樹狀結(jié)構(gòu)的文件目錄的腳本的教程,是一個利用os模塊下各函數(shù)的簡單實(shí)現(xiàn),需要的朋友可以參考下2015-05-05教你掌握分布式訓(xùn)練PyTorch?DDP到Accelerate到Trainer
這篇文章主要為大家介紹了教你掌握分布式訓(xùn)練PyTorch?DDP到Accelerate到Trainer2023-02-02