python excel多行合并的方法

更新時(shí)間：2020年12月09日 09:46:27 作者：py3study

這篇文章主要介紹了python excel多行合并的方法，幫助大家更好的利用python處理excel表格，感興趣的朋友可以了解下

一、概述
現(xiàn)有一個(gè)wenda1.xlsx文件，內(nèi)容如下：

需要將faq記錄合并為一行，效果如下：

注意：faq記錄，每一行用||來(lái)拼接。

二、多行轉(zhuǎn)換一行
新建test1.py，內(nèi)容如下：

# ！/usr/bin/python3
# -*- coding: utf-8 -*-
import xlrd

# 打開(kāi)excel文件，創(chuàng)建一個(gè)workbook對(duì)象
rbook = xlrd.open_workbook('wenda1.xlsx')
# sheets方法返回對(duì)象列表,[<xlrd.sheet.Sheet object at 0x103f147f0>]
rbook.sheets()
# xls默認(rèn)有3個(gè)工作簿,Sheet1,Sheet2,Sheet3
rsheet = rbook.sheet_by_index(0) # 取第一個(gè)工作簿

faq_tmp_dict = {} # FAQ臨時(shí)字典
faq_formal_list = [] # FAQ正式列表
first_category_tag = "" # 一級(jí)分類標(biāo)識(shí)
index = 0 # 索引

#循環(huán)工作簿的所有行
for row in rsheet.get_rows():
  index +=1

  first_category_row = row[0] # 1級(jí)分類所在的列
  first_category_value = first_category_row.value # 1級(jí)分類的值
  if first_category_value != '1級(jí)分類': # 排除第一行，這些都是列名
    if first_category_value: # 當(dāng)1級(jí)分類的值不為空時(shí)
      # 更新一級(jí)分類標(biāo)識(shí)，用#連接
      first_category_tag = "%s#%s"%(first_category_value,index)
      faq_like_column = row[1] # FAQ相似句所在的列
      faq_like_value = faq_like_column.value # FAQ相似句的值
      # 更新臨時(shí)字典，不存在默認(rèn)值為空字典，否則追加到列表中
      faq_tmp_dict.setdefault(first_category_tag, []).append(faq_like_value)
    else:
      # 當(dāng)1級(jí)分類的值為空時(shí)
      faq_like_column = row[1] # FAQ相似句所在的列
      faq_like_value = faq_like_column.value
      faq_tmp_dict.setdefault(first_category_tag, []).append(faq_like_value)


print(faq_tmp_dict)
# 處理臨時(shí)字典
for i in faq_tmp_dict:
  tmp_dict = {}
  # 一級(jí)分類，切割#號(hào)，取第一個(gè)
  first_category = i.split('#')[0]
  # print("first_category",first_category)
  # faq所有記錄，將faq列表轉(zhuǎn)換為一行，用逗號(hào)拼接
  faq_like_all = "||".join(faq_tmp_dict[i])
  # print("faq_merge",faq_all)
  tmp_dict['first_category'] = first_category
  tmp_dict['faq_like_all'] = faq_like_all
  faq_formal_list.append(tmp_dict)

print(faq_formal_list)

執(zhí)行輸出：

{'閑聊#2': ['不在嗎？', '你好在嗎？', '你在不在', '有人在么。', '你好？', '在么？說(shuō)話啊', '客戶在不在？'], '閑聊#9': ['你好', '客服你好', '你好，客服']}
[{'first_category': '閑聊', 'faq_like_all': '不在嗎？||你好在嗎？||你在不在||有人在么。||你好？||在么？說(shuō)話啊||客戶在不在？'}, {'first_category': '閑聊', 'faq_like_all': '你好||客服你好||你好，客服'}]

從上面輸出內(nèi)容，可以看出。將多行合并為一行，并且將faq記錄寫入到一個(gè)字典里面了。接下來(lái)就可以寫入到新表格了。

三、寫入新表格
完整代碼如下：

# ！/usr/bin/python3
# -*- coding: utf-8 -*-
import xlrd

# 打開(kāi)excel文件，創(chuàng)建一個(gè)workbook對(duì)象
rbook = xlrd.open_workbook('wenda1.xlsx')
# sheets方法返回對(duì)象列表,[<xlrd.sheet.Sheet object at 0x103f147f0>]
rbook.sheets()
# xls默認(rèn)有3個(gè)工作簿,Sheet1,Sheet2,Sheet3
rsheet = rbook.sheet_by_index(0) # 取第一個(gè)工作簿

faq_tmp_dict = {} # FAQ臨時(shí)字典
faq_formal_list = [] # FAQ正式列表
first_category_tag = "" # 一級(jí)分類標(biāo)識(shí)
index = 0 # 索引

#循環(huán)工作簿的所有行
for row in rsheet.get_rows():
  index +=1

  first_category_row = row[0] # 1級(jí)分類所在的列
  first_category_value = first_category_row.value # 1級(jí)分類的值
  if first_category_value != '1級(jí)分類': # 排除第一行，這些都是列名
    if first_category_value: # 當(dāng)1級(jí)分類的值不為空時(shí)
      # 更新一級(jí)分類標(biāo)識(shí)，用#連接
      first_category_tag = "%s#%s"%(first_category_value,index)
      faq_like_column = row[1] # FAQ相似句所在的列
      faq_like_value = faq_like_column.value # FAQ相似句的值
      # 更新臨時(shí)字典，不存在默認(rèn)值為空字典，否則追加到列表中
      faq_tmp_dict.setdefault(first_category_tag, []).append(faq_like_value)
    else:
      # 當(dāng)1級(jí)分類的值為空時(shí)
      faq_like_column = row[1] # FAQ相似句所在的列
      faq_like_value = faq_like_column.value
      faq_tmp_dict.setdefault(first_category_tag, []).append(faq_like_value)


print(faq_tmp_dict)
# 處理臨時(shí)字典
for i in faq_tmp_dict:
  tmp_dict = {}
  # 一級(jí)分類，切割#號(hào)，取第一個(gè)
  first_category = i.split('#')[0]
  # print("first_category",first_category)
  # faq所有記錄，將faq列表轉(zhuǎn)換為一行，用逗號(hào)拼接
  faq_like_all = "||".join(faq_tmp_dict[i])
  # print("faq_merge",faq_all)
  tmp_dict['first_category'] = first_category
  tmp_dict['faq_like_all'] = faq_like_all
  faq_formal_list.append(tmp_dict)

print(faq_formal_list)

import xlwt
import json
f = xlwt.Workbook()
sheet1 = f.add_sheet('Sheet1', cell_overwrite_ok=True)
row0 = ["1級(jí)分類", "faq記錄"]

# 寫第一行
for i in range(0, len(row0)):
  sheet1.write(0, i, row0[i])

# # 加載json文件
# with open("tj.json", 'r') as load_f:
#   load_dict = json.load(load_f) # 反序列化文件
#
num = 0 # 計(jì)數(shù)器
max_length = 0 # 最大長(zhǎng)度
for i in faq_formal_list:
  num+=1 # 自增1

  faq_col = sheet1.col(1) # faq記錄所在的列
  length = len(i['faq_like_all']) # 計(jì)算長(zhǎng)度
  # print("長(zhǎng)度",length)
  # 更新最大長(zhǎng)度
  if max_length < length:
    max_length = length

  # 設(shè)置表格寬度
  faq_col.width = max_length * 20* 20
  # 寫入庫(kù)名
  sheet1.write(num, 0, i['first_category'])
  # faq_like_str = "||".join(i['faq_like_all'])
  sheet1.write(num, 1, i['faq_like_all'])

# 保存到表格
f.save('test1.xls')

執(zhí)行代碼，它會(huì)生成一個(gè)test1.xlsx。

打開(kāi)文件，效果如下：

以上就是python excel多行合并的方法的詳細(xì)內(nèi)容，更多關(guān)于python excel多行合并的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章！

您可能感興趣的文章: