Python實(shí)現(xiàn)讀取excel中的圖片功能
一、讀取excel文件
我們先來看看如何讀取excel文件,讀取excel文件的方式很多。這里選擇openpyxl模塊,安裝語句如下:
pip install openpyxl
我們還需要用到一些其它模塊,具體如下:
pip install pyzbar pip install pillow pip install numpy
下面我們就可以開始操作了。
在Excel中,有工作簿、表、單元等。這里簡(jiǎn)單說一下,工作簿就是一個(gè)excel文件,表的話就是我們excel左下角切換的sheet1、sheet2,單元就是一個(gè)格子。下面我們來讀取一個(gè)excel文件:
from openpyxl import load_workbook
# 加載excel
wb = load_workbook("111.xlsx")
# 切換到第一張表
ws = wb[wb.sheetnames[0]]
# 獲取A3單元
cell = ws['A3']
# 輸出A3單元的值
print(cell.value)
openpyxl的更多操作可以看看官方的文檔https://openpyxl.readthedocs.io/en/stable/tutorial.html。
二、讀取excel中的圖片
讀取excel中的圖片有多種方式,本文會(huì)分享兩種方式。
(1)使用zipfile模塊
excel本身是一個(gè)壓縮文件,我們把excel的后綴改成zip后,手動(dòng)解壓就會(huì)看到在xl/media目錄下有一些圖片文件,這些圖片就是excel種插入的圖片。因此我們就可以通過解壓的方式讀取excel種的圖片,具體代碼如下:
import os
from zipfile import ZipFile
# 解壓目錄
unzip_path = "./unzip"
if not os.path.exists(unzip_path):
os.mkdir(unzip_path)
with ZipFile("111.xlsx") as f:
for file in f.namelist():
# 解壓圖片部分的文件
if file.startswith("xl/media"):
f.extract(file, path=unzip_path)
詳細(xì)講解可以參考這篇文章
(2)使用openpyxl讀取
上面的操作可以獲取excel中的圖片,但是有個(gè)缺點(diǎn)。就是我們不知道哪個(gè)圖片來自哪個(gè)單元,在有些情況下知道圖片來自哪個(gè)單元是很有比較的。下面我們就來解決這個(gè)問題:
from openpyxl import load_workbook
wb = load_workbook("111.xlsx")
ws = wb[wb.sheetnames[0]]
# 遍歷表中所有托
for image in ws._images:
print(image)
我們先讀取了一個(gè)表,然后調(diào)用_images獲取表中的所有圖片。但是這個(gè)圖片我們還不能操作,具體對(duì)圖片的操作我們下一節(jié)再看。我們先看看怎么知道圖片來自哪個(gè)單元,我們可以輸出圖片的anchor._from:
from openpyxl import load_workbook
wb = load_workbook("111.xlsx")
ws = wb[wb.sheetnames[0]]
for image in ws._images:
# 輸出圖片的位置信息
print(image.anchor._from)
具體輸入內(nèi)容如下:
<openpyxl.drawing.spreadsheet_drawing.AnchorMarker object> Parameters: col=0, colOff=1, row=0, rowOff=1
其中col表示行號(hào),row表示列號(hào)。根據(jù)這些信息,我們就可以知道圖片的單元了。比如col=0,row=0,表示的應(yīng)該是A1單元。如果col=1,row=1,表示的應(yīng)該是B2單元。
三、對(duì)讀取的圖片進(jìn)行處理
對(duì)圖片處理的操作有很多,這里要看具體需要。這里我分享一下把excel中圖片轉(zhuǎn)換成pillow圖片和ndarray對(duì)象的操作。轉(zhuǎn)換后,我們就可以用numpy和pillow對(duì)圖片進(jìn)行各種操作。
import numpy as np
from PIL import Image
from openpyxl import load_workbook
wb = load_workbook("111.xlsx")
ws = wb[wb.sheetnames[0]]
for image in ws._images:
# 將圖片轉(zhuǎn)換成Pillow中的圖片對(duì)象
img = Image.open(image.ref).convert("RGB")
# 將Pillow中的圖片對(duì)象轉(zhuǎn)換成ndarray數(shù)組
img = np.array(img)
如果我們excel中的圖片是二維碼,我們就可以進(jìn)行下面的操作:
import numpy as np
from PIL import Image
from pyzbar import pyzbar
from openpyxl import load_workbook
wb = load_workbook("111.xlsx")
ws = wb[wb.sheetnames[0]]
for image in ws._images:
# 轉(zhuǎn)換成容易操作的圖片對(duì)象
img = Image.open(image.ref).convert("RGB")
img = np.array(img)
# 解析二維碼
data = pyzbar.decode(img)
if data:
text = data[0].data.decode('utf-8')
print(text)
else:
print("未識(shí)別到內(nèi)容")補(bǔ)充
除了以上的方法,還可以通過以下操作實(shí)現(xiàn):
1、將待讀取的excel文件后綴名改成zip,變成壓縮文件。
2、再解壓這個(gè)文件。
3、在解壓后的文件夾中,就有excel中的圖片。
4、這樣讀excel中的圖片,就變成了讀文件夾中的圖片了,和普通文件一樣,可以做各種處理。
具體實(shí)現(xiàn)代碼
'''
File Name: readexcelimg
Author: tim
Date: 2018/7/26 19:52
Description: 讀取excel中的圖片,打印圖片路徑
先將excel轉(zhuǎn)換成zip包,解壓zip包,包下面有文件夾存放了圖片,讀取這個(gè)圖片
'''
import os
import zipfile
# 判斷是否是文件和判斷文件是否存在
def isfile_exist(file_path):
if not os.path.isfile(file_path):
print("It's not a file or no such file exist ! %s" % file_path)
return False
else:
return True
# 修改指定目錄下的文件類型名,將excel后綴名修改為.zip
def change_file_name(file_path, new_type='.zip'):
if not isfile_exist(file_path):
return ''
extend = os.path.splitext(file_path)[1] # 獲取文件拓展名
if extend != '.xlsx' and extend != '.xls':
print("It's not a excel file! %s" % file_path)
return False
file_name = os.path.basename(file_path) # 獲取文件名
new_name = str(file_name.split('.')[0]) + new_type # 新的文件名,命名為:xxx.zip
dir_path = os.path.dirname(file_path) # 獲取文件所在目錄
new_path = os.path.join(dir_path, new_name) # 新的文件路徑
if os.path.exists(new_path):
os.remove(new_path)
os.rename(file_path, new_path) # 保存新文件,舊文件會(huì)替換掉
return new_path # 返回新的文件路徑,壓縮包
# 解壓文件
def unzip_file(zipfile_path):
if not isfile_exist(zipfile_path):
return False
if os.path.splitext(zipfile_path)[1] != '.zip':
print("It's not a zip file! %s" % zipfile_path)
return False
file_zip = zipfile.ZipFile(zipfile_path, 'r')
file_name = os.path.basename(zipfile_path) # 獲取文件名
zipdir = os.path.join(os.path.dirname(zipfile_path), str(file_name.split('.')[0])) # 獲取文件所在目錄
for files in file_zip.namelist():
file_zip.extract(files, os.path.join(zipfile_path, zipdir)) # 解壓到指定文件目錄
file_zip.close()
return True
# 讀取解壓后的文件夾,打印圖片路徑
def read_img(zipfile_path):
if not isfile_exist(zipfile_path):
return False
dir_path = os.path.dirname(zipfile_path) # 獲取文件所在目錄
file_name = os.path.basename(zipfile_path) # 獲取文件名
pic_dir = 'xl' + os.sep + 'media' # excel變成壓縮包后,再解壓,圖片在media目錄
pic_path = os.path.join(dir_path, str(file_name.split('.')[0]), pic_dir)
file_list = os.listdir(pic_path)
for file in file_list:
filepath = os.path.join(pic_path, file)
print(filepath)
# 組合各個(gè)函數(shù)
def compenent(excel_file_path):
zip_file_path = change_file_name(excel_file_path)
if zip_file_path != '':
if unzip_file(zip_file_path):
read_img(zip_file_path)
# main
if __name__ == '__main__':
compenent('/Users/Desktop/test/people.xlsx')到此這篇關(guān)于Python實(shí)現(xiàn)讀取excel中的圖片功能的文章就介紹到這了,更多相關(guān)Python讀取excel圖片內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
wxPython:python首選的GUI庫實(shí)例分享
wxPython是Python語言的一套優(yōu)秀的GUI圖形庫。允許Python程序員很方便的創(chuàng)建完整的、功能鍵全的GUI用戶界面。 wxPython是作為優(yōu)秀的跨平臺(tái)GUI庫wxWidgets的Python封裝和Python模塊的方式提供給用戶的2019-10-10
Python腳本開發(fā)中的命令行參數(shù)及傳參示例詳解
這篇文章主要為大家介紹了Python腳本開發(fā)中的命令行參數(shù)及傳參示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-07-07
PyQt5使用QTimer實(shí)現(xiàn)電子時(shí)鐘
這篇文章主要為大家詳細(xì)介紹了PyQt5使用QTimer實(shí)現(xiàn)電子時(shí)鐘,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-07-07

