Python對(duì)130w+張圖片檢索的實(shí)現(xiàn)方法
任務(wù)說(shuō)明:
130w+張圖片,8張excel表里記錄了需要檢索圖片的文件名,現(xiàn)在需要找出對(duì)應(yīng)的圖片,將找出的圖片按不同的excel分別保存,并且在excel里能夠直接打開(kāi)圖片。
任務(wù)分析:
如果數(shù)據(jù)量不大的話,可以直接讀取excel表里的文件名進(jìn)行搜索保存,但這次的任務(wù)顯然不合適,因?yàn)閳D片實(shí)在太多,所以考慮后按照以下步驟:
1、遍歷圖片文件夾,讀取文件名和文件路徑,寫(xiě)入到csv文件中;
2、使用pandas的merge函數(shù),實(shí)現(xiàn)8張?jiān)糴xcel表與csv文件根據(jù)圖片文件名的對(duì)碰;
3、使用shutil的copy函數(shù),讀取文件路徑進(jìn)行保存。
代碼分析:
1、文件遍歷
import os import pandas as pd file_list = [] path_list = [] path = r"此處添加圖片路徑" print("任務(wù)開(kāi)始") for root,dirs,files in os.walk(path): for file in files: file_list.append(file.split('.')[0]) path_list.append(os.path.join(root,file)) print("文件遍歷結(jié)束") file_dic = dict(zip(file_list,path_list)) df = pd.DataFrame.from_dict(file_dic,orient='index', columns=['圖片1路徑']).reset_index().rename(columns={'index':'圖片1'}) df.to_csv("圖片1.csv") df = pd.DataFrame.from_dict(file_dic,orient='index', columns=['圖片2路徑']).reset_index().rename(columns={'index':'圖片2'}) df.to_csv("圖片2.csv") df = pd.DataFrame.from_dict(file_dic,orient='index', columns=['圖片3路徑']).reset_index().rename(columns={'index':'圖片3'}) df.to_csv("圖片3.csv") print("文件目錄導(dǎo)出成功")
2、表格對(duì)碰
import pandas as pd frame1 = pd.read_excel(r'excel表1.xlsx', 'sheet名') frame2 = pd.read_csv(r'圖片1.csv', sep=',') frame3 = pd.read_csv(r'圖片2.csv', sep=',') frame4 = pd.read_csv(r'圖片3.csv', sep=',') frame5 = pd.merge(frame1, frame2, on = ['圖片1'], how = 'left') frame6 = pd.merge(frame5, frame3, on = ['圖片2'], how = 'left') frame7 = pd.merge(frame6, frame4, on = ['圖片3'], how = 'left') col = ['圖片1','圖片2','圖片3'] frame7[col] = frame7[col].fillna('未找到') frame7.to_excel('excel表1合并后.xlsx')
3、圖片復(fù)制
import shutil target = '此處為excel表1導(dǎo)出圖片路徑' copylist1 = frame7['圖片1'] for src in copylist1: if src != '未找到': shutil.copy(src, target) copylist2 = frame7['圖片2'] for src in copylist2: if src != '未找到': shutil.copy(src, target) copylist3 = frame7['圖片3'] for src in copylist3: if src != '未找到': shutil.copy(src, target) print('復(fù)制完畢')
4、excel里打開(kāi)圖片,可以使用excel自帶的hyperlink函數(shù)。
總結(jié)
到此這篇關(guān)于Python對(duì)130w+張圖片檢索實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)Python圖片檢索內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python實(shí)現(xiàn)提取音樂(lè)頻譜的方法詳解
你有沒(méi)有經(jīng)常好奇一些音樂(lè)軟件的頻譜特效是怎么做的,為什么做的這么好看?有沒(méi)有想試試自己提取音樂(lè)頻譜并可視化展現(xiàn)出來(lái)?本文就來(lái)教你如何利用Python提取音樂(lè)頻譜,快來(lái)學(xué)習(xí)一下吧2022-06-06python獲取全國(guó)城市pm2.5、臭氧等空氣質(zhì)量過(guò)程解析
這篇文章主要介紹了python獲取全國(guó)城市pm2.5、臭氧等空氣質(zhì)量過(guò)程解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-10-10python驗(yàn)證碼識(shí)別教程之利用投影法、連通域法分割圖片
這篇文章主要給大家介紹了關(guān)于python驗(yàn)證碼識(shí)別教程之利用投影法、連通域法分割圖片的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起看看吧2018-06-06500行代碼使用python寫(xiě)個(gè)微信小游戲飛機(jī)大戰(zhàn)游戲
這篇文章主要介紹了500行代碼使用python寫(xiě)個(gè)微信小游戲飛機(jī)大戰(zhàn)游戲,本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2019-10-10python數(shù)據(jù)分析:關(guān)鍵字提取方式
今天小編就為大家分享一篇python數(shù)據(jù)分析:關(guān)鍵字提取方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-02-02Python實(shí)現(xiàn)PDF到Word文檔的高效轉(zhuǎn)換
這篇文章主要為大家詳細(xì)介紹了如何使用Python編程語(yǔ)言,結(jié)合庫(kù)和工具,將PDF文件轉(zhuǎn)換為可編輯的Word文檔,使文檔的編輯變得方便高效,需要的可以參考下2024-01-01python實(shí)現(xiàn)企業(yè)微信定時(shí)發(fā)送文本消息的示例代碼
這篇文章主要介紹了python實(shí)現(xiàn)企業(yè)微信定時(shí)發(fā)送文本消息的示例代碼,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-11-11