Python 40行代碼實(shí)現(xiàn)人臉識(shí)別功能
前言
很多人都認(rèn)為人臉識(shí)別是一項(xiàng)非常難以實(shí)現(xiàn)的工作,看到名字就害怕,然后心懷忐忑到網(wǎng)上一搜,看到網(wǎng)上N頁的教程立馬就放棄了。這些人里包括曾經(jīng)的我自己。其實(shí)如果如果你不是非要深究其中的原理,只是要實(shí)現(xiàn)這一工作的話,人臉識(shí)別也沒那么難。今天我們就來看看如何在40行代碼以內(nèi)簡單地實(shí)現(xiàn)人臉識(shí)別。
一點(diǎn)區(qū)分
對(duì)于大部分人來說,區(qū)分人臉檢測(cè)和人臉識(shí)別完全不是問題。但是網(wǎng)上有很多教程有無無意地把人臉檢測(cè)說成是人臉識(shí)別,誤導(dǎo)群眾,造成一些人認(rèn)為二者是相同的。其實(shí),人臉檢測(cè)解決的問題是確定一張圖上有木有人臉,而人臉識(shí)別解決的問題是這個(gè)臉是誰的??梢哉f人臉檢測(cè)是是人識(shí)別的前期工作。今天我們要做的是人臉識(shí)別。
所用工具
Anaconda 2——Python 2
Dlib
scikit-image
Dlib
對(duì)于今天要用到的主要工具,還是有必要多說幾句的。Dlib是基于現(xiàn)代C++的一個(gè)跨平臺(tái)通用的框架,作者非常勤奮,一直在保持更新。Dlib內(nèi)容涵蓋機(jī)器學(xué)習(xí)、圖像處理、數(shù)值算法、數(shù)據(jù)壓縮等等,涉獵甚廣。更重要的是,Dlib的文檔非常完善,例子非常豐富。就像很多庫一樣,Dlib也提供了Python的接口,安裝非常簡單,用pip只需要一句即可:
pip install dlib
上面需要用到的scikit-image同樣只是需要這么一句:
pip install scikit-image
注:如果用pip install dlib安裝失敗的話,那安裝起來就比較麻煩了。錯(cuò)誤提示很詳細(xì),按照錯(cuò)誤提示一步步走就行了。
人臉識(shí)別
之所以用Dlib來實(shí)現(xiàn)人臉識(shí)別,是因?yàn)樗呀?jīng)替我們做好了絕大部分的工作,我們只需要去調(diào)用就行了。Dlib里面有人臉檢測(cè)器,有訓(xùn)練好的人臉關(guān)鍵點(diǎn)檢測(cè)器,也有訓(xùn)練好的人臉識(shí)別模型。今天我們主要目的是實(shí)現(xiàn),而不是深究原理。感興趣的同學(xué)可以到官網(wǎng)查看源碼以及實(shí)現(xiàn)的參考文獻(xiàn)。今天的例子既然代碼不超過40行,其實(shí)是沒啥難度的。有難度的東西都在源碼和論文里。
首先先通過文件樹看一下今天需要用到的東西:
準(zhǔn)備了六個(gè)候選人的圖片放在candidate-faces文件夾中,然后需要識(shí)別的人臉圖片test.jpg。我們的工作就是要檢測(cè)到test.jpg中的人臉,然后判斷她到底是候選人中的誰。另外的girl-face-rec.py
是我們的python腳本。shape_predictor_68_face_landmarks.dat
是已經(jīng)訓(xùn)練好的人臉關(guān)鍵點(diǎn)檢測(cè)器。dlib_face_recognition_resnet_model_v1.dat
是訓(xùn)練好的ResNet人臉識(shí)別模型。ResNet是何凱明在微軟的時(shí)候提出的深度殘差網(wǎng)絡(luò),獲得了 ImageNet 2015 冠軍,通過讓網(wǎng)絡(luò)對(duì)殘差進(jìn)行學(xué)習(xí),在深度和精度上做到了比
CNN 更加強(qiáng)大。
1. 前期準(zhǔn)備
shape_predictor_68_face_landmarks.dat
和dlib_face_recognition_resnet_model_v1.dat
都可以在這里找到。不能點(diǎn)擊超鏈接的可以直接輸入以下網(wǎng)址:http://dlib.net/files/。
然后準(zhǔn)備幾個(gè)人的人臉圖片作為候選人臉,最好是正臉。放到candidate-faces文件夾中。
本文這里準(zhǔn)備的是六張圖片,如下:
她們分別是
然后準(zhǔn)備四張需要識(shí)別的人臉圖像,其實(shí)一張就夠了,這里只是要看看不同的情況:
可以看到前兩張和候選文件中的本人看起來還是差別不小的,第三張是候選人中的原圖,第四張圖片微微側(cè)臉,而且右側(cè)有陰影。
2.識(shí)別流程
數(shù)據(jù)準(zhǔn)備完畢,接下來就是代碼了。識(shí)別的大致流程是這樣的:
- 先對(duì)候選人進(jìn)行人臉檢測(cè)、關(guān)鍵點(diǎn)提取、描述子生成后,把候選人描述子保存起來。
- 然后對(duì)測(cè)試人臉進(jìn)行人臉檢測(cè)、關(guān)鍵點(diǎn)提取、描述子生成。
- 最后求測(cè)試圖像人臉描述子和候選人臉描述子之間的歐氏距離,距離最小者判定為同一個(gè)人。
3.代碼
代碼不做過多解釋,因?yàn)橐呀?jīng)注釋的非常完善了。以下是girl-face-rec.py
# -*- coding: UTF-8 -*- import sys,os,dlib,glob,numpy from skimage import io if len(sys.argv) != 5: print "請(qǐng)檢查參數(shù)是否正確" exit() # 1.人臉關(guān)鍵點(diǎn)檢測(cè)器 predictor_path = sys.argv[1] # 2.人臉識(shí)別模型 face_rec_model_path = sys.argv[2] # 3.候選人臉文件夾 faces_folder_path = sys.argv[3] # 4.需識(shí)別的人臉 img_path = sys.argv[4] # 1.加載正臉檢測(cè)器 detector = dlib.get_frontal_face_detector() # 2.加載人臉關(guān)鍵點(diǎn)檢測(cè)器 sp = dlib.shape_predictor(predictor_path) # 3. 加載人臉識(shí)別模型 facerec = dlib.face_recognition_model_v1(face_rec_model_path) # win = dlib.image_window() # 候選人臉描述子list descriptors = [] # 對(duì)文件夾下的每一個(gè)人臉進(jìn)行: # 1.人臉檢測(cè) # 2.關(guān)鍵點(diǎn)檢測(cè) # 3.描述子提取 for f in glob.glob(os.path.join(faces_folder_path, "*.jpg")): print("Processing file: {}".format(f)) img = io.imread(f) #win.clear_overlay() #win.set_image(img) # 1.人臉檢測(cè) dets = detector(img, 1) print("Number of faces detected: {}".format(len(dets))) for k, d in enumerate(dets): # 2.關(guān)鍵點(diǎn)檢測(cè) shape = sp(img, d) # 畫出人臉區(qū)域和和關(guān)鍵點(diǎn) # win.clear_overlay() # win.add_overlay(d) # win.add_overlay(shape) # 3.描述子提取,128D向量 face_descriptor = facerec.compute_face_descriptor(img, shape) # 轉(zhuǎn)換為numpy array v = numpy.array(face_descriptor) descriptors.append(v) # 對(duì)需識(shí)別人臉進(jìn)行同樣處理 # 提取描述子,不再注釋 img = io.imread(img_path) dets = detector(img, 1) dist = [] for k, d in enumerate(dets): shape = sp(img, d) face_descriptor = facerec.compute_face_descriptor(img, shape) d_test = numpy.array(face_descriptor) # 計(jì)算歐式距離 for i in descriptors: dist_ = numpy.linalg.norm(i-d_test) dist.append(dist_) # 候選人名單 candidate = ['Unknown1','Unknown2','Shishi','Unknown4','Bingbing','Feifei'] # 候選人和距離組成一個(gè)dict c_d = dict(zip(candidate,dist)) cd_sorted = sorted(c_d.iteritems(), key=lambda d:d[1]) print "\n The person is: ",cd_sorted[0][0] dlib.hit_enter_to_continue()
4.運(yùn)行結(jié)果
我們?cè)?py所在的文件夾下打開命令行,運(yùn)行如下命令
python girl-face-rec.py 1.dat 2.dat ./candidate-faecs test1.jpg
由于shape_predictor_68_face_landmarks.dat
和dlib_face_recognition_resnet_model_v1.dat
名字實(shí)在太長,所以我把它們重命名為1.dat和2.dat。
運(yùn)行結(jié)果如下:
The person is Bingbing。
記憶力不好的同學(xué)可以翻上去看看test1.jpg是誰的圖片。有興趣的話可以把四張測(cè)試圖片都運(yùn)行下試試。
這里需要說明的是,前三張圖輸出結(jié)果都是非常理想的。但是第四張測(cè)試圖片的輸出結(jié)果是候選人4。對(duì)比一下兩張圖片可以很容易發(fā)現(xiàn)混淆的原因。
機(jī)器畢竟不是人,機(jī)器的智能還需要人來提升。
有興趣的同學(xué)可以繼續(xù)深入研究如何提升識(shí)別的準(zhǔn)確率。比如每個(gè)人的候選圖片用多張,然后對(duì)比和每個(gè)人距離的平均值之類的。全憑自己了。
以上就是本文的全部內(nèi)容,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作能帶來一定的幫助,同時(shí)也希望多多支持腳本之家!
相關(guān)文章
python GUI庫圖形界面開發(fā)之PyQt5多線程中信號(hào)與槽的詳細(xì)使用方法與實(shí)例
這篇文章主要介紹了python GUI庫圖形界面開發(fā)之PyQt5多線程中信號(hào)與槽的詳細(xì)使用方法與實(shí)例,需要的朋友可以參考下2020-03-03關(guān)于Python正則表達(dá)式 findall函數(shù)問題詳解
在寫正則表達(dá)式的時(shí)候總會(huì)遇到不少的問題,本文講述了Python正則表達(dá)式中 findall()函數(shù)和多個(gè)表達(dá)式元組相遇的時(shí)候會(huì)出現(xiàn)的問題2018-03-03基于Python構(gòu)建一個(gè)智能語音機(jī)器人
這篇文章主要為大家詳細(xì)介紹了如何基于Python構(gòu)建一個(gè)智能語音機(jī)器人,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下2023-12-12Python 實(shí)現(xiàn)遞歸法解決迷宮問題的示例代碼
這篇文章主要介紹了Python 實(shí)現(xiàn)遞歸法解決迷宮問題的示例代碼,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-01-01Python開發(fā)實(shí)例分享bt種子爬蟲程序和種子解析
最近瘋狂的研究DHT網(wǎng)絡(luò)技術(shù),文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2014-05-05深入解析Python中的descriptor描述器的作用及用法
在Python中描述器也被稱為描述符,描述器能夠?qū)崿F(xiàn)對(duì)對(duì)象屬性的訪問控制,下面我們就來深入解析Python中的descriptor描述器的作用及用法2016-06-06Python3實(shí)現(xiàn)zip分卷壓縮過程解析
這篇文章主要介紹了Python3實(shí)現(xiàn)zip分卷壓縮過程解析,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-10-10