級(jí)聯(lián)分類(lèi)器算法原理解析
一、人臉檢測(cè)算法分類(lèi)
目前人臉檢測(cè)方法主要分為兩大類(lèi),基于知識(shí)和基于統(tǒng)計(jì)。
基于知識(shí)的人臉檢測(cè)方法主要包括:模板匹配,人臉特征,形狀與邊緣,紋理特征,顏色特征。
基于統(tǒng)計(jì)的人臉檢測(cè)方法主要包括:主成分分析與特征臉?lè)?,神?jīng)網(wǎng)絡(luò)模型,隱馬爾可夫模型,支持向量機(jī),Adaboost算法。
基于知識(shí)的方法將人臉看成不同特征的特定組合,即通過(guò)人臉的眼睛、嘴巴、鼻子、耳朵等特征及其組合關(guān)系來(lái)檢測(cè)人臉。
基于統(tǒng)計(jì)的方法將人臉看成統(tǒng)一的二維像素矩陣,通過(guò)大量的樣本構(gòu)建人臉子空間,通過(guò)相似度的大小來(lái)判斷人臉是否存在。
二、Haar分類(lèi)器算法
本文介紹的Haar分類(lèi)器方法,包含了Adaboost算法。
Haar算法實(shí)際上是運(yùn)用了boosting算法中的Adaboost算法。Haar分類(lèi)器利用Adaboost算法構(gòu)建一個(gè)強(qiáng)分類(lèi)器進(jìn)行級(jí)聯(lián),而在底層特征抽取上采用的是高校的矩形特征以及積分圖方法。
Haar分類(lèi)器=類(lèi)Haar特征+積分圖法+Adaboost算法+級(jí)聯(lián)。
Haar分類(lèi)器主要步驟如下:
1. 提取類(lèi)Haar特征;
2. 利用積分圖法對(duì)類(lèi)Haar特征提取進(jìn)行加速;
3. 使用Adaboost算法訓(xùn)練強(qiáng)分類(lèi)器,區(qū)分出人臉和非人臉;
4. 使用篩選式級(jí)聯(lián)把強(qiáng)的分類(lèi)器級(jí)聯(lián)在一起,從而提高檢測(cè)準(zhǔn)確度。
2.1 人臉檢測(cè)的大概流程
我們用一個(gè)小的窗口在一幅圖片中不斷的滑動(dòng),每滑動(dòng)到一個(gè)位置,就對(duì)該小窗口內(nèi)的圖像進(jìn)行特征提取,若提取到的特征通過(guò)了所有訓(xùn)練好的強(qiáng)分類(lèi)器的判定,則我們判定該小窗口的圖片內(nèi)含有人臉。
2.2 Haar-like特征
Viola牛們提出的Haar-like特征如下:
將Haar-like特征在圖片上進(jìn)行滑動(dòng),在每個(gè)位置計(jì)算白色區(qū)域?qū)?yīng)的像素值的和減去黑色區(qū)域?qū)?yīng)的像素值的和,從而提取出該位置的特征,人臉區(qū)域與非人臉區(qū)域提取出的特征值不同,從而區(qū)分出人臉區(qū)域和非人臉區(qū)域。
我們可以用多個(gè)矩形特征計(jì)算得到一個(gè)區(qū)分度更大的特征值,從而增加人臉區(qū)域和非人臉區(qū)域的區(qū)分度。那么該怎么組合這些矩形特征才能得到更好的區(qū)分度呢?Adaboost算法就是用來(lái)解決這個(gè)問(wèn)題的。
2.3 Adaboost算法
Adaboost算法是一種一般性的分類(lèi)器性能提升算法,不僅僅是限定于一種算法。Adaboost算法可以用來(lái)更好地選擇矩形特征的組合,而這些矩形特征的組合就構(gòu)成了分類(lèi)器,分類(lèi)器以決策樹(shù)的方式存儲(chǔ)這些矩形特征組合。
Adaboost是基于boosting算法的,而boosting算法涉及到弱分類(lèi)器和強(qiáng)分類(lèi)器的概念。弱分類(lèi)器是基于弱學(xué)習(xí)的,其分類(lèi)正確率較低,但是較容易獲得,強(qiáng)分類(lèi)器是基于強(qiáng)學(xué)習(xí),其分類(lèi)正確率較高,但是較難獲得。
Kearns和Valiant兩個(gè)大神提出弱學(xué)習(xí)和強(qiáng)學(xué)習(xí)是等價(jià)的,并且證明只要樣本充足,弱學(xué)習(xí)可以通過(guò)一定的組合獲得任意精度的強(qiáng)學(xué)習(xí)。這個(gè)證明為boostting算法提供了理論基礎(chǔ),使其成為一個(gè)能夠提高分類(lèi)器性能的一般性方法。
而boosting算法主要存在兩個(gè)問(wèn)題,一個(gè)是它需要預(yù)先知道弱分類(lèi)器的誤差,另一個(gè)是它在訓(xùn)練后期會(huì)專(zhuān)注于幾個(gè)難以分類(lèi)的樣本,因此會(huì)變得不穩(wěn)定。針對(duì)這些問(wèn)題,后來(lái)Freund和Schapire提出了實(shí)際可行的Adaboost算法。
2.4 弱分類(lèi)器的構(gòu)建
我們可以用決策樹(shù)來(lái)構(gòu)建一個(gè)簡(jiǎn)單的弱分類(lèi)器, 將提取到的特征與分類(lèi)器的特征進(jìn)行逐個(gè)比較,從而判斷該特征是否屬于人臉,如下圖所示:
該分類(lèi)器的重點(diǎn)在于閾值的設(shè)定。閾值的設(shè)定方法如下:
(1)對(duì)于每個(gè)分類(lèi)器計(jì)算訓(xùn)練樣本的特征值;
(2)對(duì)這些特征值進(jìn)行排序;
(3)計(jì)算所有屬于人臉的樣本的特征值的和t1和所有屬于非人臉的樣本的特征值的和t0;
(4)計(jì)算第i個(gè)樣本前所有屬于人臉的樣本的特征值的和s1is1i和屬于非人臉的樣本的特征值的和s0is0i;
(5)計(jì)算r=min((s1+(t0i−s0i)),s0+(t1i−s1i))r=min((s1+(t0i−s0i)),s0+(t1i−s1i))。
計(jì)算得到的最小的rr值即為所求閾值。有了閾值,我們便用決策樹(shù)構(gòu)成了一個(gè)簡(jiǎn)單的弱分類(lèi)器,如下所示:
其中x子圖像窗口,f是特征,p的作用是控制不等號(hào)方向,使得不等號(hào)都為"<",θθ是閾值。
2.5 強(qiáng)分類(lèi)器的構(gòu)造
這個(gè)部分我還是似懂非懂。按照我的理解,強(qiáng)分類(lèi)為的構(gòu)造是這樣的:
(1)首先選出部分樣本,給它們賦予權(quán)重1/N,其中N為總的樣本的個(gè)數(shù);
(2)用選出的樣本訓(xùn)練弱分類(lèi)器;
(3)提高錯(cuò)誤分類(lèi)的樣本的權(quán)重,并舍棄正確分類(lèi)的樣本,加入新的樣本,新的樣本的權(quán)重還是之前的1/N,進(jìn)行新一輪的弱分類(lèi)器的訓(xùn)練;
(4)經(jīng)過(guò)T輪后,訓(xùn)練出T個(gè)弱分類(lèi)器;
(5)將這T個(gè)弱分類(lèi)器根據(jù)他們的分類(lèi)錯(cuò)誤率加權(quán)求和構(gòu)成一個(gè)強(qiáng)的分類(lèi)器,如下所示:
其中αtαt是第t個(gè)弱分類(lèi)器的權(quán)重,βtβt是第t個(gè)弱分類(lèi)器的錯(cuò)誤率。強(qiáng)分類(lèi)器相當(dāng)于先讓各個(gè)弱分類(lèi)器進(jìn)行投票,然后讓投票結(jié)果根據(jù)各弱分類(lèi)器的錯(cuò)誤率進(jìn)行加權(quán)相加,最后與平均的投票結(jié)果進(jìn)行比較得到最終結(jié)果。
Reference:
http://www.dbjr.com.cn/article/222465.htm
以上就是級(jí)聯(lián)分類(lèi)器算法原理解析的詳細(xì)內(nèi)容,更多關(guān)于級(jí)聯(lián)分類(lèi)器算法的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
基于Leaflet的VideoOverlay視頻圖層疊加實(shí)戰(zhàn)教程
這篇文章主要介紹了基于Leaflet的VideoOverlay視頻圖層疊加實(shí)戰(zhàn),本文首先介紹了DistortableVideo組件的相關(guān)知識(shí),它的github倉(cāng)庫(kù)信息,相關(guān)源代碼的目錄說(shuō)明,使用依賴信息,需要的朋友可以參考下2023-02-02git分支(branch)操作相關(guān)命令及分支命令的使用
這篇文章主要介紹了git分支(branch)操作相關(guān)命令及分支命令的使用的相關(guān)資料,需要的朋友可以參考下2017-10-10調(diào)用無(wú)文檔說(shuō)明的?Web?API過(guò)程描述
這篇文章主要為大家介紹了調(diào)用無(wú)文檔說(shuō)明的Web?API過(guò)程描述,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪<BR>2022-03-03select下拉菜單實(shí)現(xiàn)二級(jí)聯(lián)動(dòng)效果
這篇文章主要介紹了select下拉菜單實(shí)現(xiàn)二級(jí)聯(lián)動(dòng)效果,在一些項(xiàng)目開(kāi)發(fā)中經(jīng)常會(huì)遇到這樣的需求,今天小編通過(guò)實(shí)例代碼給大家講解,需要的朋友可以參考下2019-10-10一文徹底理清session、cookie、token的區(qū)別
session和token本質(zhì)上是沒(méi)有區(qū)別的,都是對(duì)用戶身份的認(rèn)證機(jī)制,只是他們實(shí)現(xiàn)的校驗(yàn)機(jī)制不一樣而已,下面這篇文章主要給大家介紹了關(guān)于session、cookie、token區(qū)別的相關(guān)資料,需要的朋友可以參考下2023-02-02