iOS身份證號(hào)碼識(shí)別示例
一、前言
身份證識(shí)別,又稱OCR技術(shù)。OCR技術(shù)是光學(xué)字符識(shí)別的縮寫,是通過掃描等光學(xué)輸入方式將各種票據(jù)、報(bào)刊、書籍、文稿及其它印刷品的文字轉(zhuǎn)化為圖像信息,再利用文字識(shí)別技術(shù)將圖像信息轉(zhuǎn)化為可以使用的計(jì)算機(jī)輸入技術(shù)。
因?yàn)轫?xiàng)目需要,所以這些天查閱了相關(guān)資料,想在網(wǎng)上看看有沒有大神封裝的現(xiàn)成的demo可以用。但是無(wú)果,網(wǎng)上關(guān)于ocr這一塊的資料很少,比較靠譜的都是要收費(fèi)的,而且價(jià)格也不便宜。但是在天朝,收費(fèi)感覺心里不爽,所以就決定自己研究一番。
先上一個(gè)最終實(shí)現(xiàn)的效果(如果mac不是retain屏幕的,分辨率會(huì)有影響,需要在真機(jī)上調(diào)試)

二、需要用到的技術(shù)
搜了很多資料,發(fā)現(xiàn)要進(jìn)行身份證號(hào)碼的識(shí)別,需要用到以下幾種技術(shù):
圖像處理技術(shù)
包括灰度化處理,二值化,腐蝕,輪廊檢測(cè)等等。
1、灰度化處理:圖片灰度化處理就是將指定圖片每個(gè)像素點(diǎn)的RGB三個(gè)分量通過一定的算法計(jì)算出該像素點(diǎn)的灰度值,使圖像只含亮度而不含色彩信息。

2、二值化:二值化處理就是將經(jīng)過灰度化處理的圖片轉(zhuǎn)換為只包含黑色和白色兩種顏色的圖像,他們之間沒有其他灰度的變化。在二值圖中用255便是白色,0表示黑色。

3、腐蝕:圖片的腐蝕就是將得到的二值圖中的黑色塊進(jìn)行放大。即連接圖片中相鄰黑色像素點(diǎn)的元素。通過腐蝕可以把身份證上的身份證號(hào)碼連接在一起形成一個(gè)矩形區(qū)域。

4、輪廊檢測(cè):圖片經(jīng)過腐蝕操作后相鄰點(diǎn)會(huì)連接在一起形成一個(gè)大的區(qū)域,這個(gè)時(shí)候通過輪廊檢測(cè)就可以把每個(gè)大的區(qū)域找出來,這樣就可以定位到身份證上面號(hào)碼的區(qū)域。

5、文字識(shí)別技術(shù)
通過識(shí)別圖像,將圖像信息轉(zhuǎn)化為可以使用的計(jì)算機(jī)輸入技術(shù)。比如下面這張包含一串?dāng)?shù)字的圖片,通過ocr識(shí)別技術(shù)可以將圖片中包含的數(shù)字信息以字符串的方式輸出。

三、開源框架OpenCV和TesseractOCRiOS
OpenCV(完成圖像處理技術(shù))
OpenCV是一個(gè)開源的跨平臺(tái)計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)庫(kù),通俗點(diǎn)的說,就是他給計(jì)算機(jī)提供了一雙眼睛,一雙可以從圖片中獲取信息的眼鏡,從而完成人臉識(shí)別、身份證識(shí)別、去紅眼、追蹤移動(dòng)物體等等的圖像相關(guān)的功能。
TesseractOCRiOS(完成文字識(shí)別技術(shù))
Tesseract是目前可用的最準(zhǔn)確的開源OCR引擎,可以讀取各種格式的圖片并將他們轉(zhuǎn)換成各種語(yǔ)言文本。而TesseractOCRiOS則是針對(duì)iOS平臺(tái)封裝的Tesseract引擎庫(kù)。
四、實(shí)戰(zhàn)演示
創(chuàng)建一個(gè)iOS項(xiàng)目
用CocoPods導(dǎo)入上面兩個(gè)庫(kù)
由于OpenCV庫(kù)文件比較大,所以時(shí)間會(huì)稍微久一點(diǎn),耐心等待就是。

導(dǎo)入完成之后運(yùn)行項(xiàng)目,會(huì)發(fā)現(xiàn)報(bào)如下錯(cuò)誤

由于導(dǎo)入的庫(kù)不支持Bitcode機(jī)制,需要關(guān)掉,在工程->TARGETS->Build Setting-> Enable Bitcode設(shè)置為NO就ok。

導(dǎo)入TesseractOCRiOS需要的語(yǔ)言包
TesseractOCRiOS庫(kù)中沒有自帶的語(yǔ)言包,需要我們自己手動(dòng)導(dǎo)入,我們這里直接到tesseract-ocr網(wǎng)站,tessdata即是我們需要用到的語(yǔ)言包。下載下來的語(yǔ)言包有400多兆。這里我們只需要用到英語(yǔ)語(yǔ)言包,所以就只導(dǎo)入eng.traineddata就ok,其他的都刪掉。
導(dǎo)入語(yǔ)言包種需要注意幾點(diǎn):
- 語(yǔ)言包需要放在tessdata目錄下。TesseractOCRiOS中查找語(yǔ)言包是在tessdata目錄下進(jìn)行查找的,所以我們不能單獨(dú)把eng.traineddata導(dǎo)入項(xiàng)目中,而需要放在tessdata目錄下導(dǎo)入項(xiàng)目中。
- 將tessdata導(dǎo)入xcode項(xiàng)目,需要勾選Create folder refrences。上面已經(jīng)提到了語(yǔ)言包需要放在tessdata目錄下,所以導(dǎo)入文件到xcode的時(shí)候需要?jiǎng)?chuàng)建文件夾的形式,而不是創(chuàng)建組的形式。如下圖:

創(chuàng)建一個(gè)RecogizeCardManager用來管理身份證識(shí)別相關(guān)的代碼。
由于OpenCV和TesseractOCRiOS庫(kù)都是基于c++編寫的,所以需要把RecogizeCardManager.m后綴的.m改成.mm

RecogizeCardManager中的代碼
.h文件
#import <Foundation/Foundation.h> @class UIImage; typedef void (^CompleateBlock)(NSString *text); @interface RecogizeCardManager : NSObject /** * 初始化一個(gè)單例 * * @return 返回一個(gè)RecogizeCardManager的實(shí)例對(duì)象 */ + (instancetype)recognizeCardManager; /** * 根據(jù)身份證照片得到身份證號(hào)碼 * * @param cardImage 傳入的身份證照片 * @param compleate 識(shí)別完成后的回調(diào) */ - (void)recognizeCardWithImage:(UIImage *)cardImage compleate:(CompleateBlock)compleate; @end
.m文件
#import "RecogizeCardManager.h"
#import <opencv2/opencv.hpp>
#import <opencv2/imgproc/types_c.h>
#import <opencv2/imgcodecs/ios.h>
#import <TesseractOCR/TesseractOCR.h>
@implementation RecogizeCardManager
+ (instancetype)recognizeCardManager {
static RecogizeCardManager *recognizeCardManager = nil;
static dispatch_once_t onceToken;
dispatch_once(&onceToken, ^{
recognizeCardManager = [[RecogizeCardManager alloc] init];
});
return recognizeCardManager;
}
- (void)recognizeCardWithImage:(UIImage *)cardImage compleate:(CompleateBlock)compleate {
//掃描身份證圖片,并進(jìn)行預(yù)處理,定位號(hào)碼區(qū)域圖片并返回
UIImage *numberImage = [self opencvScanCard:cardImage];
if (numberImage == nil) {
compleate(nil);
}
//利用TesseractOCR識(shí)別文字
[self tesseractRecognizeImage:numberImage compleate:^(NSString *numbaerText) {
compleate(numbaerText);
}];
}
//掃描身份證圖片,并進(jìn)行預(yù)處理,定位號(hào)碼區(qū)域圖片并返回
- (UIImage *)opencvScanCard:(UIImage *)image {
//將UIImage轉(zhuǎn)換成Mat
cv::Mat resultImage;
UIImageToMat(image, resultImage);
//轉(zhuǎn)為灰度圖
cvtColor(resultImage, resultImage, cv::COLOR_BGR2GRAY);
//利用閾值二值化
cv::threshold(resultImage, resultImage, 100, 255, CV_THRESH_BINARY);
//腐蝕,填充(腐蝕是讓黑色點(diǎn)變大)
cv::Mat erodeElement = getStructuringElement(cv::MORPH_RECT, cv::Size(26,26));
cv::erode(resultImage, resultImage, erodeElement);
//輪廊檢測(cè)
std::vector<std::vector<cv::Point>> contours;//定義一個(gè)容器來存儲(chǔ)所有檢測(cè)到的輪廊
cv::findContours(resultImage, contours, CV_RETR_TREE, CV_CHAIN_APPROX_SIMPLE, cvPoint(0, 0));
//取出身份證號(hào)碼區(qū)域
std::vector<cv::Rect> rects;
cv::Rect numberRect = cv::Rect(0,0,0,0);
std::vector<std::vector<cv::Point>>::const_iterator itContours = contours.begin();
for ( ; itContours != contours.end(); ++itContours) {
cv::Rect rect = cv::boundingRect(*itContours);
rects.push_back(rect);
//算法原理
if (rect.width > numberRect.width && rect.width > rect.height * 5) {
numberRect = rect;
}
}
//身份證號(hào)碼定位失敗
if (numberRect.width == 0 || numberRect.height == 0) {
return nil;
}
//定位成功成功,去原圖截取身份證號(hào)碼區(qū)域,并轉(zhuǎn)換成灰度圖、進(jìn)行二值化處理
cv::Mat matImage;
UIImageToMat(image, matImage);
resultImage = matImage(numberRect);
cvtColor(resultImage, resultImage, cv::COLOR_BGR2GRAY);
cv::threshold(resultImage, resultImage, 80, 255, CV_THRESH_BINARY);
//將Mat轉(zhuǎn)換成UIImage
UIImage *numberImage = MatToUIImage(resultImage);
return numberImage;
}
//利用TesseractOCR識(shí)別文字
- (void)tesseractRecognizeImage:(UIImage *)image compleate:(CompleateBlock)compleate {
dispatch_async(dispatch_get_global_queue(DISPATCH_QUEUE_PRIORITY_BACKGROUND, 0), ^{
G8Tesseract *tesseract = [[G8Tesseract alloc] initWithLanguage:@"eng"];
tesseract.image = [image g8_blackAndWhite];
tesseract.image = image;
// Start the recognition
[tesseract recognize];
//執(zhí)行回調(diào)
compleate(tesseract.recognizedText);
});
}
RecognizeCardViewController代碼
故事版布局界面

.m文件
#import "RecognizeCardViewController.h"
#import "RecogizeCardManager.h"
@interface RecognizeCardViewController ()<UINavigationControllerDelegate, UIImagePickerControllerDelegate>{
UIImagePickerController *imgagePickController;
}
@property (weak, nonatomic) IBOutlet UIImageView *imgView;
@property (weak, nonatomic) IBOutlet UILabel *textLabel;
- (IBAction)cameraAction:(id)sender;
- (IBAction)photoAction:(id)sender;
@end
@implementation RecognizeCardViewController
- (void)viewDidLoad {
[super viewDidLoad];
self.imgView.contentMode = UIViewContentModeScaleAspectFit;
imgagePickController = [[UIImagePickerController alloc] init];
imgagePickController.delegate = self;
imgagePickController.modalTransitionStyle = UIModalTransitionStyleFlipHorizontal;
imgagePickController.allowsEditing = YES;
}
- (void)didReceiveMemoryWarning {
[super didReceiveMemoryWarning];
// Dispose of any resources that can be recreated.
}
//拍照
- (IBAction)cameraAction:(id)sender {
//判斷是否可以打開照相機(jī)
if ([UIImagePickerController isSourceTypeAvailable:UIImagePickerControllerSourceTypeCamera]) {
imgagePickController.sourceType = UIImagePickerControllerSourceTypeCamera;
//設(shè)置攝像頭模式(拍照,錄制視頻)為拍照
imgagePickController.cameraCaptureMode = UIImagePickerControllerCameraCaptureModePhoto;
[self presentViewController:imgagePickController animated:YES completion:nil];
} else {
UIAlertView *alert = [[UIAlertView alloc] initWithTitle:@"提示" message:@"設(shè)備不能打開相機(jī)" delegate:self cancelButtonTitle:@"知道了" otherButtonTitles: nil];
[alert show];
}
}
//相冊(cè)
- (IBAction)photoAction:(id)sender {
imgagePickController.sourceType = UIImagePickerControllerSourceTypePhotoLibrary;
[self presentViewController:imgagePickController animated:YES completion:nil];
}
#pragma mark - UIImagePickerControllerDelegate
//適用獲取所有媒體資源,只需判斷資源類型
- (void)imagePickerController:(UIImagePickerController *)picker didFinishPickingMediaWithInfo:(NSDictionary<NSString *,id> *)info{
NSString *mediaType=[info objectForKey:UIImagePickerControllerMediaType];
UIImage *srcImage = nil;
//判斷資源類型
if ([mediaType isEqualToString:@"public.image"]){
srcImage = info[UIImagePickerControllerEditedImage];
self.imgView.image = srcImage;
//識(shí)別身份證
self.textLabel.text = @"圖片插入成功,正在識(shí)別中...";
[[RecogizeCardManager recognizeCardManager] recognizeCardWithImage:srcImage compleate:^(NSString *text) {
if (text != nil) {
self.textLabel.text = [NSString stringWithFormat:@"識(shí)別結(jié)果:%@",text];
}else {
self.textLabel.text = @"請(qǐng)選擇照片";
UIAlertView *alert = [[UIAlertView alloc] initWithTitle:@"提示" message:@"照片識(shí)別失敗,請(qǐng)選擇清晰、沒有復(fù)雜背景的身份證照片重試!" delegate:self cancelButtonTitle:@"知道了" otherButtonTitles: nil];
[alert show];
}
}];
}
[self dismissViewControllerAnimated:YES completion:nil];
}
//進(jìn)入拍攝頁(yè)面點(diǎn)擊取消按鈕
- (void)imagePickerControllerDidCancel:(UIImagePickerController *)picker {
[self dismissViewControllerAnimated:YES completion:nil];
}
@end
總結(jié)
通過上面的實(shí)驗(yàn),該程序?qū)ι矸葑C識(shí)別的正確率幾乎可以達(dá)到90%,剩下的10%主要取決于圖像的預(yù)處理,預(yù)處理程序是整個(gè)識(shí)別系統(tǒng)的關(guān)鍵所在。該系統(tǒng)的原理同樣也適用于獲取身份證上其他的信息,也可以應(yīng)用于銀行卡、車牌號(hào)等的識(shí)別。
識(shí)別的正確率
主要取決于腐蝕、取出身份證號(hào)碼區(qū)域(輪廊提取)的算法這幾個(gè)關(guān)鍵點(diǎn)。
1、腐蝕: 腐蝕的參數(shù)很重要。
2、取出身份證號(hào)碼區(qū)域的算法(輪廊提取): 所有的處理都是為了在圖片中定位到身份證號(hào)碼的區(qū)域,輪廊提取就是這樣一個(gè)操作。篩選輪廊圖的算法很重要但是也是個(gè)難點(diǎn)。要提取身份證號(hào)碼區(qū)域的輪廊,算法的原理就是該輪廊的寬度是所有中最寬的,且寬度的長(zhǎng)度必須大于高度的5倍。
不過這個(gè)算法還是存在不少問題。有的時(shí)候可能圖片背景比較復(fù)雜會(huì)影響到輪廊的檢測(cè),基于這個(gè)問題:
- 一方面可以通過對(duì)圖片的預(yù)處理來進(jìn)行優(yōu)化,減少對(duì)檢測(cè)身份證號(hào)碼區(qū)域的干擾
- 第二個(gè)方面就是優(yōu)化算法。
識(shí)別速度
使用TesseractOCRiOS對(duì)比較清晰的文字進(jìn)行識(shí)別速度是比較快的,我試過用一張未經(jīng)處理的寫著數(shù)字的圖片來處理,識(shí)別速度小于5s。但經(jīng)過二值圖處理之后識(shí)別的速度就降低了,我認(rèn)為可以對(duì)二值化處理后的圖片進(jìn)一步處理,比如對(duì)二值圖進(jìn)行細(xì)化描出骨架,然后在對(duì)骨架做均勻的膨脹處理,這樣得到的身份證號(hào)碼可能會(huì)清晰很多。
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
iOS獲取短信驗(yàn)證碼倒計(jì)時(shí)的兩種實(shí)現(xiàn)方法
本篇文章主要介紹了iOS獲取短信驗(yàn)證碼倒計(jì)時(shí)的兩種實(shí)現(xiàn)方法,小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2017-05-05
iOS高仿微信相冊(cè)界面翻轉(zhuǎn)過渡動(dòng)畫效果
在圖片界面點(diǎn)擊右下角的查看評(píng)論會(huì)翻轉(zhuǎn)到評(píng)論界面,評(píng)論界面點(diǎn)擊左上角的返回按鈕會(huì)反方向翻轉(zhuǎn)回圖片界面,真正的實(shí)現(xiàn)方法,與傳統(tǒng)的導(dǎo)航欄過渡其實(shí)只有一行代碼的區(qū)別,下面小編通過本文給大家介紹下ios高仿微信相冊(cè)界面翻轉(zhuǎn)過渡動(dòng)畫效果,一起看看吧2016-11-11
ajax 三種實(shí)現(xiàn)方法實(shí)例代碼
這篇文章主要介紹了ajax 三種實(shí)現(xiàn)方法實(shí)例代碼的相關(guān)資料,需要的朋友可以參考下2016-09-09
IOSdrawRect實(shí)現(xiàn)雪花飄落效果
這篇文章主要為大家詳細(xì)介紹了IOSdrawRect實(shí)現(xiàn)雪花飄落效果,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2018-06-06

