快捷導(dǎo)航

PHP使用OCR技術(shù)實(shí)現(xiàn)識(shí)別圖片中的文字

更新時(shí)間：2024年11月27日 11:05:48 作者：Student_Li

OCR是一種通過圖像處理技術(shù)從圖片或掃描件中提取文字的技術(shù),它可以將非結(jié)構(gòu)化的圖片內(nèi)容轉(zhuǎn)化為可編輯的文本,下面我們就來(lái)看看PHP如何OCR識(shí)別圖片中的文字

在日常開發(fā)中，我們常常會(huì)遇到需要從圖片中提取文字的需求，例如處理掃描件中的文字、驗(yàn)證碼識(shí)別或者實(shí)現(xiàn)文檔數(shù)字化管理。OCR（Optical Character Recognition，光學(xué)字符識(shí)別）技術(shù)可以幫助我們快速完成這項(xiàng)任務(wù)。今天就來(lái)聊聊，如何在 PHP 中實(shí)現(xiàn) OCR 技術(shù)，從圖片中提取文字。

一、什么是OCR技術(shù)

OCR 是一種通過圖像處理技術(shù)從圖片或掃描件中提取文字的技術(shù)，它可以將非結(jié)構(gòu)化的圖片內(nèi)容轉(zhuǎn)化為可編輯的文本。這種技術(shù)廣泛應(yīng)用于以下場(chǎng)景：

證件掃描識(shí)別（如身份證、駕照等）
文檔數(shù)字化存儲(chǔ)
圖片驗(yàn)證碼識(shí)別
發(fā)票、票據(jù)處理

二、PHP如何實(shí)現(xiàn)OCR

盡管 PHP 本身并不提供原生的 OCR 支持，但可以通過以下幾種方式輕松實(shí)現(xiàn) OCR：

使用開源 OCR 引擎，如 Tesseract-OCR。
調(diào)用第三方 OCR 服務(wù)（如百度智能云、阿里云、騰訊云等）。

下面我們通過 Tesseract-OCR 和百度 OCR API 兩種方式，手把手教你實(shí)現(xiàn)圖片文字識(shí)別功能。

三、方法一：使用 Tesseract-OCR

1. 什么是 Tesseract-OCR

Tesseract 是 Google 提供的一個(gè)開源 OCR 引擎，它支持多種語(yǔ)言的文字識(shí)別，包括中文，且可以通過簡(jiǎn)單的命令行或程序語(yǔ)言調(diào)用。

2. 環(huán)境準(zhǔn)備

安裝 Tesseract

根據(jù)你的系統(tǒng)類型安裝 Tesseract：

Ubuntu/Linux

sudo apt update
sudo apt install tesseract-ocr
sudo apt install tesseract-ocr-chi-sim # 安裝中文語(yǔ)言包

MacOS

brew install tesseract
brew install tesseract-lang

Windows 前往 Tesseract 官方下載頁(yè)面下載并安裝。

3. PHP與Tesseract集成

安裝 PHP 擴(kuò)展

通過 Composer 安裝適配 Tesseract 的 PHP 庫(kù)，例如 thiagoalessio/tesseract_ocr：

composer require thiagoalessio/tesseract_ocr

示例代碼

以下是一個(gè)簡(jiǎn)單的圖片文字識(shí)別示例：

<?php
require 'vendor/autoload.php';

use thiagoalessio\TesseractOCR\TesseractOCR;

// 選擇圖片
$imagePath = 'test-image.png';

// 初始化 Tesseract
$ocr = new TesseractOCR($imagePath);

// 設(shè)置語(yǔ)言（中文）
$ocr->lang('chi_sim'); // 簡(jiǎn)體中文
$result = $ocr->run();

echo "識(shí)別結(jié)果：\n";
echo $result;

運(yùn)行后，如果 test-image.png 中包含文字，Tesseract 將會(huì)提取并輸出文本內(nèi)容。

四、方法二：調(diào)用百度OCR API

如果你希望更快速、更精準(zhǔn)的識(shí)別效果，使用云服務(wù)是個(gè)不錯(cuò)的選擇。這里以 百度智能云 OCR 為例。

1. 注冊(cè)百度智能云

訪問百度智能云 OCR 服務(wù)。
注冊(cè)賬號(hào)并創(chuàng)建應(yīng)用，獲取 API Key 和 Secret Key。

2. 安裝 HTTP 請(qǐng)求庫(kù)

推薦使用 Guzzle 發(fā)送 HTTP 請(qǐng)求。安裝方式如下：

composer require guzzlehttp/guzzle

3. 獲取 Access Token

百度 API 的訪問需要使用 Access Token。以下是獲取 Token 的代碼：

<?php
require 'vendor/autoload.php';

use GuzzleHttp\Client;

function getAccessToken($apiKey, $secretKey) {
    $client = new Client();
    $response = $client->post('https://aip.baidubce.com/oauth/2.0/token', [
        'form_params' => [
            'grant_type' => 'client_credentials',
            'client_id' => $apiKey,
            'client_secret' => $secretKey,
        ]
    ]);

    $data = json_decode($response->getBody(), true);
    return $data['access_token'] ?? null;
}

$apiKey = '你的API Key';
$secretKey = '你的Secret Key';

$token = getAccessToken($apiKey, $secretKey);
echo "Access Token: $token\n";

4. 調(diào)用百度 OCR 接口

使用獲得的 Token 調(diào)用 OCR 接口，完成圖片文字識(shí)別：

<?php
require 'vendor/autoload.php';

use GuzzleHttp\Client;

function recognizeText($imagePath, $accessToken) {
    $client = new Client();

    // 讀取圖片并進(jìn)行 Base64 編碼
    $imageData = base64_encode(file_get_contents($imagePath));

    $response = $client->post('https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic', [
        'headers' => [
            'Content-Type' => 'application/x-www-form-urlencoded',
        ],
        'query' => [
            'access_token' => $accessToken,
        ],
        'form_params' => [
            'image' => $imageData,
        ],
    ]);

    $data = json_decode($response->getBody(), true);
    return $data['words_result'] ?? [];
}

$imagePath = 'test-image.png';
$accessToken = '你的Access Token';

$result = recognizeText($imagePath, $accessToken);

echo "識(shí)別結(jié)果：\n";
foreach ($result as $item) {
    echo $item['words'] . "\n";
}

五、比較兩種方案

特點(diǎn)	Tesseract-OCR	百度智能云 OCR
適用場(chǎng)景	本地離線識(shí)別	在線云服務(wù)，支持大規(guī)模處理
語(yǔ)言支持	多語(yǔ)言（需安裝對(duì)應(yīng)語(yǔ)言包）	多語(yǔ)言自動(dòng)識(shí)別
識(shí)別精度	精度一般，取決于圖片質(zhì)量	精度高，適合復(fù)雜場(chǎng)景
復(fù)雜度	安裝配置簡(jiǎn)單	需聯(lián)網(wǎng)，稍復(fù)雜
費(fèi)用	免費(fèi)	部分功能收費(fèi)

六、總結(jié)

通過以上兩種方案，PHP 開發(fā)者可以輕松實(shí)現(xiàn) OCR 技術(shù)在項(xiàng)目中的應(yīng)用：

對(duì)于小型、本地化需求，Tesseract 是一個(gè)不錯(cuò)的選擇。
對(duì)于需要高精度、多功能的場(chǎng)景，云服務(wù)（如百度智能云 OCR）更為合適。

到此這篇關(guān)于PHP使用OCR技術(shù)實(shí)現(xiàn)識(shí)別圖片中的文字的文章就介紹到這了,更多相關(guān)PHP OCR識(shí)別圖片文字內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: