Tesseract-OCR安装教程-​用PHP实现图片识别文字

 3234

前几天有朋友想做一个网站,要用到图片识别,本来想直接调用API,说是每天要调用次数太多,最好自行搭建接口,然后搜索了一下,为防止以后忘掉,特意写个教程,作为备用!


Tesseract-OCR安装教程-​用PHP实现图片识别文字


1、准备工作

我用的是CentOS 7,宝塔面板,要用到composer(确认版本在2.0以上)。

2、安装Tesseract-OCR

step1:  yum search tesseract

step2:  yum install tesseract.x86_64

step3:yum install tesseract-devel.x86_64 tesseract-osd.x86_64

step4:yum install tesseract-langpack-chi_sim.noarch

3、Tesseract-OCR的使用

检查tesseract支持的语言:tesseract --list-langs

进行基于中文的OCR: tesseract chin-ocr.png chin-out -l chi_sim(tesseract 图片名称 输出文本名称 -l 语言)

4、安装PHP辅助包

composer require thiagoalessio/tesseract_ocr

5、实现远程图片识别

function get_img_text($img){
    require_once __DIR__ . '/vendor/autoload.php';
    $imageUrl = $img;
    $imageTempName = tempnam(sys_get_temp_dir(), 'image-from-kartaterazu');
    file_put_contents($imageTempName, file_get_contents($imageUrl));
    $text = (new TesseractOCR($imageTempName))->lang('chi_sim')->run();
    return $text; 
}


本文网址:https://www.zztuku.com/index.php/detail-12790.html
站长图库 - Tesseract-OCR安装教程-​用PHP实现图片识别文字
申明:如有侵犯,请 联系我们 删除。

评论(0)条

您还没有登录,请 登录 后发表评论!

提示:请勿发布广告垃圾评论,否则封号处理!!

    编辑推荐

    Node.js excel转json