13237|3

291

帖子

5

TA的资源

纯净的硅(中级)

楼主
 

【树莓派3B+测评】OCR字符识别 [复制链接]

本帖最后由 DDZZ669 于 2018-9-28 21:34 编辑

上个帖子【树莓派3B+测评】树莓派扫描条形码介绍了条形码识别,这次进行OCR(Optical Character Recognition)光学字符识别。
首先需要安装tesseract-ocr软件包:
  1. sudo apt-get install  libleptonica-dev
  2. sudo apt-get install  tesseract-ocr
  3. sudo apt-get install  tesseract-ocr-dev
  4. sudo pip install pytesseract
复制代码


然后就可以用python程序测试了,测试代码也很简单:

  1. from PIL import Image
  2. from pytesseract import *
  3. import cv2
  4. import numpy as np

  5. img0 = cv2.imread('ocr1.jpg')
  6. img1 = Image.fromarray(img0)
  7. mychars = image_to_string(img1).strip()

  8. print(mychars)
  9. cv2.imshow('img',img0)
  10. cv2.waitKey(0)
复制代码


需要用到一张测试图片ocr1.jpg,我是在windows上用画图工具写了一个树莓派的英文字符。
可以通过ssh的scp命令将windows电脑中文件传送到树莓派中,方法是在windows的cmd命令行中输入类似下面的代码:
即,将windows桌面上的图片复制到树莓派桌面的test文件夹中。


运行python程序:

可以看到正确识别。

如果想要识别汉字,需要再安装中文语言包
链接已隐藏,如需查看请登录或者注册
并将其放在树莓派的/usr/share/tessert-ocr/tessdata中。
可以先下载到windows电脑中,然后通过下面命令传送到树莓派对应的文件夹中:


并修改python程序中的
  1. mychars = image_to_string(img1,'chi_sim').strip()
复制代码

最后再更换一个有汉字的图片,效果如下:


此帖出自单片机论坛

最新回复

楼主可以做的更细一点啊,从文字检测,字符分割,字符识别,语言模型纠错来做  详情 回复 发表于 2018-9-29 16:51
点赞 关注(2)
 

回复
举报

360

帖子

0

TA的资源

纯净的硅(初级)

沙发
 
謝謝分亨,Python真強大。
此帖出自单片机论坛
 
 

回复

693

帖子

7

TA的资源

版主

板凳
 
目前正在入门Python,楼主真厉害,玩的那么6
此帖出自单片机论坛
 
 
 

回复

954

帖子

0

TA的资源

纯净的硅(初级)

4
 
楼主可以做的更细一点啊,从文字检测,字符分割,字符识别,语言模型纠错来做
此帖出自单片机论坛
 
 
 

回复
您需要登录后才可以回帖 登录 | 注册

随便看看
查找数据手册?

EEWorld Datasheet 技术支持

相关文章 更多>>
关闭
站长推荐上一条 1/9 下一条

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 国产芯 安防电子 汽车电子 手机便携 工业控制 家用电子 医疗电子 测试测量 网络通信 物联网

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2025 EEWORLD.com.cn, Inc. All rights reserved
快速回复 返回顶部 返回列表