社区导航

 
查看: 750|回复: 3

[分享] 【树莓派3B+测评】OCR字符识别

[复制链接]

66

TA的帖子

0

TA的资源

一粒金砂(中级)

Rank: 2

发表于 2018-9-28 21:29:32 | 显示全部楼层 |阅读模式
本帖最后由 DDZZ669 于 2018-9-28 21:34 编辑

上个帖子【树莓派3B+测评】树莓派扫描条形码介绍了条形码识别,这次进行OCR(Optical Character Recognition)光学字符识别。
首先需要安装tesseract-ocr软件包:
  1. sudo apt-get install  libleptonica-dev
  2. sudo apt-get install  tesseract-ocr
  3. sudo apt-get install  tesseract-ocr-dev
  4. sudo pip install pytesseract
复制代码


然后就可以用python程序测试了,测试代码也很简单:

  1. from PIL import Image
  2. from pytesseract import *
  3. import cv2
  4. import numpy as np

  5. img0 = cv2.imread('ocr1.jpg')
  6. img1 = Image.fromarray(img0)
  7. mychars = image_to_string(img1).strip()

  8. print(mychars)
  9. cv2.imshow('img',img0)
  10. cv2.waitKey(0)
复制代码


需要用到一张测试图片ocr1.jpg,我是在windows上用画图工具写了一个树莓派的英文字符。
可以通过ssh的scp命令将windows电脑中文件传送到树莓派中,方法是在windows的cmd命令行中输入类似下面的代码:
即,将windows桌面上的图片复制到树莓派桌面的test文件夹中。
1.png

运行python程序:
2.png
可以看到正确识别。

如果想要识别汉字,需要再安装中文语言包chi_sim.traineddata并将其放在树莓派的/usr/share/tessert-ocr/tessdata中。
可以先下载到windows电脑中,然后通过下面命令传送到树莓派对应的文件夹中:
4.jpg

并修改python程序中的
  1. mychars = image_to_string(img1,'chi_sim').strip()
复制代码

最后再更换一个有汉字的图片,效果如下:
3.png

此帖出自单片机论坛


回复

使用道具 举报

369

TA的帖子

0

TA的资源

纯净的硅(初级)

Rank: 4

发表于 2018-9-29 08:55:39 | 显示全部楼层
謝謝分亨,Python真強大。


回复

使用道具 举报

212

TA的帖子

4

TA的资源

版主

Rank: 6Rank: 6

发表于 2018-9-29 09:12:29 | 显示全部楼层
目前正在入门Python,楼主真厉害,玩的那么6


回复

使用道具 举报

998

TA的帖子

0

TA的资源

一粒金砂(高级)

Rank: 3Rank: 3

发表于 2018-9-29 16:51:01 | 显示全部楼层
楼主可以做的更细一点啊,从文字检测,字符分割,字符识别,语言模型纠错来做


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

  • 论坛活动 E手掌握

    扫码关注
    EEWORLD 官方微信

  • EE福利  唾手可得

    扫码关注
    EE福利 唾手可得

小黑屋|手机版|Archiver|电子工程世界 ( 京ICP证 060456 )

GMT+8, 2018-10-18 17:14 , Processed in 0.132178 second(s), 16 queries , Gzip On, MemCache On.

快速回复 返回顶部 返回列表