jinglixixi 发表于 2024-10-27 17:41

【K230嵌入式AI开发板测评】 +字符识别与图书录入处理篇

<p>这里所说的&ldquo;字符识别&rdquo;是指光学字符识别,即OCR (Optical Character Recognition)。</p>

<p>通常是由电子设备(如扫描仪或数码相机)来检查纸面上所打印的字符,经检测明、暗程度来确定其形状,然后以字符识别方法将形状转译成计算机文字的过程。</p>

<p>K230开发板的字符识别流程为:</p>

<p> &nbsp;</p>

<p>&nbsp;</p>

<p>CanMV K230支持对图片中中文和英文字符的识别,且已将所用的模型存放在CanMV K230文件系统,故无需额外提供。</p>

<p>识别显示屏内容的场景如图1所示,可见到识别效率很高。</p>

<p>&nbsp;</p>

<p> &nbsp;</p>

<p>图1 识别图像中文字</p>

<p>&nbsp;</p>

<p>识别印刷品或书籍的内容其场景如图2所示,受摄像头拍摄质量的影响,其识别效率会有稍许的减弱。</p>

<p> &nbsp;</p>

<p>图2 识别图书上文字</p>

<p>&nbsp;</p>

<p>那该如何获取识别结果呢?</p>

<p>&nbsp;</p>

<p>这可从输出的识别结果中来寻找,图2的输出结果为:</p>

<p>, dtype=float32), array(,</p>

<p>dtype=float32), array(, dtype=float32)] [&#39;\u7b2c2\u7248&#39;, &#39;\u5feb\u901f\u7f16\u7a0b\u5165\u95e8&#39;, &#39;Python&#39;]</p>

<p>1.399683</p>

<p>&nbsp;</p>

<p>因此可知,:我们需要的识别结果为:</p>

<p>&nbsp;[&#39;\u7b2c2\u7248&#39;, &#39;\u5feb\u901f\u7f16\u7a0b\u5165\u95e8&#39;, &#39;Python&#39;]</p>

<p>其中:</p>

<p>&nbsp;&#39;Python&#39;---第一行识别结果</p>

<p>&nbsp;&#39;\u5feb\u901f\u7f16\u7a0b\u5165\u95e8&#39;---第二行识别结果</p>

<p>&#39;\u7b2c2\u7248&#39;---第三行识别结果</p>

<p>具体的内容如图3所示,那其中的汉字是采用哪一种编码方式呢?</p>

<p> &nbsp;</p>

<p>图3 识别结果</p>

<p>&nbsp;</p>

<p>经测试其编码方式并非区位码方式,见图4所示。</p>

<p> &nbsp;</p>

<p>图4 区位码转换</p>

<p>&nbsp;</p>

<p>在反复测试,其编码方式为Unicode码,见图5所示。</p>

<p> &nbsp;</p>

<p>图5 Unicode码转换</p>

<p>&nbsp;</p>

<p>那该如何提取识别结果呢?</p>

<p>以得到的图书名称为例,通过图6所示的程序即可其内容。</p>

<p> &nbsp;</p>

<p>图6 Unicode码转换</p>

<p>&nbsp;</p>

<p>这样在进行图书录入管理时,即可先通过识别来得到书籍名称,并限制识别结果的反复出现。然后再结合前面所介绍的&ldquo;RTC计时与文件读写应用篇&rdquo;来提供相应的时间值,并将信息存储到文件中即可。</p>

<p>&nbsp;</p>

<p>若是进行图书的借阅管理,则再识别图书名称后,需在管理文件中查询该图书是否存在,若不存在,则添加一条借阅信息;否则,只修改图书的存放状态即可。当然,这只是一个简单的管理思路,在实际的管理中还需增添借阅人信息,以及解决图书有多个副本的问题等。</p>

<p>&nbsp;</p>

<p>&nbsp;</p>

Jacktang 发表于 2024-10-28 07:45

<p>与相机的分辨率也是有关联的</p>

jinglixixi 发表于 2024-10-28 13:12

Jacktang 发表于 2024-10-28 07:45
与相机的分辨率也是有关联的

<p>没错,高分辨率的摄像机会提高识别的效率。</p>

freebsder 发表于 2024-10-28 14:58

jinglixixi 发表于 2024-10-28 13:12
没错,高分辨率的摄像机会提高识别的效率。

<p>分辨率高了运算时间也会有相应增加。</p>

freebsder 发表于 2024-10-28 15:23

<p>&ldquo;受摄像头拍摄质量的影响&rdquo;</p>

<p>这个有比较定性的测试吗?</p>

jinglixixi 发表于 2024-10-28 17:27

freebsder 发表于 2024-10-28 14:58
分辨率高了运算时间也会有相应增加。

<p>时间会增加,但会直接提升识别的准确率。</p>

jinglixixi 发表于 2024-10-28 17:32

freebsder 发表于 2024-10-28 15:23
&ldquo;受摄像头拍摄质量的影响&rdquo;

这个有比较定性的测试吗?

<p>当然,有一些图像直接拍摄会无效,但在手机拍摄图片以电脑来浏览,再供摄像头识别会提供识别率,就间接说明了摄像头拍摄质量对识别效果的影响。</p>

freebsder 发表于 2024-10-29 14:08

jinglixixi 发表于 2024-10-28 17:27
时间会增加,但会直接提升识别的准确率。

<p>不太一定,通过前处理处理的图像,应该会增加识别率(比如凸显某些特征),但是会大幅度减小尺寸带来的运算量。</p>

jinglixixi 发表于 2024-10-29 17:03

freebsder 发表于 2024-10-29 14:08
不太一定,通过前处理处理的图像,应该会增加识别率(比如凸显某些特征),但是会大幅度减小尺寸带来的运 ...

<p>那就是另外的问题了</p>
页: [1]
查看完整版本: 【K230嵌入式AI开发板测评】 +字符识别与图书录入处理篇