【K230嵌入式AI开发板测评】 +字符识别与图书录入处理篇
<p>这里所说的“字符识别”是指光学字符识别,即OCR (Optical Character Recognition)。</p><p>通常是由电子设备(如扫描仪或数码相机)来检查纸面上所打印的字符,经检测明、暗程度来确定其形状,然后以字符识别方法将形状转译成计算机文字的过程。</p>
<p>K230开发板的字符识别流程为:</p>
<p> </p>
<p> </p>
<p>CanMV K230支持对图片中中文和英文字符的识别,且已将所用的模型存放在CanMV K230文件系统,故无需额外提供。</p>
<p>识别显示屏内容的场景如图1所示,可见到识别效率很高。</p>
<p> </p>
<p> </p>
<p>图1 识别图像中文字</p>
<p> </p>
<p>识别印刷品或书籍的内容其场景如图2所示,受摄像头拍摄质量的影响,其识别效率会有稍许的减弱。</p>
<p> </p>
<p>图2 识别图书上文字</p>
<p> </p>
<p>那该如何获取识别结果呢?</p>
<p> </p>
<p>这可从输出的识别结果中来寻找,图2的输出结果为:</p>
<p>, dtype=float32), array(,</p>
<p>dtype=float32), array(, dtype=float32)] ['\u7b2c2\u7248', '\u5feb\u901f\u7f16\u7a0b\u5165\u95e8', 'Python']</p>
<p>1.399683</p>
<p> </p>
<p>因此可知,:我们需要的识别结果为:</p>
<p> ['\u7b2c2\u7248', '\u5feb\u901f\u7f16\u7a0b\u5165\u95e8', 'Python']</p>
<p>其中:</p>
<p> 'Python'---第一行识别结果</p>
<p> '\u5feb\u901f\u7f16\u7a0b\u5165\u95e8'---第二行识别结果</p>
<p>'\u7b2c2\u7248'---第三行识别结果</p>
<p>具体的内容如图3所示,那其中的汉字是采用哪一种编码方式呢?</p>
<p> </p>
<p>图3 识别结果</p>
<p> </p>
<p>经测试其编码方式并非区位码方式,见图4所示。</p>
<p> </p>
<p>图4 区位码转换</p>
<p> </p>
<p>在反复测试,其编码方式为Unicode码,见图5所示。</p>
<p> </p>
<p>图5 Unicode码转换</p>
<p> </p>
<p>那该如何提取识别结果呢?</p>
<p>以得到的图书名称为例,通过图6所示的程序即可其内容。</p>
<p> </p>
<p>图6 Unicode码转换</p>
<p> </p>
<p>这样在进行图书录入管理时,即可先通过识别来得到书籍名称,并限制识别结果的反复出现。然后再结合前面所介绍的“RTC计时与文件读写应用篇”来提供相应的时间值,并将信息存储到文件中即可。</p>
<p> </p>
<p>若是进行图书的借阅管理,则再识别图书名称后,需在管理文件中查询该图书是否存在,若不存在,则添加一条借阅信息;否则,只修改图书的存放状态即可。当然,这只是一个简单的管理思路,在实际的管理中还需增添借阅人信息,以及解决图书有多个副本的问题等。</p>
<p> </p>
<p> </p>
<p>与相机的分辨率也是有关联的</p>
Jacktang 发表于 2024-10-28 07:45
与相机的分辨率也是有关联的
<p>没错,高分辨率的摄像机会提高识别的效率。</p>
jinglixixi 发表于 2024-10-28 13:12
没错,高分辨率的摄像机会提高识别的效率。
<p>分辨率高了运算时间也会有相应增加。</p>
<p>“受摄像头拍摄质量的影响”</p>
<p>这个有比较定性的测试吗?</p>
freebsder 发表于 2024-10-28 14:58
分辨率高了运算时间也会有相应增加。
<p>时间会增加,但会直接提升识别的准确率。</p>
freebsder 发表于 2024-10-28 15:23
“受摄像头拍摄质量的影响”
这个有比较定性的测试吗?
<p>当然,有一些图像直接拍摄会无效,但在手机拍摄图片以电脑来浏览,再供摄像头识别会提供识别率,就间接说明了摄像头拍摄质量对识别效果的影响。</p>
jinglixixi 发表于 2024-10-28 17:27
时间会增加,但会直接提升识别的准确率。
<p>不太一定,通过前处理处理的图像,应该会增加识别率(比如凸显某些特征),但是会大幅度减小尺寸带来的运算量。</p>
freebsder 发表于 2024-10-29 14:08
不太一定,通过前处理处理的图像,应该会增加识别率(比如凸显某些特征),但是会大幅度减小尺寸带来的运 ...
<p>那就是另外的问题了</p>
页:
[1]