67|0

16

帖子

0

资源

一粒金砂(中级)

语音识别芯片是人机交互的核心! [复制链接]

物联网时代,语音识别被视作为人机交互的入口,人工智能和机器学习的迅猛发展,使语音控制变得更为实用。虽然语音识别与生物识别相比,发展相对缓慢,但是学术界和工业界对于语音市场都很看好,这意味着未来发展空间十分巨大。而人工智能芯片的应用领域也不断向多维度发展。

语音识别芯片最大的特点就是能够语音识别,它能让机器听懂人类的语音,并且可以根据命令执行各种动作,如眨眼睛、动嘴巴(智能娃娃)。除此之外,语音识别芯片还具有高品质、高压缩率录音放音功能,可实现人机对话。

按照使用者的限制而言,语音识别芯片可以分为特定人语音识别芯片和非特定人语音识别芯片。

特定人语音识别

特定人语音识别芯片是针对指定人的语音识别,其他人的话不识别,须先把使用者的语音参考样本存入当成比对的资料库,即特定人语音识别在使用前必须要进行语音训练,一般按照机器提示训练2遍语音词条即可使用。

非特定人语音识别

非特定人语音识别芯片是不用针对指定的人的识别技术,不分年龄、性别,只要说相同语言就可以,应用模式是在产品定型前按照确定的十几个语音交互词条,采集200人左右的声音样本,经过PC算法处理得到交互词条的语音模型和特征数据库,然后烧录到芯片上。应用这种芯片的机器(智能娃娃、电子宠物、儿童电脑)就具有交互功能了。

一般我们选择的AI智能产品都是非特定语音识别芯片,只需要说出智能产品的唤醒词就可以实现人机对话。

当然语音识别的内容条数也是有限制的,一般市面上的语音识别芯片只能识别20条左右,不能满足一些产品语音交互的需求,而九芯电子的NRK220X语音识别芯片可以识别三百条;可以满足语音识别内容指令多的智能产品的需求。

NRK220X语音识别模块为广州九芯电子自主研发的一款模块,无须外围元件,直接对接外部,集成了一颗高性能、低成本的离线语音识别芯片,具有语音识别及播报功能,需要外挂 SPI-Flash,存储词条或者语音播内容。

他具有识别率高,工业级性能、简单易用,更新词条方便等优势。广泛应用在智能家居、AI人工智能、玩具等多种领域。

而且语音存放的长度由音频采样率及芯片内部(或外挂)ROM空间所决定,音频采样率的大小直接影响音频输出的音质,同一型号芯片的音频采样率越高,音质越好,但是需要占用更多的ROM空间。芯片的成本也因存储空间的增大而有不同幅度的上涨。

此帖出自信息发布论坛

回复
您需要登录后才可以回帖 登录 | 注册

最新文章 更多>>
    关闭
    站长推荐上一条 1/9 下一条

    About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

    站点相关: 安防电子 汽车电子 手机便携 工业控制 家用电子 医疗电子 测试测量 网络通信 物联网

    北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

    电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2021 EEWORLD.com.cn, Inc. All rights reserved
    快速回复 返回顶部 返回列表