给大家分享一个关于STM32 AI的小调查,参与即有机会获得开发板一块,打开EEWorld网站首页,注意右下角的弹窗直接点进去就可以参加了,也可以直接点这个参与>>
语音识别技术是指机器自动将人的语音的内容转成文字,又称 Automatic Speech Recognition,即ASR技术。
由于目前嵌入式终端上的CPU还不足够强劲,目前主流的语音识别方案是声音采集和前处理在终端上做,语音识别算法则放在服务器(即云端)上跑。虽然这种方案有泄漏隐私(把终端上的语音数据发给服务器)和没有网络不能使用等缺点,但也是不得已而为之的,相信在不久的将来等终端上的CPU足够强劲了会把语音识别的所有实现都放在终端上的。
是不是意味着终端上做不了语音识别相关的算法了?其实也不是,关键词唤醒功能(Key-word-spotting, KWS)是可以在终端上实现的。关键词唤醒是指设定一个唤醒词,如Siri的“Hi Siri”,只有用户说了唤醒词后终端上的语音识别功能才会处于工作状态,否则处于休眠状态。这样做主要是为了降功耗,增加续航时间。目前很多终端都是靠电池供电的,对功耗很敏感,是不允许让语音识别功能一直处于工作状态的。
STM32的中国合作伙伴OpenAILab已经将其算法移植到了L4, F4, F7和H7平台上,下面的视频基于STM32L496探索开发板。近场模型标准版只需要占用STM32L4 12MIPS, 200kB的Flash和26kB的RAM。
本次调查问卷对象包括但不限于跟语音识别应用相关的客户。仅需要几分钟,即可完成。您的反馈是对我们非常有价值的信息,可以帮助我们进一步改进我们的产品及服务。活动结束后,我们将随机抽出20位用户,各赠送开发板一块。