2024|19

6881

帖子

2

TA的资源

版主

楼主
 

语音唤醒的触发机制是什么? [复制链接]

 

想自己训练一个语音唤醒的模型,目前有两个问题。
问题如下:

1、怎么触发采集语音数据?比如我要开始采集语音数据,放到模型中去识别,那么我该什么时候进行采集?因为声音是一直存在的,我不能每一段时间采集一次放到模型中吧?所以我该如何触发采集语音数据?

2、采集多久语音数据?这是我设想的,唤醒词最慢的人说只需要5秒钟,那么我的超时时间就是5秒钟,当开始获取语音数据时,再起一个定时器,接收到的语音内容小于某值(也就是说话结束)我把语音数据拿到模型去识别。是这样的吗?

 

 

 

PS:AI真好玩,一起来玩呀~

最新回复

相当于一个专用的协处理器,里面会有接口让你干。   详情 回复 发表于 2023-2-10 12:06
点赞 关注

回复
举报

4789

帖子

12

TA的资源

版主

沙发
 

个人思路实时监听 判断输入是不是关键字,例如 小爱 小度 如果是 巴拉巴拉 如果不是,没反应

点评

实时监听感觉太费电了。我去看看语音唤醒有啥技术~  详情 回复 发表于 2023-1-12 17:17
 
 

回复

4789

帖子

12

TA的资源

版主

板凳
 

你搜搜siri唤醒机制 我记得网上有的~

 
 
 

回复

6881

帖子

2

TA的资源

版主

4
 
吾妻思萌 发表于 2023-1-12 17:13 个人思路实时监听 判断输入是不是关键字,例如 小爱 小度 如果是 巴拉巴拉 如果不是,没反应

实时监听感觉太费电了。我去看看语音唤醒有啥技术~

 
 
 

回复

330

帖子

0

TA的资源

一粒金砂(高级)

5
 

不是中断吗,哈哈哈

点评

那是不是还得有专门的拾音芯片?  详情 回复 发表于 2023-1-13 10:05
 
 
 

回复

2002

帖子

24

TA的资源

五彩晶圆(高级)

6
 

音量唤醒,后面关键词识别

点评

达到某种音量,然后唤醒?  详情 回复 发表于 2023-1-13 10:06
 
 
 

回复

6881

帖子

2

TA的资源

版主

7
 
zhaoyanhao 发表于 2023-1-12 17:40 不是中断吗,哈哈哈

那是不是还得有专门的拾音芯片?

点评

有可能,刚毕业做单片机按键的时候,我就觉得扫描太费电太占资源,就想找个按键输入中断,检测到中断信号后再扫描。当然了,我这个想法可能很low  详情 回复 发表于 2023-1-13 10:12
 
 
 

回复

6881

帖子

2

TA的资源

版主

8
 
shower.xu 发表于 2023-1-12 21:50 音量唤醒,后面关键词识别

达到某种音量,然后唤醒?

 
 
 

回复

330

帖子

0

TA的资源

一粒金砂(高级)

9
 
本帖最后由 zhaoyanhao 于 2023-1-13 10:15 编辑
wangerxian 发表于 2023-1-13 10:05 那是不是还得有专门的拾音芯片?

有可能,刚毕业做单片机键盘的时候,我就觉得扫描太费电太占资源,就想找个按键输入中断,检测到中断信号后再扫描。当然了,我这个想法可能很low

点评

我去看看别人的方案吧~  详情 回复 发表于 2023-1-13 10:58
 
 
 

回复

6881

帖子

2

TA的资源

版主

10
 
zhaoyanhao 发表于 2023-1-13 10:12 有可能,刚毕业做单片机键盘的时候,我就觉得扫描太费电太占资源,就想找个按键输入中断,检测到中断信 ...

我去看看别人的方案吧~

 
 
 

回复

1万

帖子

140

TA的资源

版主

11
 

语音采集是连续的,连续采集连续识别。

点评

那我该以什么为中断?比如我连续采集5秒,但是我在第4秒说话,要说两秒,那这一段只能识别到前1秒说话的内容,后1秒到下一个采集周期去了。  详情 回复 发表于 2023-1-13 15:29
 
个人签名上传了一些书籍资料,也许有你想要的:https://download.eeworld.com.cn/user/chunyang
 
 

回复

6881

帖子

2

TA的资源

版主

12
 
chunyang 发表于 2023-1-13 14:41 语音采集是连续的,连续采集连续识别。

那我该以什么为中断?比如我连续采集5秒,但是我在第4秒说话,要说两秒,那这一段只能识别到前1秒说话的内容,后1秒到下一个采集周期去了。

点评

你还是没明白啥是“连续”,既然是连续,何来的“唤醒”?窗口法在此不成立。即使是“唤醒”,也不是语音处理部分的唤醒,而是其它无关部分,语音识别及前端电路部分必须连续工作。  详情 回复 发表于 2023-1-13 17:10
 
 
 

回复

1万

帖子

140

TA的资源

版主

13
 
wangerxian 发表于 2023-1-13 15:29 那我该以什么为中断?比如我连续采集5秒,但是我在第4秒说话,要说两秒,那这一段只能识别到前1秒说话的 ...

你还是没明白啥是“连续”,既然是连续,何来的“唤醒”?窗口法在此不成立。即使是“唤醒”,也不是语音处理部分的唤醒,而是其它无关部分,语音识别及前端电路部分必须连续工作。

点评

但是数据丢入神经网络模型,只能是一段一段的。  详情 回复 发表于 2023-1-14 14:52
 
个人签名上传了一些书籍资料,也许有你想要的:https://download.eeworld.com.cn/user/chunyang
 
 

回复

4789

帖子

12

TA的资源

版主

14
 

https://m.baidu.com/sf?pd=topone_trustpaper&resource_id=55858&word=解密“嘿!Siri!”语音唤醒原理&ext={"url":"https:\/\/m.sohu.com\/a\/508182132_12009990

 
 
 

回复

6881

帖子

2

TA的资源

版主

15
 
chunyang 发表于 2023-1-13 17:10 你还是没明白啥是“连续”,既然是连续,何来的“唤醒”?窗口法在此不成立。即使是 ...

但是数据丢入神经网络模型,只能是一段一段的。

点评

段之间的间隔足够小,那就是连续的。  详情 回复 发表于 2023-1-15 21:20
 
 
 

回复

1万

帖子

140

TA的资源

版主

16
 
wangerxian 发表于 2023-1-14 14:52 但是数据丢入神经网络模型,只能是一段一段的。

段之间的间隔足够小,那就是连续的。

 
个人签名上传了一些书籍资料,也许有你想要的:https://download.eeworld.com.cn/user/chunyang
 
 

回复

1036

帖子

0

TA的资源

纯净的硅(高级)

17
 

一般唤醒前,仅断续采集唤醒词的长度,声音连续时采样次数较多,但还是断续分析“唤醒词”的存在,没有声音就断续休眠,有声音了采集就多些,知道有唤醒词然后变成较长的“正常采集”和分析。

 
个人签名چوآن شـين
 
 

回复

7504

帖子

2

TA的资源

五彩晶圆(高级)

18
 

专门的外设负责监听和识别。低功耗的。

点评

那这种外设是不是唤醒词需要定制。  详情 回复 发表于 2023-2-10 09:10
 
个人签名

默认摸鱼,再摸鱼。2022、9、28

 
 

回复

6881

帖子

2

TA的资源

版主

19
 
freebsder 发表于 2023-2-9 15:26 专门的外设负责监听和识别。低功耗的。

那这种外设是不是唤醒词需要定制。

点评

相当于一个专用的协处理器,里面会有接口让你干。  详情 回复 发表于 2023-2-10 12:06
 
 
 

回复

7504

帖子

2

TA的资源

五彩晶圆(高级)

20
 
wangerxian 发表于 2023-2-10 09:10 那这种外设是不是唤醒词需要定制。

相当于一个专用的协处理器,里面会有接口让你干。

 
个人签名

默认摸鱼,再摸鱼。2022、9、28

 
 

回复
您需要登录后才可以回帖 登录 | 注册

随便看看
查找数据手册?

EEWorld Datasheet 技术支持

相关文章 更多>>
关闭
站长推荐上一条 1/10 下一条

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 国产芯 安防电子 汽车电子 手机便携 工业控制 家用电子 医疗电子 测试测量 网络通信 物联网

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved
快速回复 返回顶部 返回列表