402|16

2578

帖子

0

资源

版主

语音唤醒的触发机制是什么? [复制链接]

 

想自己训练一个语音唤醒的模型,目前有两个问题。
问题如下:

1、怎么触发采集语音数据?比如我要开始采集语音数据,放到模型中去识别,那么我该什么时候进行采集?因为声音是一直存在的,我不能每一段时间采集一次放到模型中吧?所以我该如何触发采集语音数据?

2、采集多久语音数据?这是我设想的,唤醒词最慢的人说只需要5秒钟,那么我的超时时间就是5秒钟,当开始获取语音数据时,再起一个定时器,接收到的语音内容小于某值(也就是说话结束)我把语音数据拿到模型去识别。是这样的吗?

 

 

 

PS:AI真好玩,一起来玩呀~


回复

1389

帖子

15

资源

版主

个人思路实时监听 判断输入是不是关键字,例如 小爱 小度 如果是 巴拉巴拉 如果不是,没反应

点评

实时监听感觉太费电了。我去看看语音唤醒有啥技术~  详情 回复 发表于 2023-1-12 17:17

回复

1389

帖子

15

资源

版主

你搜搜siri唤醒机制 我记得网上有的~


回复

2578

帖子

0

资源

版主

吾妻思萌 发表于 2023-1-12 17:13 个人思路实时监听 判断输入是不是关键字,例如 小爱 小度 如果是 巴拉巴拉 如果不是,没反应

实时监听感觉太费电了。我去看看语音唤醒有啥技术~


回复

99

帖子

0

资源

一粒金砂(中级)

不是中断吗,哈哈哈

点评

那是不是还得有专门的拾音芯片?  详情 回复 发表于 2023-1-13 10:05

回复

2001

帖子

24

资源

五彩晶圆(高级)

音量唤醒,后面关键词识别

点评

达到某种音量,然后唤醒?  详情 回复 发表于 2023-1-13 10:06

回复

2578

帖子

0

资源

版主

zhaoyanhao 发表于 2023-1-12 17:40 不是中断吗,哈哈哈

那是不是还得有专门的拾音芯片?

点评

有可能,刚毕业做单片机按键的时候,我就觉得扫描太费电太占资源,就想找个按键输入中断,检测到中断信号后再扫描。当然了,我这个想法可能很low  详情 回复 发表于 2023-1-13 10:12

回复

2578

帖子

0

资源

版主

shower.xu 发表于 2023-1-12 21:50 音量唤醒,后面关键词识别

达到某种音量,然后唤醒?


回复

99

帖子

0

资源

一粒金砂(中级)

本帖最后由 zhaoyanhao 于 2023-1-13 10:15 编辑
wangerxian 发表于 2023-1-13 10:05 那是不是还得有专门的拾音芯片?

有可能,刚毕业做单片机键盘的时候,我就觉得扫描太费电太占资源,就想找个按键输入中断,检测到中断信号后再扫描。当然了,我这个想法可能很low

点评

我去看看别人的方案吧~  详情 回复 发表于 2023-1-13 10:58

回复

2578

帖子

0

资源

版主

zhaoyanhao 发表于 2023-1-13 10:12 有可能,刚毕业做单片机键盘的时候,我就觉得扫描太费电太占资源,就想找个按键输入中断,检测到中断信 ...

我去看看别人的方案吧~


回复

1万

帖子

143

资源

版主

语音采集是连续的,连续采集连续识别。

点评

那我该以什么为中断?比如我连续采集5秒,但是我在第4秒说话,要说两秒,那这一段只能识别到前1秒说话的内容,后1秒到下一个采集周期去了。  详情 回复 发表于 2023-1-13 15:29
个人签名上传了一些书籍资料,也许有你想要的:http://download.eeworld.com.cn/user/chunyang

回复

2578

帖子

0

资源

版主

chunyang 发表于 2023-1-13 14:41 语音采集是连续的,连续采集连续识别。

那我该以什么为中断?比如我连续采集5秒,但是我在第4秒说话,要说两秒,那这一段只能识别到前1秒说话的内容,后1秒到下一个采集周期去了。

点评

你还是没明白啥是“连续”,既然是连续,何来的“唤醒”?窗口法在此不成立。即使是“唤醒”,也不是语音处理部分的唤醒,而是其它无关部分,语音识别及前端电路部分必须连续工作。  详情 回复 发表于 2023-1-13 17:10

回复

1万

帖子

143

资源

版主

wangerxian 发表于 2023-1-13 15:29 那我该以什么为中断?比如我连续采集5秒,但是我在第4秒说话,要说两秒,那这一段只能识别到前1秒说话的 ...

你还是没明白啥是“连续”,既然是连续,何来的“唤醒”?窗口法在此不成立。即使是“唤醒”,也不是语音处理部分的唤醒,而是其它无关部分,语音识别及前端电路部分必须连续工作。

点评

但是数据丢入神经网络模型,只能是一段一段的。  详情 回复 发表于 2023-1-14 14:52
个人签名上传了一些书籍资料,也许有你想要的:http://download.eeworld.com.cn/user/chunyang

回复

1389

帖子

15

资源

版主

https://m.baidu.com/sf?pd=topone_trustpaper&resource_id=55858&word=解密“嘿!Siri!”语音唤醒原理&ext={"url":"https:\/\/m.sohu.com\/a\/508182132_12009990


回复

2578

帖子

0

资源

版主

chunyang 发表于 2023-1-13 17:10 你还是没明白啥是“连续”,既然是连续,何来的“唤醒”?窗口法在此不成立。即使是 ...

但是数据丢入神经网络模型,只能是一段一段的。

点评

段之间的间隔足够小,那就是连续的。  详情 回复 发表于 2023-1-15 21:20

回复

1万

帖子

143

资源

版主

wangerxian 发表于 2023-1-14 14:52 但是数据丢入神经网络模型,只能是一段一段的。

段之间的间隔足够小,那就是连续的。

个人签名上传了一些书籍资料,也许有你想要的:http://download.eeworld.com.cn/user/chunyang

回复

619

帖子

0

资源

纯净的硅(中级)

一般唤醒前,仅断续采集唤醒词的长度,声音连续时采样次数较多,但还是断续分析“唤醒词”的存在,没有声音就断续休眠,有声音了采集就多些,知道有唤醒词然后变成较长的“正常采集”和分析。

个人签名چوآن شـين

回复
您需要登录后才可以回帖 登录 | 注册

相关帖子
查找数据手册?

EEWorld Datasheet 技术支持

相关文章 更多>>
推荐帖子
基于FPGA的以太网控制器设计

引言 目前,以太网802.3协议和TCP/IP协议是现今嵌入式系统接入Internet的首选协议。而以太网(Ethernet)的核心思想是多用户使用 ...

Protel 99从入门到精通教程(下)

接上面的Protel 99从入门到精通教程(下) 记得用下面的阅读器或者自己去网上下载pdg的阅读器

钱老刚走,我给大家传上一本他的经典著作《工程控制论》,大家看看哈!

我自己这段时间正在看,希望坛子里面也有人喜欢这本书。是83年出版的。

LM3S8962评估板原理图分析(连载中。。。)

最近有一个板子刚好要用到群星系列的MCU,看到坛子有这个活动,就认领了分析原理图的任务,和大伙一起讨论。 初步想法:把原理 ...

【是德科技感恩月征文】饮水思源,感谢是德陪伴我从学生到工程师的成长之路

本帖最后由 nemo1991 于 2018-4-7 23:38 编辑 饮水思源,感谢是德陪伴我从学生到工程师的成长之路 时光匆匆,每年樱花与海 ...

晒货+那些年一起用过的开发板

本帖最后由 anananjjj 于 2019-11-9 20:15 编辑 443244 看到大家都在晒开发板,我也凑凑热闹! 我图片中只是收藏的 ...

BlueNRG-1/2 Flash 操作需要与BLE事件互斥问题

当使用BlueNRG-1/2本身的 Flash 存储数据应用数据时,可能遇到蓝牙没有信号,或者是死机了等问题。 因为在擦除一页的过程中 ...

以后不做电子行业,还可以做什么

千辛万苦转行从硬件转来做软件,连滚带爬的找到了一份工作,这份工作很差但是无奈将就了。但是找到工作之后又有一个严重的问题凸 ...

【i.MX6ULL】驱动开发7——按键输入捕获

本帖最后由 DDZZ669 于 2021-11-9 00:04 编辑 前面几篇文章,从最基础的寄存器点灯,到设备树点灯,再到GPIO子系统点灯, ...

在生成设备树dtb文件时报错

首先是生成dts文件,使用命令,提示这样的信息。生成了dts文件,但是不知道有没有错误590535再生成了dtb文件,因为正常输出报错 ...

关闭
站长推荐上一条 1/5 下一条

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 安防电子 汽车电子 手机便携 工业控制 家用电子 医疗电子 测试测量 网络通信 物联网

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2022 EEWORLD.com.cn, Inc. All rights reserved
快速回复 返回顶部 返回列表