1734|20

6401

帖子

2

TA的资源

版主

有什么识别率高且免费的离线语音识别模型吗? [复制链接]

 

最近测评科大讯飞的流式语音模型感觉识别率还是挺高的,不过收费也挺高的,想问问,大家在离线产品上用的语音识别,都是什么语音识别模型?

我记得Python有个第三方语音识别库,不过好像识别率一般。

最新回复

没用过, 不太了解,,   详情 回复 发表于 2024-1-15 10:22

回复
举报

6763

帖子

9

TA的资源

版主

我也想顺路学习一下,有的话加入到stm32H7xx里面。

点评

估计不好加,加Linux估计好加一些。  详情 回复 发表于 2024-1-8 13:04

回复

6401

帖子

2

TA的资源

版主

lugl4313820 发表于 2024-1-8 11:56 我也想顺路学习一下,有的话加入到stm32H7xx里面。

估计不好加,加Linux估计好加一些。


回复

286

帖子

0

TA的资源

纯净的硅(初级)

淘宝上有些比较廉价的离线语音识别模块,串口通信,识别率还可以

点评

是不是只能识别固定的内容?  详情 回复 发表于 2024-1-9 09:10

回复

5637

帖子

6

TA的资源

版主

这种芯片应该有,不过模型人家应该不开源吧  

点评

感觉是,后面我自己看看训练一个模型好了,有点经验了。  详情 回复 发表于 2024-1-9 09:10
个人签名

在爱好的道路上不断前进,在生活的迷雾中播撒光引


回复

6401

帖子

2

TA的资源

版主

kit7828 发表于 2024-1-8 16:29 淘宝上有些比较廉价的离线语音识别模块,串口通信,识别率还可以

是不是只能识别固定的内容?

点评

离线的就这样,就是识别固定的一些单词。 什么开灯 关灯 之类的。可以订制自己的内容。  详情 回复 发表于 2024-1-10 13:53

回复

6401

帖子

2

TA的资源

版主

秦天qintian0303 发表于 2024-1-8 17:24 这种芯片应该有,不过模型人家应该不开源吧  

感觉是,后面我自己看看训练一个模型好了,有点经验了。


回复

5170

帖子

236

TA的资源

管理员

听嵌入式群里的人说:开源没有,能改词儿不收费 都是这两年卷的 福利了

还有人推荐了机芯智能的模块,他当时对比几家,感觉他家可以,但是,要把需要识别的词汇,生成离线库,不是和,小杜一样

加EE小助手好友,
入技术交流群
EE服务号
精彩活动e手掌握
EE订阅号
热门资讯e网打尽
聚焦汽车电子软硬件开发
认真关注技术本身

回复

2144

帖子

8

TA的资源

五彩晶圆(初级)

本地离线识别可以, 精度高的, 限制也比较多, 比如模型太大, 芯片都塞不下, 或者比较复杂, 个人能玩转的比较少

几年前大多是那种语音唤醒的, 支持几十条, 上百条的预设词, 公司之前还有一条产品线, 做语音识别, TWS, 奈何太卷了, 高端的打不过, 低端的成本降不下来, 不干了

 

点评

模型能达到多大?  详情 回复 发表于 2024-1-9 13:25
个人签名坐而言不如起而行

回复

6401

帖子

2

TA的资源

版主

wsmysyn 发表于 2024-1-9 09:59 本地离线识别可以, 精度高的, 限制也比较多, 比如模型太大, 芯片都塞不下, 或者比较复杂, 个人能玩转的比较 ...

模型能达到多大?

点评

语音那个产品, 具体没了解, 只是听软件的人说过, 预设识别词过多的时候识别精度以及功耗控制不好, 唤醒词一般3-5个, 命令词一般10个左右, 可以更多, 问题就是上边说那些 SRAM大概0.7 - 2MB, XIP flash容量1MB/4MB  详情 回复 发表于 2024-1-10 11:32

回复

2144

帖子

8

TA的资源

五彩晶圆(初级)

wangerxian 发表于 2024-1-9 13:25 模型能达到多大?

语音那个产品, 具体没了解, 只是听软件的人说过, 预设识别词过多的时候识别精度以及功耗控制不好, 唤醒词一般3-5个, 命令词一般10个左右, 可以更多, 问题就是上边说那些

SRAM大概0.7 - 2MB, XIP flash容量1MB/4MB两个版本, 可以合封更大的flash, 评估过8MB, 但是没有做, 

 

点评

基本上那些离线的智能设备都是用的这种芯片吧。  详情 回复 发表于 2024-1-11 09:16
个人签名坐而言不如起而行

回复

6039

帖子

4

TA的资源

版主

本帖最后由 damiaa 于 2024-1-10 13:55 编辑
wangerxian 发表于 2024-1-9 09:10 是不是只能识别固定的内容?

离线的就这样,就是识别固定的一些单词。 什么开灯 关灯 之类的。可以订制自己的内容。 而且是普通话版本的。其他什么语言那就要花钱训练 还不一定效果好。

 

点评

那其实还真的可以自己训练,后面有时间我搞搞。  详情 回复 发表于 2024-1-11 09:17

回复

6401

帖子

2

TA的资源

版主

wsmysyn 发表于 2024-1-10 11:32 语音那个产品, 具体没了解, 只是听软件的人说过, 预设识别词过多的时候识别精度以及功耗控制不好, 唤醒词 ...

基本上那些离线的智能设备都是用的这种芯片吧。

点评

基本上是这样, 主打的是低功耗, 本地识别, 比传统的识别精度高一些, 可穿戴这类电池供电场景 而且相当便宜,,,     详情 回复 发表于 2024-1-11 09:55

回复

6401

帖子

2

TA的资源

版主

damiaa 发表于 2024-1-10 13:53 离线的就这样,就是识别固定的一些单词。 什么开灯 关灯 之类的。可以订制自己的内容。 而且是普通话版 ...

那其实还真的可以自己训练,后面有时间我搞搞。


回复

2144

帖子

8

TA的资源

五彩晶圆(初级)

wangerxian 发表于 2024-1-11 09:16 基本上那些离线的智能设备都是用的这种芯片吧。

基本上是这样, 主打的是低功耗, 本地识别, 比传统的识别精度高一些, 可穿戴这类电池供电场景

而且相当便宜,,, 

 

点评

本地识别还会比传统识别精度高?  详情 回复 发表于 2024-1-11 13:06
个人签名坐而言不如起而行

回复

6401

帖子

2

TA的资源

版主

wsmysyn 发表于 2024-1-11 09:55 基本上是这样, 主打的是低功耗, 本地识别, 比传统的识别精度高一些, 可穿戴这类电池供电场景 而且相当 ...

本地识别还会比传统识别精度高?

点评

传统的是更早以前的那种的本地识别,  现在基本上都是内置了一些AI引擎, 更成熟一些的算法之类的 基本上对外宣传都是98%识别率, 48小时误识别次数小于2次等等...  详情 回复 发表于 2024-1-11 13:42

回复

2144

帖子

8

TA的资源

五彩晶圆(初级)

本帖最后由 wsmysyn 于 2024-1-11 13:49 编辑
wangerxian 发表于 2024-1-11 13:06 本地识别还会比传统识别精度高?

传统的是更早以前的那种的本地识别, 

现在基本上都是内置了一些AI引擎, 更成熟一些的算法之类的

基本上对外宣传都是98%识别率, 48小时误识别次数小于2次等等...

工艺上, 目前语音类芯片已经从40nm卷到了22nm, 集成度相当的高

点评

口音啥的识别率如何?我们网络版的,带点口音一些词就识别不了。  详情 回复 发表于 2024-1-12 17:28
个人签名坐而言不如起而行

回复

6401

帖子

2

TA的资源

版主

wsmysyn 发表于 2024-1-11 13:42 传统的是更早以前的那种的本地识别,  现在基本上都是内置了一些AI引擎, 更成熟一些的算法之类 ...

口音啥的识别率如何?我们网络版的,带点口音一些词就识别不了。

点评

我们当时也参与录音训练来着, 让带着口音训练, 但是也仅限于公司员工, 以及员工亲戚朋友间, 样本量还是不足, 估计也不行. 轻微的口音可能还行, 太重没有足够样品训练 花钱花时间应该可以训练出来 其他公司可能  详情 回复 发表于 2024-1-12 22:37

回复

2144

帖子

8

TA的资源

五彩晶圆(初级)

wangerxian 发表于 2024-1-12 17:28 口音啥的识别率如何?我们网络版的,带点口音一些词就识别不了。

我们当时也参与录音训练来着, 让带着口音训练, 但是也仅限于公司员工, 以及员工亲戚朋友间, 样本量还是不足, 估计也不行. 轻微的口音可能还行, 太重没有足够样品训练

花钱花时间应该可以训练出来

其他公司可能应该有, 具体没了解那么多, 毕竟不是做产品定义的, 是根据产品要求做芯片封装设计和测试设计以及供应链运营的....

点评

我们用的是科大讯飞的语音识别,感觉还是差些意思。  详情 回复 发表于 2024-1-15 09:18
个人签名坐而言不如起而行

回复

6401

帖子

2

TA的资源

版主

wsmysyn 发表于 2024-1-12 22:37 我们当时也参与录音训练来着, 让带着口音训练, 但是也仅限于公司员工, 以及员工亲戚朋友间, 样本量还是不 ...

我们用的是科大讯飞的语音识别,感觉还是差些意思。

点评

没用过, 不太了解,,  详情 回复 发表于 2024-1-15 10:22

回复
您需要登录后才可以回帖 登录 | 注册

猜你喜欢
随便看看
查找数据手册?

EEWorld Datasheet 技术支持

相关文章 更多>>
关闭
站长推荐上一条 1/10 下一条

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 国产芯 安防电子 汽车电子 手机便携 工业控制 家用电子 医疗电子 测试测量 网络通信 物联网

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved
快速回复 返回顶部 返回列表