547|6

22

帖子

3

TA的资源

一粒金砂(中级)

楼主
 

【DigiKey“智造万物,快乐不停”创意大赛】3,语音识别模型调试 [复制链接]

 

语音识别使用的是speech_recognition库,首先创建虚拟环境,并安装相应的包

```

python3 -m venv .venv

source .venv/bin/activate

pip install SpeechRecognition

sudo apt install ffmpeg flac

```

接着,我们还需要修改一下这个库的源代码,因为库默认使用的16bits数据,但是一般I2S数据都是24bits数据,32bit空间,因此我们需要更改一下库文件site-packages/speech_recognition/__init__.py的第94行,class Microphone(AudioSource)中:

```

# self.format = self.pyaudio_module.paInt16  # 16-bit int sampling

self.format = self.pyaudio_module.paInt32  # 32-bit int sampling

```

接着,回到我们自己的代码中,写下一下测试代码,注意我们主要用他识别中文,而google的中文语言选择的字符串不是标准的国家code,要按我代码中的方式写才可以成功识别。

```

import speech_recognition as sr

r = sr.Recognizer()



def obtain():

        with sr.Microphone(device_index=1) as _source:

            print("Width: ", _source.SAMPLE_WIDTH)

            r.dynamic_energy_threshold = False

            r.energy_threshold = 10000000

            r.pause_threshold = 1.2

            print(">说点什么:")

            audio = r.listen(_source)

            print("Processing...")

        try:

            text_input = r.recognize_google(audio, language="cmn-Hans-CN")

            print("You said: " + text_input)

        except sr.UnknownValueError as _error:

            print("Google could not understand audio")

            print(_error)

            text_input = None

        except sr.RequestError as _error:

            print("Could not request results from Google")

            print(_error)

            text_input = None

        return text_input

obtain()

```

运行以上代码,如果一切正常,应该可以在terminal中看到识别到的文字。

最新回复

首先感谢楼主的无私分享,想了解下这个语音识别模型的运行占用的资源大吗?谢谢   详情 回复 发表于 2023-12-27 23:16
点赞 关注
 
 

回复
举报

6881

帖子

2

TA的资源

版主

沙发
 

这是Python的离线语音模型吧?识别率怎么样?

点评

成功配置成中文模式后识别率还是很高的  详情 回复 发表于 2023-12-21 10:11
 
 
 

回复

22

帖子

3

TA的资源

一粒金砂(中级)

板凳
 
wangerxian 发表于 2023-12-21 09:47 这是Python的离线语音模型吧?识别率怎么样?

成功配置成中文模式后识别率还是很高的

点评

离线的还是比较好的,可以搭载在各种设备上。  详情 回复 发表于 2023-12-21 15:53
大佬,这可以呀,语音识别还是非常有前途的,特别是在智能家居方面。  详情 回复 发表于 2023-12-21 10:27
 
 
 

回复

6842

帖子

11

TA的资源

版主

4
 
顺竿爬 发表于 2023-12-21 10:11 成功配置成中文模式后识别率还是很高的

大佬,这可以呀,语音识别还是非常有前途的,特别是在智能家居方面。

 
 
 

回复

6881

帖子

2

TA的资源

版主

5
 
顺竿爬 发表于 2023-12-21 10:11 成功配置成中文模式后识别率还是很高的

离线的还是比较好的,可以搭载在各种设备上。

 
 
 

回复

750

帖子

4

TA的资源

纯净的硅(高级)

6
 

首先感谢楼主的无私分享,想了解下这个语音识别模型的运行占用的资源大吗?谢谢

点评

还可以,树莓派可以完美运行,感觉不到明显的吃力  详情 回复 发表于 2024-1-2 13:13
 
 
 

回复

22

帖子

3

TA的资源

一粒金砂(中级)

7
 
chejm 发表于 2023-12-27 23:16 首先感谢楼主的无私分享,想了解下这个语音识别模型的运行占用的资源大吗?谢谢

还可以,树莓派可以完美运行,感觉不到明显的吃力

 
 
 

回复
您需要登录后才可以回帖 登录 | 注册

随便看看
查找数据手册?

EEWorld Datasheet 技术支持

相关文章 更多>>
关闭
站长推荐上一条 1/10 下一条

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 国产芯 安防电子 汽车电子 手机便携 工业控制 家用电子 医疗电子 测试测量 网络通信 物联网

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved
快速回复 返回顶部 返回列表