1529|3

156

帖子

1

TA的资源

一粒金砂(中级)

楼主
 

基于STM32H747Disco和百度语音云的语音识别智能聊天机器人和信号采集系统 [复制链接]

 
基于STM32H747Disco和百度语音云的语音识别智能聊天机器人和信号采集系统
作者:donatello1996
一、作品简介(100-200字)
作品采用得捷上购买的STM32H747Disco开发板,使用LVGL图形库做界面交互
,通过串口,信号线及外部高速总线与ARM Linux板通信,访问百度语音云做语音识别、语音合成以及做振动信号采集。STM32H747Disco开发板承担图像显示,信号控制指令以及AD采集工作。
  1. 系统框图(图文结合)
如图,STM32H747Disco开发板与ARM Linux开发板的串口通信是双向的,ARM Linux开发板在整个流程中通过串口改变STM32H747Disco开发板显示内容。STM32H747Disco通过一根信号线输出到ARM Linux开发板上,以发出流程开始信号。ARM Linux开发板通过摄像头麦克风录入声音,通过以太网连接百度语音云,并通过扬声器输出声音。
STM32H747Disco开发板软件流程如下,如图,使用了LVGL图形库,SDRAM外扩内存访问以及QSPI字库存储读取:
ARM Linux板软件流程如下,录音、语音识别、访问文心一言、语音合成、语音播报都是独立完成的,分属不同功能:
三、各部分功能说明(图文结合)
使用外部自定义字库需要烧录字库文件到QPI上,所以需要CubeProgrammer软件帮忙:
功能说明与代码片段解读(STM32H747开发板部分):
LVGL界面初始化,需要初始化三个文本框,两个按钮,三个文本框中的最顶部框为状态指示框,分别显示语音识别流程,从录音->录音语音识别->访问文心一言获取回答->将回答进行语音合成->播放五个环节,环节循环进行;
第二个文本框为录音问题提问框,将录音识别而成的文字显示在此框;
第三个文本框位回答显示框,将文心一言的回答文字显示在此框;
【开始流程】按钮按下后录音开始,整个流程也开始;
【清除问题和回答】框将问题文本框和回答文本框的内容全部清除;
LV_FONT_DECLARE(myFont)
void lv_mainstart(void)
{
uint8_t utf8_chinese[200];

dropdown_font = &myFont;
//dropdown_font = &lv_font_montserrat_22;
dropdown_width = 150;

ta_state = lv_textarea_create(lv_scr_act());
lv_obj_align(ta_state , LV_ALIGN_TOP_LEFT , 10 , 10);
lv_obj_set_style_text_font(ta_state , dropdown_font, LV_STATE_DEFAULT);
//lv_obj_add_event_cb(ta,textarea_Show1_event_cb,LV_EVENT_READY,ta);
lv_obj_set_size(ta_state , 700 , 50);
lv_obj_add_state(ta_state , LV_STATE_FOCUSED);

ta_question = lv_textarea_create(lv_scr_act());
lv_obj_align(ta_question , LV_ALIGN_TOP_LEFT , 10 , 60);
lv_obj_set_style_text_font(ta_question , dropdown_font, LV_STATE_DEFAULT);
//lv_obj_add_event_cb(ta,textarea_Show1_event_cb,LV_EVENT_READY,ta);
lv_obj_set_size(ta_question , 700 , 99);
lv_obj_add_state(ta_question , LV_STATE_FOCUSED);
//lv_obj_add_state(ta1 , LV_STATE_DEFAULT);

btn_start = lv_btn_create(lv_scr_act());
lv_obj_set_size(btn_start, 200 , 50);
lv_obj_align(btn_start, LV_ALIGN_TOP_LEFT, 10 , 160);
lv_obj_add_event_cb(btn_start, btn_event_cb, LV_EVENT_CLICKED, NULL);
lv_obj_t* label_btn_start = lv_label_create(btn_start);
lv_obj_set_style_text_font(label_btn_start , dropdown_font, LV_PART_MAIN);
lv_obj_set_align(label_btn_start , LV_ALIGN_CENTER);
ANSI_to_UTF8("开始流程" , utf8_chinese);
lv_label_set_text(label_btn_start , utf8_chinese);

btn_clean = lv_btn_create(lv_scr_act());
lv_obj_set_size(btn_clean , 300 , 50);
lv_obj_align(btn_clean , LV_ALIGN_TOP_LEFT, 220 , 160);
lv_obj_add_event_cb(btn_clean , btn_event_cb, LV_EVENT_CLICKED, NULL);
lv_obj_t* label_btn_clean = lv_label_create(btn_clean);
lv_obj_set_style_text_font(label_btn_clean , dropdown_font, LV_PART_MAIN);
lv_obj_set_align(label_btn_clean , LV_ALIGN_CENTER);
ANSI_to_UTF8("清除问题和回答" , utf8_chinese);
lv_label_set_text(label_btn_clean , utf8_chinese);

ta_answer = lv_textarea_create(lv_scr_act());
lv_obj_align(ta_answer , LV_ALIGN_TOP_LEFT , 10 , 211);
lv_obj_set_style_text_font(ta_answer , dropdown_font, LV_STATE_DEFAULT);
//lv_obj_add_event_cb(ta,textarea_Show1_event_cb,LV_EVENT_READY,ta);
lv_obj_set_size(ta_answer , 700 , 268);
lv_obj_add_state(ta_answer , LV_STATE_DEFAULT);

}
运行时,按下开始流程按钮,发送指令到ARM Linux开发板:
static void btn_event_cb(lv_event_t* e)
{
lv_obj_t *target = lv_event_get_target(e);
if(target == btn_start)
{
printf("btn_start.\n");
HAL_GPIO_WritePin(GPIOJ , GPIO_PIN_0 , GPIO_PIN_SET);

}
else if(target == btn_clean)
{
printf("btn_clean.\n");
lv_textarea_set_text(ta_question , "");
lv_textarea_set_text(ta_answer , "");
}
}
lv_init();
lv_port_disp_init();
lv_port_indev_init();

lv_mainstart();

while(1)
{
count ++;
if(count > 100)
{
count = 0;
HAL_GPIO_WritePin(GPIOJ , GPIO_PIN_0 , GPIO_PIN_RESET);
}

lv_task_handler();
lv_tick_inc(1);

if(uart8_recv_end_flag)
{
uart8_recv_end_flag = 0;
printf("rx8_buf[0] == 0x%x && rx8_buf[1] == 0x%x.\n" , rx8_buf[0] , rx8_buf[1]);
if(rx8_buf[0] == 0x11 && rx8_buf[1] == 0x11)
{
ANSI_to_UTF8(rx8_buf + 2 , utf8_global);
lv_textarea_set_text(ta_state , utf8_global);
}
else if(rx8_buf[0] == 0x11 && rx8_buf[1] == 0x12)
{
ANSI_to_UTF8(rx8_buf + 2 , utf8_global);
lv_textarea_set_text(ta_question , utf8_global);
}
else if(rx8_buf[0] == 0x11 && rx8_buf[1] == 0x13)
{
ANSI_to_UTF8(rx8_buf + 2 , utf8_global);
lv_textarea_set_text(ta_answer , utf8_global);
}
else if(rx8_buf[0] == 0x11 && rx8_buf[1] == 0x14)
{
lv_textarea_set_text(ta_question , rx8_buf + 2);
}
else if(rx8_buf[0] == 0x11 && rx8_buf[1] == 0x15)
{
lv_textarea_set_text(ta_answer , rx8_buf + 2);
}
else if(rx8_buf[0] == 0x11 && rx8_buf[1] == 0x16 && rx8_buf[2] == 1)
{
BSP_LED_Off(LED_RED);
BSP_LED_Off(LED_ORANGE);
BSP_LED_Off(LED_BLUE);
BSP_LED_Off(LED_GREEN);
}
else if(rx8_buf[0] == 0x11 && rx8_buf[1] == 0x16 && rx8_buf[2] == 2)
{
BSP_LED_On(LED_RED);
BSP_LED_Off(LED_ORANGE);
BSP_LED_Off(LED_BLUE);
BSP_LED_Off(LED_GREEN);
}
else if(rx8_buf[0] == 0x11 && rx8_buf[1] == 0x16 && rx8_buf[2] == 3)
{
BSP_LED_Off(LED_RED);
BSP_LED_On(LED_ORANGE);
BSP_LED_Off(LED_BLUE);
BSP_LED_Off(LED_GREEN);
}
else if(rx8_buf[0] == 0x11 && rx8_buf[1] == 0x16 && rx8_buf[2] == 4)
{
BSP_LED_Off(LED_RED);
BSP_LED_Off(LED_ORANGE);
BSP_LED_On(LED_BLUE);
BSP_LED_Off(LED_GREEN);
}
else if(rx8_buf[0] == 0x11 && rx8_buf[1] == 0x16 && rx8_buf[2] == 5)
{
BSP_LED_Off(LED_RED);
BSP_LED_Off(LED_ORANGE);
BSP_LED_Off(LED_BLUE);
BSP_LED_On(LED_GREEN);
}
else if(rx8_buf[0] == 0x11 && rx8_buf[1] == 0x16 && rx8_buf[2] == 6)
{
BSP_LED_On(LED_RED);
BSP_LED_On(LED_ORANGE);
BSP_LED_On(LED_BLUE);
BSP_LED_On(LED_GREEN);
}
}
}

 

 
功能说明与代码片段解读(ARM Linux开发板部分):
初始化信号脚GPIO:
int MYGPIO_GPIOD_Init()
{
    gpiochip3 = gpiod_chip_open("/dev/gpiochip3");
    if (!gpiochip3)
    {
        printf("Open /dev/gpiochip3 failed.\n");
        return -1;
    }
    gpiochip3_a5 = gpiod_chip_get_line(gpiochip3 , 5);
    if (!gpiochip3_a5)
    {
        printf("Get gpiochip1_a2_rst line failed.\n");
        return -1;
    }
    // if (gpiod_line_request_output(gpiochip1_a2_rst , "my_output", GPIOD_LINE_ACTIVE_STATE_LOW))
    // {
    //     printf("Configuring gpiochip1_a2_rst as output failed.\n");
    //     return -1;
    // }
    if (gpiod_line_request_rising_edge_events(gpiochip3_a5 , "my_input") < 0)
    {
        printf("Request gpiochip1_a4_dio0 events failed.\n");
        return -1;
    }
}
void GPIO3_A5_Read()
{
    if (gpiod_line_event_wait(gpiochip3_a5 , NULL) < 0)
    {
        printf("Wait event failed.\n");
        return ;
    }
    if (gpiod_line_event_read(gpiochip3_a5 , &event) < 0)
    {
        printf("Wait event failed.\n");
        return;
    }
    printf("GPIO3_A5_Read interrupt detected!\n");
}

 

GPIO接收到开始录音的上升沿信号,开始程序流程: 
   MYGPIO_GPIOD_Init();
    fd_uart0 = Uart_Open(UART_DEV);
    if (fd_uart0 < 0)
    {
        printf("open %s failed\n" , UART_DEV);
        return 0;
    }
    ret = Uart_Set(fd_uart0, 115200 , 8, 'n', 1, 'n');
    if (ret == -1)
    {
        return 0;
    }
    while(1)
    {
        UART3_Send_State(STATE_PROGRAM_START);
        UART3_Send_State_Textarea("等待录音...");
        GPIO3_A5_Read();
        UART3_Send_State_Textarea("正在录音中...");
        printf("before system arecord.\n");
        UART3_Send_State(STATE_RECORDING);
        system("arecord -f S16_LE -c 1 -r 16000 -d 8 -Dhw:2 /home/16k.wav");
        printf("after system arecord.\n");
        UART3_Send_State(STATE_RECORDED_QUESTIONING);
        UART3_Send_State_Textarea("录音完毕,等待语音识别提问...");
        sleep(1);
        Baidu_TSR(baidu_api_key_test , baidu_secret_key_test , baidu_cuid_test , baidu_tsr_filename_test , baidu_tsr_format_test ,
        baidu_tsr_dev_pid_test , baidu_tsr_scope_test , baidu_tsr_rate_test);
        UART3_Send_State(STATE_QUESTIONED_ANSWERING);
        UART3_Send_State_Textarea("语音识别提问完毕,正在访问文心一言获取回答...");
        UART3_Send_Question_Textarea_UTF8(baidu_xtts_text_test);
        printf("before Baidu_ERNIE_BOT_4.\n");
        answer = Baidu_ERNIE_BOT_4(baidu_xtts_text_test);
        printf("answer = %s.\n" , answer.c_str());
        printf("after Baidu_ERNIE_BOT_4.\n");
        UART3_Send_State(STATE_ANSWERED_XTTSING);
        UART3_Send_State_Textarea("文心一言已回答,等待回答电子语音合成...");
        UART3_Send_Answer_Textarea_UTF8((char*)answer.c_str());
        printf("before Baidu_XTTS_Long_Text.\n");
        Baidu_XTTS_Long_Text(answer , baidu_xtts_long_voice_test);
        printf("after Baidu_XTTS_Long_Text.\n");
        sleep(1);
        UART3_Send_State(STATE_XTTSED_PLAYING);
        UART3_Send_State_Textarea("文心一言已回答,电子语音合成完毕,扬声器正在播报回答...");
        printf("before system madplay.\n");
        system("madplay /home/result.mp3");
        printf("after system madplay.\n");
    }

 

四、作品源码

五、作品功能演示视频
六、项目总结
(项目文字总结+帖子分享链接汇总)
 
七、其他
基于STM32H747Disco和百度语音云的语音识别智能聊天机器人和信号采集系统.doc (1.7 MB, 下载次数: 4)

最新回复

代码工程可以提供下载吗\ ?   详情 回复 发表于 2024-6-12 22:37
点赞 关注
 
 

回复
举报

7219

帖子

192

TA的资源

五彩晶圆(高级)

沙发
 

STM32H7只负责显示吗 大佬

点评

是的啊,本来想用来做网口控制的,启用网口需要改PCB电阻焊点,不舍得动烙铁,毕竟是好板,早知道买树莓派来做一步到位。  详情 回复 发表于 2024-2-3 00:46
 
 
 

回复

156

帖子

1

TA的资源

一粒金砂(中级)

板凳
 
常见泽1 发表于 2024-1-31 15:09 STM32H7只负责显示吗 大佬

是的啊,本来想用来做网口控制的,启用网口需要改PCB电阻焊点,不舍得动烙铁,毕竟是好板,早知道买树莓派来做一步到位。

 
 
 

回复

2

帖子

1

TA的资源

一粒金砂(初级)

4
 

代码工程可以提供下载吗\

?

 
 
 

回复
您需要登录后才可以回帖 登录 | 注册

查找数据手册?

EEWorld Datasheet 技术支持

相关文章 更多>>
关闭
站长推荐上一条 1/8 下一条

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 国产芯 安防电子 汽车电子 手机便携 工业控制 家用电子 医疗电子 测试测量 网络通信 物联网

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2025 EEWORLD.com.cn, Inc. All rights reserved
快速回复 返回顶部 返回列表