550|0

23

帖子

0

TA的资源

一粒金砂(中级)

楼主
 

聆思CSK6语音视觉AI大模型开发板硬件详解(附硬件资料下载) [复制链接]

本帖最后由 胡黎明 于 2024-6-13 14:41 编辑
视觉语音大模型 AI 开发套件( CSK6-MIX )是围绕 CSK6011A 芯片设计的具备丰富语音图像功能与硬件外设的开发板,采用具备丰富组件生态的 Zephyr RTOS作为操作系统,官方提供了十几种开源SDK,包含大模型语音交互、大模型拍照识图、文生图、人脸识别、头肩追踪、手势识别、坐姿提醒等。

聆思提供还提供了模型训练推理工具将自己的算法模型部署至芯片上,也可以配合这个工具构建自己的 AI 应用。

 

 

 

功能特性

功能概述

  • 使用聆思 CSK6011A 芯片作为主控,板载 16MB Flash
  • 集成摄像头、麦克风、扬声器、屏幕等丰富外设配件
  • 配套多模态应用示例,支持快速上手体验大模型语音交互、智能视觉等 AI 应用
  • 板载 DAPLINK 调试器,外接一条USB 线即可实现烧录、调试、串口日志查看
  • 板载网络模组,支持开发联网类应用

大模型示例SDK清单

SDK集成了星火大模型,可以二次开发改接其他大模型,示例清单见下表,可以直接通过链接进行固件烧录并下载:

序号

大模型功能

使用教程

功能说明

1

大模型多模态

大模型多模态快速体验

套件出厂默认应用。包含大模型语音问答、拍照识图、大模型绘图等丰富供能示例,支持语音唤醒、多轮语音交互。

2

智能对话

智能问答+坐姿检测快速体验

除了大模型语音对话,还集成了可离线运行的坐姿检测算法,是一个 大模型在线服务+离线AI能力 的示例。

3

智能对话 + 文生图 + 设备控制

大模型控制快速体验

该示例展示了如何通过大模型实现语音输入意图的理解,实现对话、绘图和控制开发板屏幕颜色进行切换,用户可参考代码与教程自行修改。

4

接入自定义应用

基于模板创建应用

通过编排新增意图落域

讲解如何在云端快速建立一个自定义大模型应用并接入到开发套件上实现语音交互,由浅入深地展示如何开发自己的大模型助手。

离线AI能力示例SDK清单

序号

AI 能力

使用教程

1

语音唤醒 + 坐姿检测

https://docs2.listenai.com/x/i_84jJ5pd

2

语音合成

https://docs2.listenai.com/x/e16RmshY3

3

坐姿检测

https://docs2.listenai.com/x/e16RmshY3

4

人脸识别

https://docs2.listenai.com/x/XuPPPS80c

5

单词评测

https://docs2.listenai.com/x/hZ6NT04Kk

6

头肩检测 & 手势识别

https://docs2.listenai.com/x/eiRAtqX7_

 

LNN AI示例SDK清单

LNN是用于移植适配算法至CSK6芯片的工具,提供了视觉、语音相关的示例SDK,如果想在CSK6上移植适配自己的算法,可以参照这些示例:

序号

能力

使用教程

1

拍照物体识别

https://docs2.listenai.com/x/AyRl56jpS

2

鼾声检测

https://docs2.listenai.com/x/tD4HR_HpM

3

英译中

https://docs2.listenai.com/x/GxlJsvPfc

 

开发板硬件资源

 

编号

资源

说明

1

CSK USB 接口

CSK6 芯片的 USB 接口,可通过本接口使用 CSK6 的 USB 硬件功能,支持对开发板进行供电。

2

DAPLink 调试器接口

可通过本接口查看日志、烧录固件、调试仿真,支持对开发板进行供电。

3

电源开关

控制开发板总电源开关。

4

外扩排针

引出 CSK6 芯片的可用 IO 口,包括部分由扩展 IO 芯片 (19编号)外接的 IO口,开发者可按需进行使用。

5

摄像头模组

默认配套 30W 像素的摄像头模组,型号为 GC0328。

6

扬声器接口

用于连接扬声器进行播音。

7

RGB LED

支持编程控制的 LED。

8

触摸显示屏

分辨率 320*240 的触摸显示屏,屏显硬件接口为 SPI,触摸硬件接口为 I2C 。

9

麦克风

板载的两个麦克风,连接芯片的 Audio ADC,用于语音相关应用的录音。

10

硬回采开关

用于控制第二路录音链路用于麦克录音(默认)还是硬件回采。

11

SD卡槽

用于插入 SD 存储卡。

12

网络模组调试座

可用语烧录网络模组的固件与调试。

13

网络模组

使用 ESP32 C3 作为网络模组。

14

扩展按键区

通过扩展 IO 芯片 CH32 扩展引出的按键,支持轮询检测。

15

CSK6 功能按键区

包括 CSK6 芯片的复位、BOOT、自定义功能按键。

16

电源LED

指示开发板的供电状态,供电正常使,LED亮起。

 

开发板设计资料下载

文件

操作

大模型开发套件

V2.0 硬件设计

https://oshwhub.com/lshuangyu/leaf-technology-multimodal-devel

CSK6系芯片

引脚功能表 V1.0

https://docs2.listenai.com/zz/3294.xlsx?shortId=nTn9kMMCU

 

附件大纲:

功能概述

├──大模型示例SDK清单

├──离线AI能力示例SDK清单

├──LNN AI示例SDK清单

开发板硬件资源

开发板设计资料下载

开发板尺寸V2.0

开发板配件

├──摄像头模组

├──摄像头安装

├──触摸屏模块

├──触摸屏安装

├──网络模组

更多使用说明

├──供电

├──DAPLink UsB口的使用

开发环境

聆思CSK6语音视觉AI大模型开发板硬件介绍.pdf

1.07 MB, 下载次数: 5

此帖出自信息发布论坛
点赞 关注
 
 

回复
举报
您需要登录后才可以回帖 登录 | 注册

随便看看
查找数据手册?

EEWorld Datasheet 技术支持

相关文章 更多>>
关闭
站长推荐上一条 1/8 下一条

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 国产芯 安防电子 汽车电子 手机便携 工业控制 家用电子 医疗电子 测试测量 网络通信 物联网

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2025 EEWORLD.com.cn, Inc. All rights reserved
快速回复 返回顶部 返回列表