【SU-03T】声控模块的原理讲解

视频讲解

一、实物图

二、原理图

引脚定义

三、简介

SU-03T离线语音模组是一种基于数字信号处理技术的硬件设备,具有自然语言语音识别、文本转语音合成等功能。它不依赖于云端服务,而是直接在设备上进行语音识别和合成,在响应速度、稳定性和安全性方面具有优势,适用于各种智能音箱、智能家居、智能硬件、车载导航等场景。

SU-03T离线语音模组采用专业级DSP芯片和远场麦克风技术,可以在较远距离范围内实现准确的语音识别和指令控制。同时,该模组支持多国语言识别,可满足全球各地区的市场需求。除此之外,它还支持离线语言包升级,可以随时更新语音识别和合成技术,提高用户体验。

总之,SU-03T离线语音模组是一款高性能、高可靠性、易于集成和定制的离线语音识别与合成设备。以下是它的一些特性:

  • 32bit RISC 内核,运行频率 240M
  • 支持 DSP 指令集以及 FPU 浮点运算单元
  •  FFT 加速器:最大支持1024点复数 FFT/IFFT 运算,或者是2048点的实数 FFT/IFFT 运算
  •  内置高速SRAM,内置 2MB FLASH
  •  内置 3W、单声道 AB 类功放
  • 支持1 路驻极体麦
  •  支 持 I2S input/output
  • 支持 5V 电源输入 内置 5V 转 3.3V,3.3V 外部负载不超过 150mA
  • RC 12MHz 时钟源和 PLL 锁相环时钟源
  • 内置 POR(Power on Reset),低电压检测和看门狗
  • 所 有GPIO 均可配置为外部中断输入和唤醒源
  • 1 个标准 SPI Master 接口,最高速率 30MHz
  • 1 个 SPI Slave 接口最高速率 30MHz
  • 1 个全双工 UART 最高速率 3Mbps。
  • 1 个 I2C 主/从控制器最高速率 400kHz
  • 2 个 PWM 输出
  • 1 个 12-bit SAR-ADC 最大 450Khz 采样率

主要参数

基本原理

SU-03T离线语音模组是一种基于数字信号处理(DSP)技术的硬件设备,具有将语音指令转化为可识别文本的能力,其基本原理如下:

  1. 采集:使用麦克风等输入设备采集语音信号。
  2. 预处理:对采集到的语音信号进行预处理,包括去除噪声和回音等干扰。
  3. 特征提取:通过对预处理后的语音信号进行分帧、时频分析等操作,提取出与语音特征相关的参数。
  4. 模型匹配:将提取的语音特征与预先训练好的模型进行匹配,寻找最佳匹配结果。
  5. 语音识别:根据匹配结果,将语音信号翻译成文本输出。

SU-03T离线语音模组与云端语音识别相比,具有响应速度更快、对网络环境要求较低、隐私安全性更高等优点,适用于各种语音控制场景。

智能公元

SU-03T 离线语音模组具备强大的软件开发定制能力,用户可以使用“智能公元”平台,配置模组的 PIN 脚、语音识别、输入和输出控制等各项能力,生成语音 SDK,并在平台上直接编译、生成固件,实现零代码开发,降低开发难度,提高开发效率,减少开发成本,缩短开发周期。智能公元平台是机芯智能公司为嵌入式开发打造的开放式开发平台,网址如下:

http://www.smartpi.cn

在网站上设置好之后,需要下载SDK和固件,在SDK中有下载固件的软件。在烧录固件时,需要用到USB转串口模块,B6和B7是串口烧录口。

 

四、结构尺寸

五、注意

  • 在烧录固件时,模块要接USB转串口的5V电源,且要共地。
  • 存放SDK和固件的路径中不能有中文。
  • 点击烧录后,要重新给模块上电。
  • 在用单片机控制时,注意波特率是9600。

发表回复

后才能评论