Audio Toolbox

设计和分析语音、声学和音频处理系统

 

Audio Toolbox™ 为音频处理、语音分析和声学测量提供工具。该工具箱包含用于音频信号处理(如均衡和动态范围控制)和声学测量(如脉冲响应估算、倍频程滤波和感知加权)的算法。还提供用于音频和语音特征提取(如 MFCC 和基音)以及音频信号变换(如伽马通滤波器组和梅尔间隔频谱图)的算法。

工具箱应用支持实时算法测试、脉冲响应测量和音频信号标注。工具箱提供与 ASIO、WASAPI、ALSA 和 CoreAudio 声卡与 MIDI 设备之间的流接口,以及用于生成和托管标准音频插件(如 VST 和 Audio Units)的工具。

借助 Audio Toolbox 可以导入、标注和增强音频数据集,以及提取特征和变换信号,以便进行机器学习和深度学习。可以流式传输低延迟音频,同时进行参数调优和信号可视化,从而对音频处理算法进行实时原型设计。还可以将算法转变为音频插件以在外部主机应用程序(如 Digital Audio Workstations)中运行,从而对其进行验证。通过插件托管可以使用外部音频插件(如常规对象)来处理 MATLAB® 数组。通过声卡连接可以对实际音频信号和声学系统运行自定义测量。

开始:

使用声卡进行音频流式传输

连接到标准笔记本电脑和台式机声卡,以便在任何文件组合与实时输入和输出之间流式传输低延迟多声道音频。

与标准音频驱动程序之间的连接

在 Windows®、Mac® 和 Linux® 操作系统间,使用标准音频驱动程序(如 ASIO、WASAPI、CoreAudio 和 ALSA)对声卡(如 USB 或 Thunderbolt™)读取和写入音频样本。

多声道声卡。

低延迟多声道音频流式传输

在 MATLAB 中处理实时音频,双向延迟仅为毫秒级。

来自四声道麦克风阵列的实时原始输入。

机器学习和深度学习

标注、增强、创建和摄取音频和语音数据集、提取特征以及计算时频变换。使用 Statistics and Machine Learning Toolbox™、Deep Learning Toolbox™ 或其他机器学习工具开发音频和语音分析。

音频和语音特征提取

提取低级特征以便进行语音和音频分析,包括梅尔频率倒谱系数 (MFCC)、伽马通倒谱系数 (GTCC)、基音、谐度和光谱描述符。提供作用于时序的深度学习架构,如基于 LSTM 层的架构。

多词语音记录(上)的估算基音(下)。 

时频变换

使用改进型离散余弦变换 (MDCT)、短时傅立叶变换 (STFT) 或更紧凑的梅尔间隔频谱图,将信号变换为时频表示形式。使用伽马通滤波器组的感知间隔频带,分解信号。提供作用于二维数据的深度学习模型,如基于 CNN 层的模型。

语音命令的实时梅尔频谱图。

标注和创建音频数据集

创建新记录并向音频和语音数据集分配真实值 (ground-truth) 标签。使用基于云的语音到文本服务自动进行语音转录。

Audio Labeler 应用中的感兴趣区域标签。

摄取大型音频数据集

使用 audioDatastore 对大型音频记录集合进行索引编制和读取。根据标签随机拆分音频文件列表。使用 tall 数组并行处理任务,以便进行数据增强、时频变换和特征提取。

指向 Google 语音命令数据集的数据存储。

音频处理算法和效果

生成标准波形、应用常见音频效果以及设计具有动态参数调优和实时可视化的音频处理系统。

音频滤波器和均衡器

建模和应用参数 EQ、图形 EQ、倾斜和可变斜率滤波器。设计和仿真数字交叉、倍频程和分数倍频程滤波器。

具有实时可视化的三频段交叉滤波器的交互式调优。

动态范围控制和效果

建模和应用动态范围处理算法,如压缩器、限制器、扩展器和噪声门。使用递归参数模型添加人工混响。

压缩器动态响应的交互式调优。

使用模块图进行系统仿真

使用 Simulink® 的音频处理模块库设计和仿真系统模型。使用交互式控件和动态绘图来调优参数和可视化系统行为。

Simulink 中的多频带动态范围压缩器模型的详细信息。

实时音频原型设计

在 MATLAB 中使用交互式实时倾听测试验证音频处理算法。

通过用户界面进行实时参数调优

自动创建音频处理算法的可调优参数用户界面。使用 Audio Test Bench 应用测试各个算法,使用自动生成的交互式控件在程序运行过程中调优参数。

使用 Audio Test Bench 的自定义三频段参数 EQ 交互式调优。

用于参数控制和消息交换的 MIDI 连接

使用 MIDI 控制面板以交互方式更改 MATLAB 算法的参数。通过发送和接收任何类型的 MIDI 消息来控制外部硬件或响应事件。

在 MATLAB 中为乐器合成器编写的 MIDI 消息和音频信号流。

声学测量和空间音频

测量系统响应、分析和计量信号以及设计空间音频处理系统。

基于标准的计量和分析

将声压级 (SPL) 表和响度表应用于记录的信号或实时信号。使用倍频程和分数倍频程滤波器分析信号。将符合标准的 A、C 或 K 加权滤波器应用于原始记录。

可视化跨三分之二倍频程频带的不同 SPL 测量。

脉冲响应测量

使用最大长度序列 (MLS) 和指数扫描正弦曲线 (ESS) 测量声学和音频系统的脉冲和频率响应。开始使用 Impulse Response Measurer 应用。以编程方式生成激励信号和估算系统响应,自动进行测量。

 Impulse Response Measurer 应用。

具有房间脉冲响应的高效卷积

使用频率域重叠并添加或重叠并保存实施,高效地对具有长脉冲响应的信号进行卷积运算。使用自动脉冲响应分区权衡计算速度的延迟。

持续 5 秒或更长时间的脉冲响应 — 44100 Hz 时的 220k 样本。

空间音频

对不同环绕声格式进行编码和解码。插值空间采样的头部相关传输函数 (HRTF)。

在 HRTF 测量可用时,所需声音源位置和最近角度的示例。

生成和托管音频插件

对在 MATLAB 中以标准音频插件形式编写的音频处理算法进行原型设计;使用外部音频插件作为常规 MATLAB 对象。

生成音频插件

直接从 MATLAB 代码生成 VST 和其他类型的音频插件,而无需手动设计用户界面。借助 MATLAB Coder™,生成可以直接进行构建的 JUCE C++ 项目来实现更高级的插件原型设计。

多频带参数 EQ 示例:从 MATLAB 代码生成并在 REAPER 中运行的 VST 插件。

托管外部音频插件

使用外部 VST 和 AU 插件作为常规 MATLAB 对象。更改插件参数以及以编程方式处理 MATLAB 数组。或者,自动将插件参数与用户界面和 MIDI 控制相关联。托管从 MATLAB 代码生成的插件以提高执行效率。

MATLAB 中用于音频去噪的外部 VST 插件 (Accusonus ERA-N) 和编程界面的示例。

目标嵌入式和实时音频系统

使用附加 C 代码生成产品,在软件设备上实施音频处理设计并自动连接到多声道音频接口。

低成本的移动设备

使用板载或外部多声道音频接口,在 Raspberry Pi™ 上对音频处理设计进行原型设计。以移动应用的形式为 Android® 或 iOS 设备创建交互式控制面板。

Raspberry Pi 3 板。 

零延迟系统

针对自适应噪声控制、助听验证或需要最小双向 DSP 延迟的其他应用程序,对具有单样本输入和输出的音频处理设计进行原型设计。自动以 Speedgoat 音频机器和 ST Discovery 开发板为目标。直接从Simulink模型生成代码。

最新特性

AU 插件生成

在 macOS 上基于 MATLAB audioPlugin 对象生成 Audio Unit (AU) 插件

为音频插件自定义 UI

为生成的插件或 MATLAB 中的 parameterTuner 自定义 UI 控件的布局和外观

音频和语音特征提取

自动提取常用音频和语音特征,同时共享通用计算

音频数据增强

结合使用常用和自定义效果,自动生成音频和语音记录的不同版本

音调换挡时间拉伸

独立修改音频和语音记录的音调和时长之一

Audio Labeler 自动化

使用语音检测和第三方语音到文本转录服务,在 Audio Labeler 应用中对语音记录进行标签采集

关于这些特性和相应函数的详细信息,请参阅发行说明

获取免费试用版

30 天探索触手可及。

马上下载

准备购买?

获取详细价格和并探索相关产品。

您是学生吗?

获得 MATLAB 和 Simulink 学生版软件。

了解更多