Audio Toolbox 提供用于音频、语音和声学的信号处理和分析工具。它包括用于处理音频信号、估计声学度量、标注和增强音频数据集以及提取音频特征的算法。
您可以通过与 ASIO、CoreAudio 和其他声卡之间流式传输低延迟音频来实时运行测量或原型算法。该工具箱可让您通过图形界面或 MIDI 事件控制算法参数。您可以通过将算法转换为 VST 或音频单元插件以在外部托管应用程序中运行来验证您的算法。该工具箱还提供插件托管,让您可以使用外部音频插件处理 MATLAB 数组。
该工具箱包括支持迁移学习的预训练机器学习模型和深度学习模型。您可以将这些模型直接应用于语音和声音信号以完成高级任务,例如嵌入提取、声音分类、说话人验证、语音转录与合成、源分离以及背景噪声降低。
流式采集和播放
在 Windows®、Mac® 和 Linux® 操作系统上使用标准音频驱动程序(如 ASIO、WASAPI、CoreAudio 和 ALSA)对声卡(如 USB 或 Thunderbolt™)读取和写入音频样本。在 MATLAB 中处理实时音频,双向延迟仅为毫秒级。
人工智能在音频、语音和声学领域的应用
将最新的深度学习和机器学习模型应用于音频、语音和声学信号。使用迁移学习创建、标注和增强音频数据以调节模型。提取特征并计算时频变换。使用 Statistics and Machine Learning Toolbox 以及 Deep Learning Toolbox 开发预测模型。
音频插件创建和托管
直接从 MATLAB 代码生成 VST 插件、AU 插件和独立可执行插件,而不需要手动设计用户界面。使用外部 VST 和 AU 插件作为常规 MATLAB 对象来处理 MATLAB 数组,通过用户界面或 MIDI 控件以编程方式更改插件参数。