电子书

第 3 章:改进训练数据的质量和数量

第 3 章

改进训练数据的质量和数量


数据中的噪声何时是有利的?当噪声能准确反映实际情况时,它就是有利的。

现有典型大数据集的记录方式与语音和声音应用的实际应用场景不太一样。如果您的应用设计为可以识别语音触发字,那么它就需要处理麦克风不好用、特定类型的混响和背景噪声等问题。

借助现有的信号处理方法和领域专用应用,可以通过以下方式人为添加上述和其他效果,以扩展训练数据集:

  • 数据增强
  • 数据合成

信号可能很难观测,信号的测量也很难保持一致,因此要构建这类大型数据集并不容易;本章将探讨创建更多训练数据的方法。数据合成可以帮助从模型或仿真中创建新信号,而数据增强是一种用于创建现有数据新变体的特种数据合成。

我们先来简要了解一下深度学习如何处理信号数据。

节

数据增强

从现有的已标注示例开始,数据增强会生成:

  • 类似于高质量验证数据的训练数据
  • 系统在真实场景中可能遇到的现有数据的变体

增强效果通常是领域特有的。音频、语音和声学数据的常用增强效果包括移动时间、音调移位、控制音量等等。

厨房声音混响

利用 MATLAB 代码处理厨房声音混响信号,以增强数据。

洗衣机噪声

利用 MATLAB 代码处理洗衣机噪声信号,以增强数据。
节

合成

数据合成包括使用 AI 生成的模型或仿真的组合,从头开始生成训练数据。

下面是一些领域专用的数据合成示例:

知识测试