第 4 章

应用有监督学习


何时考虑有监督学习

有监督学习算法采用一组已知的输入数据(训练集)和对该数据的已知响应(输出)对模型进行训练,使其能够对新输入数据的响应做出合理的预测。如果您尝试预测现有数据的输出,请使用有监督学习。

所有的有监督学习方法都可归为两种类型:分类或回归。

视频长度为 4:35

分类方法可预测离散响应 - 例如,电子邮件是真实邮件还是垃圾邮件,肿瘤是小块、中块还是大块。分类模型经过训练可将数据分成不同类别。应用包括医学成像、语音识别和信用评分。

回归方法可预测连续响应 - 例如,温度变化或电力需求波动。应用包括股价预测、笔迹识别和声信号处理。

选择合适的算法

第 1 章所述,选择机器学习算法是一个试错的过程。它也是一个权衡算法的各个具体特征的过程,这些特征包括:

  • 训练的速度
  • 内存使用量
  • 对新数据预测的准确度
  • 透明度或可解释性(您对算法预测依据的理解难易程度)

常见分类算法

常见回归算法