第 1 章

机器学习简介


更多的数据和问题、更好的答案

机器学习算法可在数据中寻找自然模式,以生成有用的信息,帮助您做出更明智的决策和更准确的预测。每天,医疗诊断、股票交易和能源负荷预测等行业都在利用这些算法做出关键决策。媒体网站依靠机器学习算法从数百万种选择中筛选出为您推荐的歌曲或影片。零售商利用这些算法深入了解客户的购买行为。

机器臂的图片

汽车和制造业,用于预测性维护

显示升降趋势的两个相交图的图片

计算金融学,用于信用评分和算法交易

带加号的空白脸的图片

图像处理和计算机视觉,用于人脸识别和目标检测

D N A 图片

计算生物学,用于肿瘤检测、药物发现和 DNA 测序

闪电的图片

能源生产,用于价格和负荷预测

两个对话气泡的图片

自然语言处理

实际应用:

视频长度为 3:51

机器学习的工作原理

机器学习采用两种方法:有监督学习和无监督学习。有监督学习根据已知的输入和输出数据训练模型,让模型能够预测未来输出;无监督学习从输入数据中找出隐藏模式或内在结构。

如何确定使用哪种算法?

选择正确的算法看似相当困难,因为有监督和无监督机器学习算法有几十种,每种算法都使用了不同的学习方法。对于机器学习算法,没有最佳方法,也无万全之策。在一定程度上讲,找到正确的算法就是一个试错的过程,即使经验丰富的数据科学家,也无法在试用前就断言某种算法是否合适。而且,算法的选择还取决于要处理的数据大小和类型、要从数据中获得的信息以及如何运用这些信息。

  • 支持向量机
  • 判别分析
  • 朴素贝叶斯
  • 最近邻
  • 线性回归、GLM
  • SVR、GPR
  • 集成方法
  • 决策树
  • 神经网络
  • K 均值、K 中心点
  • 模糊 C 均值
  • 分层
  • 高斯混合
  • 神经网络
  • 隐马尔可夫模型

何时应该使用机器学习?

如果您遇到涉及大量数据和许多变量的复杂任务或问题,但没有现成的处理公式或方程,则可以考虑使用机器学习。例如,在以下情况中,不妨选用机器学习。

手写规则和方程过于复杂 - 例如人脸识别和语音识别。

数据性质不断变化,程序也需适应这种变化 - 例如自动交易、能源需求预测和购物趋势预测等。

任务规则不断变化 - 例如交易记录欺诈检测。