主要内容

决策树

决策树(包括分类树和回归树)用于预测对数据的响应。要预测响应,请遵循树中从根(开始)节点向下到叶节点的决策。叶节点包含响应。分类树给出的是名义响应,例如 'true''false'。回归树给出的是数值响应。

Statistics and Machine Learning Toolbox™ 树为二叉树结构。预测中的每一步都需要检查一个预测(变量)的值。例如,下面是一个简单的分类树:

Simple classification tree

该树基于两个预测变量 x1x2 预测分类。要进行预测,请从顶部节点(以三角形 (Δ) 表示)开始。第一个决策是 x1 是否小于 0.5。如果是,则沿左分支向下,您会看到树将数据分类为类型 0

但如果 x1 超过 0.5,则沿右分支向下到右下三角形节点。此处,树会询问 x2 是否小于 0.5。如果是,则沿左分支向下并看到树将数据分类为类型 0。如果不是,则沿右分支向下并看到树将数据分类为类型 1

要学习如何准备数据以使用决策树进行分类或回归,请参阅Steps in Supervised Learning

训练分类树

以下示例说明如何训练分类树。

使用整个 ionosphere 数据集创建一个分类树。

load ionosphere % Contains X and Y variables
Mdl = fitctree(X,Y)
Mdl = 
  ClassificationTree
             ResponseName: 'Y'
    CategoricalPredictors: []
               ClassNames: {'b'  'g'}
           ScoreTransform: 'none'
          NumObservations: 351


  Properties, Methods

训练回归树

以下示例说明如何训练回归树。

使用 carsmall 数据集中的所有观测值创建一个回归树。将 HorsepowerWeight 向量视为预测变量,将 MPG 向量视为响应变量。

load carsmall % Contains Horsepower, Weight, MPG
X = [Horsepower Weight];

Mdl = fitrtree(X,MPG)
Mdl = 
  RegressionTree
             ResponseName: 'Y'
    CategoricalPredictors: []
        ResponseTransform: 'none'
          NumObservations: 94


  Properties, Methods

参考

[1] Breiman, L., J. H. Friedman, R. A. Olshen, and C. J. Stone. Classification and Regression Trees. Boca Raton, FL: Chapman & Hall, 1984.

另请参阅

| | |

主题