决策树
决策树(包括分类树和回归树)用于预测对数据的响应。要预测响应,请遵循树中从根(开始)节点向下到叶节点的决策。叶节点包含响应。分类树给出的是名义响应,例如 'true' 或 'false'。回归树给出的是数值响应。
Statistics and Machine Learning Toolbox™ 树为二叉树结构。预测中的每一步都需要检查一个预测(变量)的值。例如,下面是一个简单的分类树:

该树基于两个预测变量 x1 和 x2 预测分类。要进行预测,请从顶部节点(以三角形 (Δ) 表示)开始。第一个决策是 x1 是否小于 0.5。如果是,则沿左分支向下,您会看到树将数据分类为类型 0。
但如果 x1 超过 0.5,则沿右分支向下到右下三角形节点。此处,树会询问 x2 是否小于 0.5。如果是,则沿左分支向下并看到树将数据分类为类型 0。如果不是,则沿右分支向下并看到树将数据分类为类型 1。
要学习如何准备数据以使用决策树进行分类或回归,请参阅Steps in Supervised Learning。
训练分类树
以下示例说明如何训练分类树。
使用整个 ionosphere 数据集创建一个分类树。
load ionosphere % Contains X and Y variables Mdl = fitctree(X,Y)
Mdl =
ClassificationTree
ResponseName: 'Y'
CategoricalPredictors: []
ClassNames: {'b' 'g'}
ScoreTransform: 'none'
NumObservations: 351
Properties, Methods
训练回归树
以下示例说明如何训练回归树。
使用 carsmall 数据集中的所有观测值创建一个回归树。将 Horsepower 和 Weight 向量视为预测变量,将 MPG 向量视为响应变量。
load carsmall % Contains Horsepower, Weight, MPG X = [Horsepower Weight]; Mdl = fitrtree(X,MPG)
Mdl =
RegressionTree
ResponseName: 'Y'
CategoricalPredictors: []
ResponseTransform: 'none'
NumObservations: 94
Properties, Methods
参考
[1] Breiman, L., J. H. Friedman, R. A. Olshen, and C. J. Stone. Classification and Regression Trees. Boca Raton, FL: Chapman & Hall, 1984.
另请参阅
fitctree | fitrtree | ClassificationTree | RegressionTree