簇的可视化和计算

绘制数据簇并计算最佳簇数

聚类分析根据数据点之间的相似性将数据分组。有时数据包含自然分区，具有合适的簇数。有时数据不包含自然分区，或者自然分区未知。这种情况下，您需要确定对数据分组的最佳簇数。

要确定将数据划分为特定数目的簇的良好程度，可以使用不同的评估标准（例如间距或轮廓）来计算指标值。通过创建树状图以显示分层二叉聚类树，可以对聚类进行可视化。通过优化叶顺序，使相邻叶之间的相似度总和最大化。对于每个组中具有多个测量值的分组数据，可以基于使用多元方差分析 (MANOVA) 计算的组均值来创建树状图。

实时编辑器任务

数据聚类	Cluster data using k-means or hierarchical clustering in the Live Editor (自 R2021b 起)

函数

全部展开

簇可视化

`dendrogram`	Dendrogram plot
`optimalleaforder`	Optimal leaf ordering for hierarchical clustering
`manovacluster`	Dendrogram of group mean clusters following MANOVA
`silhouette`	Silhouette plot

簇计算

`evalclusters`	Evaluate clustering solutions
`addK`	Evaluate additional numbers of clusters
`compact`	Compact clustering evaluation object
`increaseB`	Increase reference data sets
`plot`	Plot clustering evaluation object criterion values

对象

`CalinskiHarabaszEvaluation`	Calinski-Harabasz criterion clustering evaluation object
`DaviesBouldinEvaluation`	Davies-Bouldin criterion clustering evaluation object
`GapEvaluation`	Gap criterion clustering evaluation object
`SilhouetteEvaluation`	Silhouette criterion clustering evaluation object

主题

Evaluate Optimal Number of Clusters
Identify the optimal number of clusters in a data set by using the evalclusters function.