簇的可视化和计算
绘制数据簇并计算最佳簇数
聚类分析根据数据点之间的相似性将数据分组。有时数据包含自然分区,具有合适的簇数。有时数据不包含自然分区,或者自然分区未知。这种情况下,您需要确定对数据分组的最佳簇数。
要确定将数据划分为特定数目的簇的良好程度,可以使用不同的评估标准(例如间距或轮廓)来计算指标值。通过创建树状图以显示分层二叉聚类树,可以对聚类进行可视化。通过优化叶顺序,使相邻叶之间的相似度总和最大化。对于每个组中具有多个测量值的分组数据,可以基于使用多元方差分析 (MANOVA) 计算的组均值来创建树状图。
函数
对象
CalinskiHarabaszEvaluation | Calinski-Harabasz criterion clustering evaluation object |
DaviesBouldinEvaluation | Davies-Bouldin criterion clustering evaluation object |
GapEvaluation | Gap criterion clustering evaluation object |
SilhouetteEvaluation | Silhouette criterion clustering evaluation object |
主题
- Cluster Evaluation
This example shows how to identify clusters by using
evalclusters
.