Main Content

本页的翻译已过时。点击此处可查看最新英文版本。

簇的可视化和计算

绘制数据簇并计算最佳簇数

聚类分析根据数据点之间的相似性将数据分组。有时数据包含自然分区,具有合适的簇数。有时数据不包含自然分区,或者自然分区未知。这种情况下,您需要确定对数据分组的最佳簇数。

要确定将数据划分为特定数目的簇的良好程度,可以使用不同的评估标准(例如间距或轮廓)来计算指标值。通过创建树状图以显示分层二叉聚类树,可以对聚类进行可视化。通过优化叶顺序,使相邻叶之间的相似度总和最大化。对于每个组中具有多个测量值的分组数据,可以基于使用多元方差分析 (MANOVA) 计算的组均值来创建树状图。

函数

全部展开

dendrogramDendrogram plot
optimalleaforderOptimal leaf ordering for hierarchical clustering
manovaclusterDendrogram of group mean clusters following MANOVA
silhouetteSilhouette plot
evalclustersEvaluate clustering solutions
addKEvaluate additional numbers of clusters
compactCompact clustering evaluation object
increaseBIncrease reference data sets
plot Plot clustering evaluation object criterion values

CalinskiHarabaszEvaluationCalinski-Harabasz criterion clustering evaluation object
DaviesBouldinEvaluationDavies-Bouldin criterion clustering evaluation object
GapEvaluationGap criterion clustering evaluation object
SilhouetteEvaluationSilhouette criterion clustering evaluation object

主题

Cluster Evaluation

This example shows how to identify clusters by using evalclusters.