聚类或聚类分析是一种在机器学习和数据分析中使用的无监督学习方法,它对您的数据进行组织,以使同一组(或聚类)中的数据点彼此之间比在其他组中的数据点更相似。聚类通过揭示未标注数据的模式和趋势或对其进行预测来帮助理解大型复杂数据集。
聚类的工作原理
聚类涉及几个关键步骤,包括数据准备、定义相似性度量、选择正确的聚类算法以及评估和细化聚类。
聚类的工作原理是度量数据点之间的相似性并进行分组,使一个聚类中的数据点比在任何其他聚类中的数据具有更高的相似性度量。“相似性”的概念根据情形和数据而变化,这是无监督学习的基本原理。在聚类中可以使用各种相似性度量,包括欧几里德、概率、余弦距离和相关性。
聚类算法的类型
聚类算法大致分为两种:
- 硬聚类:每个数据点仅属于一个簇,例如常见的 k 均值方法
- 软聚类:每个数据点可以属于多个簇,例如在高斯混合模型中
现有几种聚类算法,每种聚类算法都有一种独特的数据分组方法。这些方法在机制和理想用例上有很大不同。机器学习中最常用的聚类算法类型有:
- 层次聚类通过创建聚类树来构建一个多级聚类层次结构。
- k 均值聚类根据到簇质心的距离将数据划分为 k 个不同簇。
- 高斯混合模型将簇形成为多元正态密度分量的混合。
- 基于密度的空间聚类 (DBSCAN) 将高密度区中临近的点进行组合,跟踪低密度区中的离群值。它可以处理任意非凸形状。
- 自组织映射使用学习数据的拓扑和分布的神经网络。
- 谱聚类将输入数据变换为基于图的表示形式,其中的簇比原始特征空间中的簇分离效果更好。簇的数量可以通过研究图的特征值来估计。
- 隐马尔可夫模型可用于发现序列中的模式,如生物信息学中的基因和蛋白质。
- 模糊 c 均值 (FCM) 将数据分成 N 个簇,数据集中的每个数据点在一定程度上都属于每个簇。
无监督学习的聚类
无监督学习是一种机器学习算法,可在没有人工干预的情况下从未标注数据进行推断。聚类是最常见的无监督学习方法。它应用聚类算法来探索数据并发现数据中隐藏的模式或分组,而无需事先获得任何组标签信息。使用这些组和模式,聚类帮助从未标注数据中提取有用的深入信息,并揭示其中的内在结构。
为什么聚类如此重要
聚类是人工智能的一个重要领域。它通过从数据中挖掘有价值的深入信息和揭示不太明显的模式和关系,在各个领域发挥着重要作用。对于未标注数据,数据点之间的内在关系是隐藏的,但却是揭示有用的深入信息所必需的。聚类有助于发现这些关系并将未标注数据组织成有意义的各组。
使用 MATLAB 进行聚类
使用 MATLAB® 和 Statistics and Machine Learning Toolbox™,您可以通过应用所选的聚类方法并将数据分成若干组或簇来识别模式和特征。使用 Image Processing Toolbox™,您可以对图像数据执行聚类。
数据准备
聚类算法
您也可以使用 KNN Search 模块在 Simulink 中执行最近邻聚类。该模块接受一个查询点,并使用最近邻搜索器对象返回观测数据中的 k 个最近邻点。
可视化和评估聚类结果
图像的聚类
通过根据颜色或形状的相似性对像素区域进行聚类,您可以对图像执行图像分割(使用 imsekmeans
函数)和三维体分割(使用 imsekmeans3
函数)。您可以使用特定聚类算法创建分割的标注图像。例如,在医学成像中,您可以检测并标注图像中的像素或三维体的体素,它们表示患者大脑或其他器官中的肿瘤。通过利用 MATLAB 工具,您可以为从疾病诊断到土地利用分类的广泛应用处理和分析图像。
资源
通过文档、示例、视频等拓展您的知识。
选择网站
选择网站以获取翻译的可用内容,以及查看当地活动和优惠。根据您的位置,我们建议您选择:。
您也可以从以下列表中选择网站:
如何获得最佳网站性能
选择中国网站(中文或英文)以获得最佳网站性能。其他 MathWorks 国家/地区网站并未针对您所在位置的访问进行优化。
美洲
- América Latina (Español)
- Canada (English)
- United States (English)
欧洲
- Belgium (English)
- Denmark (English)
- Deutschland (Deutsch)
- España (Español)
- Finland (English)
- France (Français)
- Ireland (English)
- Italia (Italiano)
- Luxembourg (English)
- Netherlands (English)
- Norway (English)
- Österreich (Deutsch)
- Portugal (English)
- Sweden (English)
- Switzerland
- United Kingdom (English)