Statistics and Machine Learning Toolbox

Statistics and Machine Learning Toolbox

使用统计与机器学习进行数据分析及建模

有疑问吗？联系销售.

Statistics and Machine Learning Toolbox 提供了一系列函数和 App，可用于数据描述、分析和建模。您可以使用描述性统计量、可视化和聚类进行探索性数据分析；对数据进行概率分布拟合；生成用于蒙特卡罗模拟的随机数，以及执行假设检验。借助工具箱提供的回归和分类算法，您可以基于数据进行推断并构建预测模型；您既可选择分类学习器和回归学习器进行交互式操作，也可使用 AutoML 以编程方式操作。

针对多维数据分析和特征提取，此工具箱提供了主成分分析 (PCA)、正则化、降维和特征选择方法，让您能够识别预测能力最强的变量。

此工具箱提供了有监督、半监督和无监督机器学习算法，包括支持向量机 (SVM)、提升决策树、浅层神经网络、k 均值和其他聚类方法。您可以应用可解释性方法（例如部分依赖图、Shapley 值和 LIME），并自动生成 C/C++ 代码以进行嵌入式部署。原生 Simulink 模块支持您将预测模型用于仿真和基于模型的设计。对于那些无法存储到内存的大型数据集，该工具箱中的许多算法同样适用。

使用多维散点图表现各变量之间的关系。

描述性统计量和可视化

使用包含交互式可视图形的统计绘图和描述性统计量来探查数据。使用描述性统计量（包括有关集中趋势、散度、形状、相关性和协方差的度量）快速理解和描述潜在的大型数据集。

文档 | 示例

用 MATLAB 进行聚类分析。

聚类分析

通过应用 k 均值、分层、DBSCAN 以及其他聚类方法识别模式和特征，并将数据分成组或簇，。使用不同评估标准确定数据的最佳簇数。检测异常以识别离群值和新奇值。

文档 | 示例

使用多因素方差分析检验多个组。

方差分析

将样本方差指定给不同的源，然后确定方差产生于总体组内还是组间。使用单因素、双因素、多因素、多变量和非参数化方差分析，以及协方差分析 (ANOCOVA) 和重复测量方差分析 (RANOVA)。

文档 | 示例

使用回归学习器交互式拟合回归模型。

回归

使用回归学习器或以编程方式训练和评估模型，如线性回归、高斯过程、支持向量机、神经网络和集成。

文档 | 示例

使用分类学习器以交互方式进行分类模型拟合。

分类

使用分类学习器或以编程方式训练和验证模型，如逻辑回归、支持向量机、提升树和浅层神经网络。

文档 | 示例

NCA 有助于选择可最大程度保留模型准确度的特征。

降维和特征提取

从图像、信号、文本和数值数据中提取特征。以迭代方式探查和创建新特征，并选择有助于优化性能的特征。通过以下方法降维：将现有特征变换为新的预测变量并丢弃变幻后描述性较弱的特征，或使用自动特征选择。

文档 | 示例

概率分布图

概率分布

进行连续和离散概率分布拟合，使用统计绘图来评估拟合优度，计算 40 多种不同分布的概率密度函数和累积分布函数。

文档 | 示例

单侧 t 检验中的拒绝域。

假设检验

根据一个样本的统计证据推断总体。对单个、成对或独立样本进行 t 检验、分布检验和非参数化检验。检验自动校正和随机性，并比较分布。

文档 | 示例

显示缺失值的故障数据图。

工业统计

用统计方法分析影响和数据趋势。设计试验，就如何操作数据输入创建实用的计划并加以测试，获取有关计划对数据输出所产生影响的信息。可视化和分析删失与未删失故障时间数据，监控和评估工业过程的质量。

文档 | 示例

MATLAB tall 数组应用实例。

采用 tall 数组的大数据分析

在多种分类、回归和聚类算法中运用 Tall 数组和 Tall 表，以便基于无法放入内存的数据集训练模型，而无需更改代码。

文档 | 示例

两个部署途径：生成 C 代码或编译 MATLAB 代码。

代码生成

生成可移植和可读的 C/C++ 代码，用于推断分类和回归模型、描述性统计量和概率分布。生成降精度的 C/C++ 预测代码，并在不重新生成预测代码的情况下更新已部署模型的参数。

文档 | 示例

产品资源：

文档示例视频要求发行说明

免费试用 Statistics and Machine Learning Toolbox

立即探索各种可能。

立即开始

准备购买？

获取报价并了解相关产品。

查看定价联系销售人员

您是学生吗？

您的学校可能已拥有 Campus-Wide License 并允许您直接使用 MATLAB、Simulink 和其他附加产品。