Statistics and Machine Learning Toolbox

 

Statistics and Machine Learning Toolbox

使用统计与机器学习进行数据分析及建模

Statistics and Machine Learning Toolbox™ 提供了一系列函数和 App,可用于数据描述、分析和建模。您可以使用描述性统计量、可视化和聚类进行探索性数据分析;对数据进行概率分布拟合;生成用于蒙特卡罗模拟的随机数,以及执行假设检验。借助工具箱提供的回归和分类算法,您可以基于数据进行推断并构建预测模型;您既可选择分类学习器和回归学习器进行交互式操作,也可使用 AutoML 以编程方式操作。

针对多维数据分析和特征提取,此工具箱提供了主成分分析 (PCA)、正则化、降维和特征选择方法,让您能够识别预测能力最强的变量。

此工具箱提供了有监督、半监督和无监督机器学习算法,包括支持向量机 (SVM)、提升决策树、浅层神经网络、k 均值和其他聚类方法。您可以应用可解释性方法(例如部分依赖图、Shapley 值和 LIME),并自动生成 C/C++ 代码以进行嵌入式部署。原生 Simulink 模块支持您将预测模型用于仿真和基于模型的设计。对于那些无法存储到内存的大型数据集,该工具箱中的许多算法同样适用。

描述性统计量和可视化

使用包含交互式可视图形的统计绘图和描述性统计量来探查数据。使用描述性统计量(包括有关集中趋势、散度、形状、相关性和协方差的度量)快速理解和描述潜在的大型数据集。

聚类分析

通过应用 k 均值、分层、DBSCAN 以及其他聚类方法识别模式和特征,并将数据分成组或簇,。使用不同评估标准确定数据的最佳簇数。检测异常以识别离群值和新奇值。

方差分析

将样本方差指定给不同的源,然后确定方差产生于总体组内还是组间。使用单因素、双因素、多因素、多变量和非参数化方差分析,以及协方差分析 (ANOCOVA) 和重复测量方差分析 (RANOVA)。

回归

使用回归学习器或以编程方式训练和评估模型,如线性回归、高斯过程、支持向量机、神经网络和集成。

分类

使用分类学习器或以编程方式训练和验证模型,如逻辑回归、支持向量机、提升树和浅层神经网络。

降维和特征提取

从图像、信号、文本和数值数据中提取特征。以迭代方式探查和创建新特征,并选择有助于优化性能的特征。通过以下方法降维:将现有特征变换为新的预测变量并丢弃变幻后描述性较弱的特征,或使用自动特征选择。

概率分布

进行连续和离散概率分布拟合,使用统计绘图来评估拟合优度,计算 40 多种不同分布的概率密度函数和累积分布函数。

假设检验

根据一个样本的统计证据推断总体。对单个、成对或独立样本进行 t 检验、分布检验和非参数化检验。检验自动校正和随机性,并比较分布。

工业统计

用统计方法分析影响和数据趋势。设计试验,就如何操作数据输入创建实用的计划并加以测试,获取有关计划对数据输出所产生影响的信息。可视化和分析删失与未删失故障时间数据,监控和评估工业过程的质量。

采用 tall 数组的大数据分析

在多种分类、回归和聚类算法中运用 Tall 数组和 Tall 表,以便基于无法放入内存的数据集训练模型,而无需更改代码。

代码生成

生成可移植和可读的 C/C++ 代码,用于推断分类和回归模型、描述性统计量和概率分布。生成降精度的 C/C++ 预测代码,并在不重新生成预测代码的情况下更新已部署模型的参数。

获取免费试用版

30 天探索触手可及。


准备购买?

获取报价并了解相关产品。

您是学生吗?

获得 MATLAB 和 Simulink 学生版软件。