Main Content

Statistics and Machine Learning Toolbox

使用统计信息和机器学习来分析数据并为数据建模

Statistics and Machine Learning Toolbox™ 提供了用于描述数据、分析数据以及为数据建模的函数和 App。您可以使用描述性统计量、可视化和聚类进行探索性数据分析,对数据进行概率分布拟合,生成进行蒙特卡罗模拟的随机数,以及执行假设检验。回归和分类算法允许您使用分类和回归学习器以交互方式,或使用 AutoML 以编程方式从数据做出推断并构建预测模型。

对于多维数据分析和特征提取,工具箱提供主成分分析 (PCA)、正则化、降维和特征选择方法,使您能够识别具有最佳预测能力的变量。

工具箱提供有监督、半监督和无监督的机器学习算法,包括支持向量机 (SVM)、提升决策树、k-均值和其他聚类方法。您可以应用部分依赖图和 LIME 等可解释性方法,并自动生成 C/C++ 代码用于嵌入式部署。许多工具箱算法可用于太大而无法放入内存的数据集。

Statistics and Machine Learning Toolbox 快速入门

Statistics and Machine Learning Toolbox 基础知识学习

描述性统计量和可视化

数据的导入和导出、描述性统计量、可视化

概率分布

数据频数模型、随机样本生成、参数估计

假设检验

t 检验、F 检验、卡方拟合优度检验等

聚类分析和建立分类模型检测

无监督学习方法,用于查找数据中的自然分组、模式和异常

ANOVA

方差与协方差分析、多元 ANOVA、重复测量 ANOVA

回归

有监督学习的线性、广义线性、非线性和非参数化方法

分类

用于二类问题和多类问题的有监督和半监督学习算法

降维和特征提取

PCA、因子分析、特征选择、特征提取等

工业统计

试验设计 (DOE);生存和可靠性分析;统计过程控制

使用 tall 数组的大数据分析

分析无法放入内存的数据

加快统计计算速度

统计函数的并行计算或分布式计算

代码生成

为 Statistics and Machine Learning Toolbox 函数生成 C/C++ 代码和 MEX 函数

统计和机器学习应用

将统计和机器学习方法应用于行业特定的工作流