Statistics and Machine Learning Toolbox
使用统计信息和机器学习来分析数据并为数据建模
Statistics and Machine Learning Toolbox™ 提供了用于描述数据、分析数据以及为数据建模的函数和 App。您可以使用描述性统计量、可视化和聚类进行探索性数据分析,对数据进行概率分布拟合,生成进行蒙特卡罗模拟的随机数,以及执行假设检验。回归和分类算法允许您使用分类和回归学习器以交互方式,或使用 AutoML 以编程方式从数据做出推断并构建预测模型。
对于多维数据分析和特征提取,工具箱提供主成分分析 (PCA)、正则化、降维和特征选择方法,使您能够识别具有最佳预测能力的变量。
工具箱提供有监督、半监督和无监督的机器学习算法,包括支持向量机 (SVM)、提升决策树、k-均值和其他聚类方法。您可以应用部分依赖图和 LIME 等可解释性方法,并自动生成 C/C++ 代码用于嵌入式部署。许多工具箱算法可用于太大而无法放入内存的数据集。
Statistics and Machine Learning Toolbox 快速入门
Statistics and Machine Learning Toolbox 基础知识学习
描述性统计量和可视化
数据的导入和导出、描述性统计量、可视化
概率分布
数据频数模型、随机样本生成、参数估计
假设检验
t 检验、F 检验、卡方拟合优度检验等
聚类分析和建立分类模型检测
无监督学习方法,用于查找数据中的自然分组、模式和异常
ANOVA
方差与协方差分析、多元 ANOVA、重复测量 ANOVA
回归
有监督学习的线性、广义线性、非线性和非参数化方法
分类
用于二类问题和多类问题的有监督和半监督学习算法
降维和特征提取
PCA、因子分析、特征选择、特征提取等
工业统计
试验设计 (DOE);生存和可靠性分析;统计过程控制
使用 tall 数组的大数据分析
分析无法放入内存的数据
加快统计计算速度
统计函数的并行计算或分布式计算
代码生成
为 Statistics and Machine Learning Toolbox 函数生成 C/C++ 代码和 MEX 函数
统计和机器学习应用
将统计和机器学习方法应用于行业特定的工作流