Statistics and Machine Learning Toolbox 提供了一系列函数和 App,可用于数据描述、分析和建模。您可以使用描述性统计量、可视化和聚类进行探索性数据分析;对数据进行概率分布拟合;生成用于蒙特卡罗模拟的随机数,以及执行假设检验。借助工具箱提供的回归和分类算法,您可以基于数据进行推断并构建预测模型;您既可选择分类学习器和回归学习器进行交互式操作,也可使用 AutoML 以编程方式操作。
针对多维数据分析和特征提取,此工具箱提供了主成分分析 (PCA)、正则化、降维和特征选择方法,让您能够识别预测能力最强的变量。
此工具箱提供了有监督、半监督和无监督机器学习算法,包括支持向量机 (SVM)、提升决策树、浅层神经网络、k 均值和其他聚类方法。您可以应用可解释性方法(例如部分依赖图、Shapley 值和 LIME),并自动生成 C/C++ 代码以进行嵌入式部署。原生 Simulink 模块支持您将预测模型用于仿真和基于模型的设计。对于那些无法存储到内存的大型数据集,该工具箱中的许多算法同样适用。
采用 tall 数组的大数据分析
在多种分类、回归和聚类算法中运用 Tall 数组和 Tall 表,以便基于无法放入内存的数据集训练模型,而无需更改代码。