本页对应的英文页面已更新,但尚未翻译。 若要查看最新内容,请点击此处访问英文页面。

数据的预处理

数据的清理、平滑处理和分组

数据集可能需要预处理技术,以确保准确、高效或有意义的分析。数据清理指查找、删除和替换错误或缺失数据的方法。检测局部极值和突变有助于识别显著的数据趋势。平滑处理和去除线性趋势是从数据中消除噪声和线性趋势的过程,而缩放则会改变数据的边界。分组和划分 bin 的方法是确定数据变量之间关系的方式。

函数

全部展开

ismissing查找缺失值
rmmissing删除缺失的条目
fillmissing填充缺失值
missing创建缺失值
standardizeMissing插入标准缺失值
isoutlier查找数据中的离群值
filloutliers检测并替换数据中的离群值
rmoutliers检测并删除数据中的离群值
movmad移动中位数绝对偏差
ischange查找数据中的突然变化
islocalmin计算局部最小值
islocalmax计算局部最大值
smoothdata对含噪数据进行平滑处理
movmean移动均值
movmedian移动中位数
detrend去除线性趋势
normalize归一化数据
rescale数组元素的缩放范围
discretize将数据分组到 bin 或类别中
groupsummary组汇总计算
grouptransform按组转换
histcounts直方图 bin 计数
histcounts2二元直方图 bin 计数
findgroups查找组并返回组编号
splitapply将数据划分归组并应用函数
rowfun将函数应用于表或时间表行
varfun向表或时间表变量应用函数
accumarray使用累加构造数组

主题

MATLAB 中的缺失数据

处理数据集中的缺失值。

清除表中的杂乱数据和缺失数据

此示例演示了如何查找、清除和删除具有缺失数据的行。

数据平滑和离群值检测

消除数据中不需要的噪声或行为,并查找、填充和删除离群值。

去除数据的线性趋势

从数据中去除线性趋势。

对变量分组以拆分数据

您可以使用分组变量对数据变量进行分类。

将数据拆分为不同组并计算统计量

以下示例演示如何进行数据分组以及如何对每个组应用统计量函数。

拆分表数据变量并应用函数

以下示例演示如何进行数据变量分组以及如何对每个组应用函数。