本页对应的英文页面已更新,但尚未翻译。 若要查看最新内容,请点击此处访问英文页面。

数据的预处理

数据的清理、平滑处理和分组

数据可能需要预处理技术,以确保准确、高效或有意义的分析。数据清理指查找、删除和替换错误或缺失数据的方法。检测局部极值和突变有助于识别显著的数据趋势。平滑处理和去除趋势是从数据中消除噪声和多项式趋势的过程,而缩放则会改变数据的边界。分组和 bin 划分方法按组识别数据特性。

实时编辑器任务

清理缺失数据在实时编辑器中查找、填充或删除缺失数据
清理离群数据在实时编辑器中查找、填充或删除离群值
查找变化点在实时编辑器中查找数据中的突然变化
求局部极值在实时编辑器中求局部最大值和局部最小值
平滑处理数据在实时编辑器中对含噪数据进行平滑处理
去趋势在实时编辑器中去除数据中的多项式趋势
联接表在实时编辑器中使用键变量组合两个表

函数

全部展开

ismissing查找缺失值
rmmissing删除缺失的条目
fillmissing填充缺失值
missing创建缺失值
standardizeMissing插入标准缺失值
isoutlier查找数据中的离群值
filloutliers检测并替换数据中的离群值
rmoutliers检测并删除数据中的离群值
movmad移动中位数绝对偏差
ischange查找数据中的突然变化
islocalmin计算局部最小值
islocalmax计算局部最大值
smoothdata对含噪数据进行平滑处理
movmean移动均值
movmedian移动中位数
detrend去除多项式趋势
normalize归一化数据
rescale数组元素的缩放范围
discretize将数据划分到 bin 或类别中
groupcounts分组元素的数量
groupfilter按组筛选
groupsummary组汇总计算
grouptransform按组转换
histcounts直方图 bin 计数
histcounts2二元直方图 bin 计数
findgroups查找组并返回组编号
splitapply将数据划分归组并应用函数
rowfun将函数应用于表或时间表行
varfun向表或时间表变量应用函数
accumarray使用累加构造数组

主题

清除表中的杂乱数据和缺失数据

此示例演示了如何查找、清除和删除具有缺失数据的行。

去除数据的线性趋势

从数据中去除线性趋势。

对变量分组以拆分数据

您可以使用分组变量对数据变量进行分类。

将数据拆分为不同组并计算统计量

以下示例演示如何进行数据分组以及如何对每个组应用统计量函数。

拆分表数据变量并应用函数

以下示例演示如何进行数据变量分组以及如何对每个组应用函数。

特色示例