Main Content

本页翻译不是最新的。点击此处可查看最新英文版本。

数据的预处理

数据的清理、平滑处理和分组

数据可能需要预处理技术,以确保准确、高效或有意义的分析。数据清理指查找、删除和替换错误或缺失数据的方法。检测局部极值和突变有助于识别显著的数据趋势。平滑处理和去除趋势是从数据中消除噪声和多项式趋势的过程,而缩放则会改变数据的边界。分组和分 bin 方法按组识别数据特性。

App

数据清理器Preprocess and organize column-oriented data

实时编辑器任务

清理缺失数据在实时编辑器中查找、填充或删除缺失数据
清理离群数据在实时编辑器中查找、填充或删除离群值
按组计算Summarize, transform, or filter by group in the Live Editor
查找变化点在实时编辑器中查找数据中的突然变化
求局部极值在实时编辑器中求局部最大值和局部最小值
归一化数据Center and scale data in the Live Editor
平滑处理数据在实时编辑器中对含噪数据进行平滑处理
去趋势在实时编辑器中去除数据中的多项式趋势

函数

全部展开

anymissingDetermine if any array element is missing
ismissing查找缺失值
rmmissing删除缺失的条目
fillmissing填充缺失值
missing创建缺失值
standardizeMissing插入标准缺失值
isoutlier查找数据中的离群值
filloutliers检测并替换数据中的离群值
rmoutliers检测并删除数据中的离群值
movmad移动中位数绝对偏差
ischange查找数据中的突然变化
islocalmin计算局部最小值
islocalmax计算局部最大值
smoothdata对含噪数据进行平滑处理
movmean移动均值
movmedian移动中位数
detrend去除多项式趋势
trenddecompFind trends in data
normalize归一化数据
rescale数组元素的缩放范围
discretize将数据划分为 bin 或类别
groupcounts分组元素的数量
groupfilter按组过滤
groupsummary组汇总计算
grouptransform按组转换
histcounts直方图 bin 计数
histcounts2二元直方图 bin 计数
findgroups查找组并返回组编号
splitapply将数据划分归组并应用函数
rowfun将函数应用于表或时间表行
varfun向表或时间表变量应用函数
accumarray累加向量元素

主题