Main Content

数据的预处理

数据的清洗、平滑处理和分组

数据可能需要预处理技术,以确保准确、高效或有意义的分析。数据清洗指查找、删除和替换错误或缺失数据的方法。检测局部极值和突变有助于识别显著的数据趋势。平滑处理和去除趋势是从数据中消除噪声和多项式趋势的过程,而缩放则会改变数据的边界。分组和分 bin 方法按组识别数据特性。

App

数据清洗器Preprocess and organize column-oriented data (自 R2022a 起)

实时编辑器任务

清洗缺失数据在实时编辑器中查找、填充或删除缺失数据 (自 R2019b 起)
清洗离群数据在实时编辑器中查找、填充或删除离群值 (自 R2019b 起)
查找变化点在实时编辑器中查找数据中的突然变化 (自 R2019b 起)
求局部极值在实时编辑器中求局部最大值和局部最小值 (自 R2019b 起)
平滑处理数据在实时编辑器中对含噪数据进行平滑处理 (自 R2019b 起)
找出并去除趋势Find and remove polynomial or periodic trends from data in the Live Editor (自 R2019b 起)
归一化数据在实时编辑器中中心化并缩放数据 (自 R2021b 起)
透视表Summarize tabular data in pivoted table in the Live Editor (自 R2023b 起)
按组计算在实时编辑器中按组进行汇总、变换或过滤 (自 R2021b 起)

函数

全部展开

anymissingDetermine if any array element is missing (自 R2022a 起)
ismissing查找缺失值
rmmissing删除缺失的条目
fillmissing填充缺失条目
fillmissing2Fill missing entries in 2-D data (自 R2023a 起)
missing创建缺失值
standardizeMissing插入标准缺失值
isoutlier查找数据中的离群值
filloutliers检测并替换数据中的离群值
rmoutliers检测并删除数据中的离群值
movmad移动中位数绝对偏差
ischange查找数据中的突然变化
islocalmin计算局部最小值
islocalmax计算局部最大值
smoothdata对含噪数据进行平滑处理
smoothdata2 Smooth noisy data in two dimensions (自 R2023b 起)
movmean移动均值
movmedian移动中位数
detrend去除多项式趋势
trenddecompFind trends in data (自 R2021b 起)
normalize归一化数据
rescale数组元素的缩放范围
discretize将数据划分为 bin 或类别
pivotSummarize tabular data in pivoted table (自 R2023a 起)
groupsummary组汇总计算
groupcounts分组元素的数量 (自 R2019a 起)
groupfilter按组过滤 (自 R2019b 起)
grouptransform按组转换
histcounts直方图 bin 计数
histcounts2二元直方图 bin 计数
findgroups查找组并返回组编号
splitapply将数据划分归组并应用函数
rowfunApply function to table or timetable rows
varfunApply function to table or timetable variables
accumarray累加向量元素

主题