数据的预处理
数据的清洗、平滑处理和分组
数据可能需要预处理技术,以确保准确、高效或有意义的分析。数据清洗指查找、删除和替换错误或缺失数据的方法。检测局部极值和突变有助于识别显著的数据趋势。平滑处理和去除趋势是从数据中消除噪声和多项式趋势的过程,而缩放则会改变数据的边界。分组和分 bin 方法按组识别数据特性。
App
数据清洗器 | Preprocess and organize column-oriented data (自 R2022a 起) |
实时编辑器任务
清洗缺失数据 | 在实时编辑器中查找、填充或删除缺失数据 (自 R2019b 起) |
清洗离群数据 | 在实时编辑器中查找、填充或删除离群值 (自 R2019b 起) |
按组计算 | 在实时编辑器中按组进行汇总、变换或过滤 (自 R2021b 起) |
查找变化点 | 在实时编辑器中查找数据中的突然变化 (自 R2019b 起) |
求局部极值 | 在实时编辑器中求局部最大值和局部最小值 (自 R2019b 起) |
归一化数据 | 在实时编辑器中中心化并缩放数据 (自 R2021b 起) |
平滑处理数据 | 在实时编辑器中对含噪数据进行平滑处理 (自 R2019b 起) |
找出并去除趋势 | Find and remove polynomial or periodic trends from data in the Live Editor (自 R2019b 起) |
函数
主题
- 清除表中的杂乱数据和缺失数据
使用标准化、填充或删除缺失值的函数来清洗含有缺失数据值的表。使用对行排序和移动变量的函数重新组织表。
- 对变量分组以拆分数据
您可以使用分组变量对数据变量进行分类。
- 将数据拆分为不同组并计算统计量
以下示例演示如何进行数据分组以及如何对每个组应用统计量函数。
- Perform Calculations by Group in Table
Specify groups of data in tables and timetables, and perform calculations by group. Choose a function for group calculations using these recommendations.