主要内容

数据预处理

清洗、归一化、聚合和分析数据

数据预处理是将原始数据变换为更易于分析的格式的过程。此过程可以包括清洗步骤,例如处理缺失值或平滑含噪数据。通过对数据进行清洗、组织和摘要处理,您可以识别模式、作出预测并为决策提供信息。

App

全部展开

数据清洗器Preprocess and organize column-oriented data (自 R2022a 起)

实时编辑器任务

全部展开

清洗缺失数据在实时编辑器中查找、填充或删除缺失数据
清洗离群数据在实时编辑器中查找、填充或删除离群值
平滑数据在实时编辑器中对含噪数据进行平滑处理
求局部极值在实时编辑器中求局部最大值和局部最小值
查找变化点在实时编辑器中查找数据中的突然变化
堆叠表变量在实时编辑器中将多个表变量的值合并到一个表变量中
分列表变量在实时编辑器中将一个表变量中的值分配给多个表变量
重设时间表时间在实时编辑器中重采样或聚合时间表数据
归一化数据在实时编辑器中中心化并缩放数据 (自 R2021b 起)
找出并去除趋势Find and remove polynomial or periodic trends from data in the Live Editor
透视表Summarize tabular data in pivoted table in the Live Editor (自 R2023b 起)
按组计算在实时编辑器中按组进行汇总、变换或过滤 (自 R2021b 起)

函数

全部展开

缺失值

fillmissing填充缺失条目
fillmissing2Fill missing entries in 2-D data (自 R2023a 起)
standardizeMissing插入标准缺失值
rmmissing删除缺失的条目
anymissing确定是否缺失任一数组元素 (自 R2022a 起)
ismissing查找缺失值
missing创建缺失值

离群值

filloutliers检测并替换数据中的离群值
rmoutliers检测并删除数据中的离群值
isoutlier查找数据中的离群值
clip将数据裁剪到范围 (自 R2024a 起)
isbetweenDetermine which elements are within specified range
allbetweenDetermine if all elements are within specified range (自 R2025a 起)

降噪

smoothdata对含噪数据进行平滑处理
smoothdata2 对二维含噪数据进行平滑处理 (自 R2023b 起)
movmean移动均值
movmedian移动中位数
movsum移动总和

局部极值和变化点

islocalmin计算局部最小值
islocalmin2Find local minima in 2-D data (自 R2024a 起)
islocalmax计算局部最大值
islocalmax2Find local maxima in 2-D data (自 R2024a 起)
ischange查找数据中的突然变化

采样

isuniformDetermine if vector is uniformly spaced (自 R2022b 起)
isregular确定输入时间基于时间单位或日历单位是否规则
retime重采样或聚合时间表中的数据,并解决重复或不规则时间问题

重构表

rows2varsReorient table or timetable so that rows become variables
stack将来自输入表或时间表的数据堆叠到输出表或时间表的一个变量中
unstack将来自输入表或时间表的数据分列到输出表或时间表的多个变量中

元素排序和比较

sort对数组元素排序
sortrows对矩阵行或表行进行排序
issorted确定数组是否已排序
issortedrows确定矩阵或表的行是否已排序
unique唯一值
uniquetol容差内的唯一值
alluniqueDetermine if all values are unique (自 R2025a 起)
numuniqueNumber of unique values (自 R2025a 起)
ismember查找数据的集合成员
ismembertol查找容差范围内数据的集合成员

调整大小

paddataPad data by adding elements (自 R2023b 起)
trimdataTrim data by removing elements (自 R2023b 起)
resize通过添加或删除元素调整数据大小 (自 R2023b 起)

归一化

normalize归一化数据
rescale数组元素的缩放范围

找出并去除趋势

detrend去除多项式趋势
trenddecompFind trends in data (自 R2021b 起)

分 bin

discretize将数据划分为 bin 或类别
histcounts直方图 bin 计数
histcounts2二元直方图 bin 计数

透视

pivotSummarize tabular data in pivoted table (自 R2023a 起)

摘要

summaryData summary
groupsummary组汇总计算
groupcounts分组元素的数量
groupfilter按组过滤
grouptransform按组变换
findgroups查找组并返回组编号
splitapply将数据划分归组并应用函数
accumarray累加向量元素

主题

清洗数据

去趋势

摘要

精选示例