Main Content

本页的翻译已过时。点击此处可查看最新英文版本。

ischange

查找数据中的突然变化

说明

示例

TF = ischange(A) 返回一个逻辑数组,当 A 的对应元素的均值出现突然变化时,该逻辑数组的元素为 1 (true)。

示例

TF = ischange(A,method) 指定如何定义数据中的变化点。例如,ischange(A,'variance') 将计算 A 的元素方差的突然变化。

示例

TF = ischange(___,dim) 为上述任一语法指定 A 的运算维度。例如,ischange(A,2) 计算矩阵 A 的每一行的变化点。

示例

TF = ischange(___,Name,Value) 使用一个或多个名称-值对组参数指定用于计算变化点的其他参数。例如,ischange(A,'MaxNumChanges',m) 最多检测到 m 个变化点。

示例

[TF,S1] = ischange(___) 还返回有关变化点之间的线段的信息。例如,[TF,S1] = ischange(A) 返回包含向量 A 的变化点之间的数据均值的向量 S1

示例

[TF,S1,S2] = ischange(___) 返回有关变化点之间的线段的其他信息。例如,[TF,S1,S2] = ischange(A) 返回包含每个线段均值的向量 S1 以及包含向量 A 的每个线段方差的向量 S2

示例

全部折叠

创建一个由含噪数据组成的向量,并计算数据均值的突然变化。

A = [ones(1,5) 25*ones(1,5) 50*ones(1,5)] + rand(1,15);
TF = ischange(A)
TF = 1x15 logical array

   0   0   0   0   0   1   0   0   0   0   1   0   0   0   0

要计算变化点之间数据的均值,请指定第二个输出参数。

[TF,S1] = ischange(A);
plot(A,'*')
hold on
stairs(S1)
legend('Data','Segment Mean','Location','NW')

Figure contains an axes. The axes contains 2 objects of type line, stair. These objects represent Data, Segment Mean.

创建一个由含噪数据组成的向量,并计算数据的斜率和截距的突然变化。设置较大的检测阈值可减少由于噪声而检测到的变化点数。

A = [zeros(1,100) 1:100 99:-1:50  50*ones(1,250)] + 10*rand(1,500);
[TF,S1,S2] = ischange(A,'linear','Threshold',200);
segline = S1.*(1:500) + S2;
plot(1:500,A,1:500,segline)              
legend('Data','Linear Regime')

Figure contains an axes. The axes contains 2 objects of type line. These objects represent Data, Linear Regime.

除了提供阈值外,还可以指定要检测的最大变化点数。

[TF,S1,S2] = ischange(A,'linear','MaxNumChanges',3);

计算矩阵每一行均值的突然变化。

A = diag(25*ones(5,1)) + rand(5,5)
A = 5×5

   25.8147    0.0975    0.1576    0.1419    0.6557
    0.9058   25.2785    0.9706    0.4218    0.0357
    0.1270    0.5469   25.9572    0.9157    0.8491
    0.9134    0.9575    0.4854   25.7922    0.9340
    0.6324    0.9649    0.8003    0.9595   25.6787

TF = ischange(A,2)
TF = 5x5 logical array

   0   1   0   0   0
   0   1   1   0   0
   0   0   1   1   0
   0   0   0   1   1
   0   0   0   0   1

输入参数

全部折叠

输入数据,指定为向量、矩阵、多维数组、表或时间表。

数据类型: single | double | table | timetable

变化检测方法,指定为以下选项之一:

  • 'mean' - 计算数据均值的突然变化。

  • 'variance' - 计算数据方差的突然变化。

  • 'linear' - 计算数据的斜率和截距的突然变化。

运算维度,指定为正整数标量。默认情况下,ischange 沿其大小不为 1 的第一个维度进行运算。

例如,如果 A 是矩阵,则 ischange(A,1) 沿 A 的行进行运算,计算每一列的变化点。

ischange(A,2) 沿 A 的列进行运算,计算每一行的变化点。

数据类型: single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64

名称-值对组参数

指定可选的、以逗号分隔的 Name,Value 对组参数。Name 为参数名称,Value 为对应的值。Name 必须放在引号中。您可采用任意顺序指定多个名称-值对组参数,如 Name1,Value1,...,NameN,ValueN 所示。

示例: TF = ischange(A,'MaxNumChanges',5)
数据选项

全部折叠

样本点,指定为逗号分隔的对组,其中包含 'SamplePoints' 和一个向量。样本点代表数据在 A 中的 x 轴位置,必须为有序且包含唯一的元素。样本点不需要均匀采样。默认采样点向量是 [1 2 3 ...]

注意

当输入数据为 timetable 时,不支持此名称-值对组。时间表始终使用行时间向量作为采样点。要使用不同采样点,您必须编辑时间表,以便行时间包含所需的采样点。

示例: ischange([1 2 3 4 5 6],'linear','SamplePoints',[1 2 3 10 20 30])

数据类型: single | double | datetime | duration

要对其执行操作的表变量,指定为逗号分隔的对组,其中包含 'DataVariables' 和下表中的选项之一。'DataVariables' 值指示要检查输入表中哪些变量的变化点。与指示的变量关联的数据类型必须为 doublesingle。不会对表中未由 'DataVariables' 指定的其他变量进行操作,因此这些变量的输出包含 false 值。

选项说明示例
变量名称

指定单个表变量名称的字符向量或标量字符串

'Var1'

"Var1"

变量名称的向量

字符向量元胞数组或字符串数组,其中每个元素表示一个表变量名称

{'Var1' 'Var2'}

["Var1" "Var2"]

变量索引的标量或向量

表变量索引的标量或向量

1

[1 3 5]

逻辑向量

逻辑向量,每个元素分别对应一个表变量,其中 true 指示包括对应变量,false 指示不包括对应变量。

[true false true]

函数句柄

函数句柄,以表变量作为输入并返回逻辑标量

@isnumeric

vartype 下标

vartype 函数生成的表下标

vartype('numeric')

示例: ischange(T,'DataVariables',["Var1" "Var2" "Var4"])

变化点选项

全部折叠

变化点阈值,指定为以逗号分隔的对组,该对组由 'Threshold' 和一个非负标量组成。增大阈值使其大于 1 将产生较少的变化点。

阈值定义检测到的变化点数,如果指定了 'MaxNumChanges',则不能指定阈值。

数据类型: double | single | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64

要检测的最大变化点数,指定为以逗号分隔的对组,该对组由 'MaxNumChanges' 和一个正整数标量组成。ischange 使用自动阈值,它计算的变化点数不超过指定的变化点数,因此如果指定了 'MaxNumChanges',则不能指定 'Threshold'

数据类型: double | single | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64

输出参数

全部折叠

变化点指示符,以向量、矩阵或多维数组的形式返回。TF 的大小与 A 相同。

数据类型: logical

变化点之间的数据的均值或斜率,以向量、矩阵、多维数组、表或时间表形式返回。

  • 如果变化点检测方法为 'mean''variance',则 S1 包含每个线段的均值。

  • 如果方法为 'linear',则 S1 包含每个线段的斜率。

s1 的类型与输入数据相同。

数据类型: double | single | table | timetable

变化点之间的数据的方差或截距,以向量、矩阵、多维数组、表或时间表形式返回。

  • 如果变化点检测方法为 'mean''variance',则 S2 包含每个线段的方差。

  • 如果方法为 'linear',则 S2 包含每个线段的截距。

s2 的类型与输入数据相同。

数据类型: double | single | table | timetable

详细信息

全部折叠

变化点

数据向量 A 如果可以分成两段 A1 和 A2,并满足以下条件,则包含一个变化点:

C(A1)+C(A2)+τ<C(A).

τ 是由 'Threshold' 参数指定的阈值,C 表示代价函数。

例如,用于检测均值中的突然变化的代价函数是 C(x)=Nvar(x),其中 N 是向量 x 中的元素数。代价函数测量线段均值逼近该线段的程度。

ischange 以迭代方式使代价函数的总和最小化,以确定变化点 k 的数量和位置,使得

C(A1)+C(A2)+...+C(Ak)+kτ<C(A).

参考

[1] Killick R., P. Fearnhead, and I.A. Eckley. "Optimal detection of changepoints with a linear computational cost." Journal of the American Statistical Association. Vol. 107, Number 500, 2012, pp.1590-1598.

扩展功能

在 R2017b 中推出