signrank

威尔科克森符号秩检验

全页折叠

语法

p = signrank(x)

p = signrank(x,y)

p = signrank(x,y,Name,Value)

[p,h] = signrank(___)

[p,h,stats] = signrank(___)

[___] = signrank(x,m)

[___] = signrank(x,m,Name,Value)

说明

p = signrank(x) 返回双侧威尔科克森符号秩检验的 p 值。

signrank 在 5% 显著性水平下检验向量 x 中的数据来自中位数为零的分布的原假设。该检验假设 x 中的数据来自关于其中位数对称的连续分布。

示例

p = signrank(x,y) 返回配对双侧检验的 p 值，它针对 x - y 来自中位数为零的分布的原假设。

示例

p = signrank(x,y,Name,Value) 返回符号秩检验的 p 值，并使用一个或多个 Name,Value 对组参量指定其他选项。

[p,h] = signrank(___) 还返回指示检验决策的逻辑值。h = 1 表示拒绝原假设，h = 0 表示未能在 5% 显著性水平上拒绝原假设。您可以使用上述语法中的任何输入参量。

[p,h,stats] = signrank(___) 还返回结构体 stats，其中包含关于检验统计量的信息。

示例

[___] = signrank(x,m) 针对 x 中的数据是来自具有中位数 m 的分布的观测值的原假设返回上述语法中的任何输出参量。

示例

[___] = signrank(x,m,Name,Value) 针对符号秩检验返回上述语法中的任何输出参量，并使用一个或多个 Name,Value 对组参量指定其他选项。

示例

全部折叠

单个总体中位数为零的检验

打开实时脚本

检验中位数为零的假设。

生成样本数据。

rng('default') % for reproducibility
x = randn(1,25) + 1.30;

检验 x 中数据的中位数为零的假设。

[p,h] = signrank(x)

p = 
3.2229e-05

h = logical
   1

在默认 5% 显著性水平下，值 h = 1 表明检验拒绝中位数为零的原假设。

检验配对样本差异的中位数

打开实时脚本

检验配对样本之间差异的中位数为零的假设。

生成样本数据。

rng('default') % for reproducibility
x = lognrnd(2,.25,10,1);
y = x + trnd(2,10,1);

检验 x - y 的中位数为零的假设。

[p,h] = signrank(x,y)

p = 
0.3223

h = logical
   0

结果表明，在默认 5% 显著性水平下，检验未能拒绝差异中中位数为零的原假设。

大样本的符号秩检验

打开实时脚本

使用逼近方法对大样本进行单侧检验。

加载样本数据。

load('gradespaired.mat');

检验参与辅导计划前后学生成绩差异的中位数为 0 的原假设，对抗备择假设中位数小于 0。

[p,h,stats] = signrank(gradespaired(:,1),...
		gradespaired(:,2),'tail','left')

p = 
0.0047

h = logical
   1

stats = struct with fields:
          zval: -2.5982
    signedrank: 2.0175e+03

由于样本大小大于 15，signrank 使用逼近方法计算 $p$ 值，并返回 $z$ 统计量的值。值 h = 1 表明检验在 5% 显著性水平下拒绝成绩中位数没有差异的原假设。有足够的统计证据表明参与辅导计划前的成绩中位数小于参与辅导计划后的成绩中位数。

使用精确方法重复检验。

[p,h,stats] = signrank(gradespaired(:,1),gradespaired(:,2),...
		'tail','left','method','exact')

p = 
0.0045

h = logical
   1

stats = struct with fields:
    signedrank: 2.0175e+03

使用逼近方法获得的结果与精确方法一致。

单个总体中位数的双侧检验

打开实时脚本

加载样本数据。

load mileage

数据包含第 1 到 3 列中三种不同类型汽车的每加仑英里数。

检验第二列中的汽车类型的中位数英里数与 33 不同的假设。

[p,h,stats] = signrank(mileage(:,2),33)

p = 
0.0312

h = logical
   1

stats = struct with fields:
    signedrank: 21

在 5% 显著性水平下，结果表明第二类汽车的中位数英里数与 33 不同。请注意，signrank 对小样本使用精确方法计算 $p$ 值，并且不返回 $z$ 统计量。

单个总体中位数的右侧检验

打开实时脚本

在 signrank 中使用名称-值对组参量。

加载样本数据。

load mileage

数据包含第 1 到 3 列中三种不同类型汽车的每加仑英里数。

检验第二行中的汽车类型的中位数英里数大于 33 的假设。

[p,h,stats] = signrank(mileage(:,2),33,'tail','right')

p = 
0.0156

h = logical
   1

stats = struct with fields:
    signedrank: 21

使用逼近方法在 1% 显著性水平下重复相同的检验。

[p,h,stats] = signrank(mileage(:,2),33,'tail','right',...
'alpha',0.01,'method','approximate')

p = 
0.0180

h = logical
   0

stats = struct with fields:
          zval: 2.0966
    signedrank: 21

h = 0 这一结果表明在 1% 显著性水平下无法拒绝原假设。

输入参数

全部折叠

`x` — 样本数据
向量

样本数据，指定为向量。

数据类型: single | double

`y` — 样本数据
向量

样本数据，指定为向量。y 必须与 x 长度相同。

数据类型: single | double

`m` — 中位数的假设值
标量

中位数的假设值，指定为标量。

示例: signrank(x,10)

数据类型: single | double

名称-值参数

全部折叠

将可选参量对组指定为 Name1=Value1,...,NameN=ValueN，其中 Name 是参量名称，Value 是对应的值。名称-值参量必须出现在其他参量之后，但对各个参量对组的顺序没有要求。

如果使用的是 R2021a 之前的版本，请使用逗号分隔每个名称和值，并用引号将 Name 引起来。

示例: 'alpha',0.01,'method','approximate','tail','right' 指定具有 1% 显著性水平的右尾有符号秩检验，它返回逼近的 p 值。

`alpha` — 显著性水平
0.05 (默认) | 0 到 1 范围内的标量值

假设检验决策的显著性水平，指定为以逗号分隔的对组，其中包含 'alpha' 和 0 到 1 范围内的一个标量值。h 的显著性水平是 100 * alpha%。

示例: 'alpha', 0.01

数据类型: double | single

`method` — `p` 的计算方法
`'exact'` | `'approximate'`

p 的计算方法，指定为由 'method' 和以下项之一组成的以逗号分隔的对组。

`'exact'`	p 值 `p` 的精确计算。当 `x`、`x` - `m` 或 `x` - `y` 中的观测值不超过 15 个且未指定 `method` 时的默认值。
`'approximate'`	计算 p 值 `p` 时的正态逼近。当 `x`、`x` - `m` 或 `x` - `y` 中的观测值超过 15 个且未指定 `'method'` 时的默认值，因为精确方法在大样本上时可能很慢。

示例: 'method','exact'

`tail` — 检验的类型
`'both'` (默认) | `'right'` | `'left'`

检验的类型，指定为以逗号分隔的对组，其中包含 'tail' 和以下项之一：

'both'

双侧假设检验，这是默认检验类型。

对于单样本检验，备择假设声明 x 中的数据来自中位数不同于 0 或 m 的连续分布。
对于双样本检验，备择假设声明 x - y 中的数据来自中位数不同于 0 的分布。

'right'

右尾假设检验。

对于单样本检验，备择假设声明 x 中的数据来自中位数大于 0 或 m 的连续分布。
对于双样本检验，备择假设声明 x - y 中的数据来自中位数大于 0 的分布。

'left'

左尾假设检验。

对于单样本检验，备择假设声明 x 中的数据来自中位数小于 0 或 m 的连续分布。
对于双样本检验，备择假设声明 x - y 中的数据来自中位数小于 0 的分布。

示例: 'tail','left'

输出参量

全部折叠

`p` — 检验的 p 值
非负标量

检验的 p 值，以 0 到 1 范围内的非负标量形式返回。p 是观测到的检验统计量与原假设下观测到的值一样极端或更极端的概率。signrank 通过将最显著的单侧值加倍来计算双侧 p 值。

`h` — 假设检验的结果
1 | 0

假设检验的结果，以逻辑值形式返回。

如果 h = 1，这表示在 100 * alpha% 显著性水平上拒绝原假设。
如果 h = 0，这表示未能在 100 * alpha% 显著性水平上拒绝原假设。

`stats` — 检验统计量
结构体

检验统计量，以结构体形式返回。存储在 stats 中的检验统计量是：

signrank:符号秩检验统计量的值。
zval:z 统计量的值（当 'method' 为 'approximate' 时计算）。

详细信息

全部折叠

威尔科克森符号秩检验

威尔科克森符号秩检验是一种非参数化检验，用于当观测值成对时的两个总体。在这种情况下，检验统计量 W 是两个样本中观测值之间正差异的秩和（即 x - y）。当您对一个样本使用检验时，W 是观测值与假设中位数值 M₀ 之间正差异的秩和（使用 signrank(x) 时为 0，使用 signrank(x,m) 时为 m）。

z 统计量

对于大样本，或当 method 是 approximate 时，signrank 函数使用 z 统计量计算 p 值，由下式给出

$z = \frac{(W - n (n + 1) / 4)}{\sqrt{\frac{n (n + 1) (2 n + 1) - t i e a d j}{24}}},$

其中 n 是差异 x – y 或 x - m 的样本大小。对于双样本情况，signrank 使用 [tie_rank,tieadj] = tiedrank(abs(diffxy),0,0,epsdiff) 来获取结值调整值 tieadj。

算法

signrank 将 x 和 y 中的 NaN 视为缺失值并忽略它们。

对于双样本情况，signrank 使用基于值 epsdiff = eps(x) + eps(y) 的容差。signrank 计算差异的绝对值（abs(d(i))，其中 d(i) = x(i) – y(i)）并将其与 epsdiff 进行比较。绝对值小于 epsdiff (abs(d(i)) < epsdiff(i)) 的值被视为结值。

参考

[1] Gibbons, J. D., and S. Chakraborti. Nonparametric Statistical Inference, 5th Ed., Boca Raton, FL: Chapman & Hall/CRC Press, Taylor & Francis Group, 2011.

[2] Hollander, M., and D. A. Wolfe. Nonparametric Statistical Methods. Hoboken, NJ: John Wiley & Sons, Inc., 1999.

版本历史记录

在 R2006a 之前推出

另请参阅

ranksum | signtest | ttest | ztest

signrank

语法

说明

示例

单个总体中位数为零的检验

检验配对样本差异的中位数

大样本的符号秩检验

单个总体中位数的双侧检验

单个总体中位数的右侧检验

输入参数

x — 样本数据 向量

y — 样本数据 向量

m — 中位数的假设值 标量

名称-值参数

alpha — 显著性水平 0.05 (默认) | 0 到 1 范围内的标量值

method — p 的计算方法 'exact' | 'approximate'

tail — 检验的类型 'both' (默认) | 'right' | 'left'

输出参量

p — 检验的 p 值 非负标量

h — 假设检验的结果 1 | 0

stats — 检验统计量 结构体

详细信息

威尔科克森符号秩检验

z 统计量

算法

参考

版本历史记录

另请参阅

`x` — 样本数据
向量

`y` — 样本数据
向量

`m` — 中位数的假设值
标量

`alpha` — 显著性水平
0.05 (默认) | 0 到 1 范围内的标量值

`method` — `p` 的计算方法
`'exact'` | `'approximate'`

`tail` — 检验的类型
`'both'` (默认) | `'right'` | `'left'`

`p` — 检验的 p 值
非负标量

`h` — 假设检验的结果
1 | 0

`stats` — 检验统计量
结构体