corrcoef

语法

R = corrcoef(A)

R = corrcoef(A,B)

[R,P] = corrcoef(___)

[R,P,RL,RU] = corrcoef(___)

___ = corrcoef(___,Name,Value)

说明

R = corrcoef(A) 返回 A 的相关系数的矩阵，其中 A 的列表示随机变量，行表示观测值。

示例

R = corrcoef(A,B) 返回两个随机变量 A 和 B 之间的系数。

示例

[R,P] = corrcoef(___) 返回相关系数的矩阵和 p 值矩阵，用于测试观测到的现象之间没有关系的假设（原假设）。此语法可与上述语法中的任何参量结合使用。如果 P 的非对角线元素小于显著性水平（默认值为 0.05），则 R 中的相应相关性被视为显著。如果 R 包含复数元素，则此语法无效。

示例

[R,P,RL,RU] = corrcoef(___) 包括矩阵，这些矩阵包含每个系数的 95% 置信区间的下界和上界。如果 R 包含复数元素，则此语法无效。

示例

___ = corrcoef(___,Name,Value) 在上述语法的基础上，通过一个或多个 Name,Value 对组参量指定其他选项以返回任意输出参量。例如，corrcoef(A,'Alpha',0.1) 指定 90% 置信区间，corrcoef(A,'Rows','complete') 省略 A 的包含一个或多个 NaN 值的所有行。

示例

全部折叠

矩阵的随机列

打开实时脚本

计算一个矩阵的相关系数，该矩阵具有两个正态分布的随机列，其中一个列依据另一个列来定义。由于 A 的第三个列是第二个列的倍数，这两个变量直接相关，因此 R 的 (2,3) 和 (3,2) 元的相关系数为 1。

x = randn(6,1);
y = randn(6,1);
A = [x y 2*y+3];
R = corrcoef(A)

R = 3×3

    1.0000   -0.6237   -0.6237
   -0.6237    1.0000    1.0000
   -0.6237    1.0000    1.0000

两个随机变量

打开实时脚本

计算两个正态分布的随机向量（其中每个包含 10 个观测值）之间的相关系数矩阵。

A = randn(10,1);
B = randn(10,1);
R = corrcoef(A,B)

R = 2×2

    1.0000    0.4518
    0.4518    1.0000

矩阵的 P 值

打开实时脚本

计算一个正态分布的随机矩阵的相关系数和 p 值，其中添加的第四列等于其他三列之和。由于 A 的最后一列是其他列的线性组合，第四个变量与其他三个变量中的每一个之间建立了相关性。因此，P 的第四行和第四列包含非常小的 p 值，将其标识为显著相关。

A = randn(50,3);       
A(:,4) = sum(A,2); 
[R,P] = corrcoef(A)

R = 4×4

    1.0000    0.1135    0.0879    0.7314
    0.1135    1.0000   -0.1451    0.5082
    0.0879   -0.1451    1.0000    0.5199
    0.7314    0.5082    0.5199    1.0000

P = 4×4

    1.0000    0.4325    0.5438    0.0000
    0.4325    1.0000    0.3146    0.0002
    0.5438    0.3146    1.0000    0.0001
    0.0000    0.0002    0.0001    1.0000

`NaN` 值

打开实时脚本

创建一个包括 NaN 值的正态分布矩阵，并计算相关系数矩阵，但排除包含 NaN 的任何行。

A = randn(5,3);
A(1,3) = NaN;
A(3,2) = NaN;
A

A = 5×3

    0.5377   -1.3077       NaN
    1.8339   -0.4336    3.0349
   -2.2588       NaN    0.7254
    0.8622    3.5784   -0.0631
    0.3188    2.7694    0.7147

R = corrcoef(A,'Rows','complete')

R = 3×3

    1.0000   -0.8506    0.8222
   -0.8506    1.0000   -0.9987
    0.8222   -0.9987    1.0000

使用 'all' 以在计算中包含所有 NaN 值。

R = corrcoef(A,'Rows','all')

R = 3×3

     1   NaN   NaN
   NaN   NaN   NaN
   NaN   NaN   NaN

使用 'pairwise' 以在成对基础上计算每个两列相关系数。如果两列中的一列包含一个 NaN，该行将被忽略。

R = corrcoef(A,'Rows','pairwise')

R = 3×3

    1.0000   -0.3388    0.4649
   -0.3388    1.0000   -0.9987
    0.4649   -0.9987    1.0000

输入参数

全部折叠

`A` — 输入数组
矩阵

输入数组，指定为矩阵。

如果 A 是标量，则 corrcoef(A) 返回 NaN。
如果 A 是向量，则 corrcoef(A) 返回 1。

数据类型: single | double
复数支持: 是

`B` — 其他输入数组
向量 | 矩阵 | 多维数组

其他输入数组，指定为向量、矩阵或多维数组。

A 和 B 的大小必须相同。
如果 A 和 B 是标量，则 corrcoef(A,B) 返回 1。然而，如果 A 和 B 相等，则 corrcoef(A,B) 返回 NaN。
如果 A 和 B 是矩阵或多维数组，则 corrcoef(A,B) 将每个输入转换为其向量表示形式，等效于 corrcoef(A(:),B(:)) 或 corrcoef([A(:) B(:)])。
如果 A 和 B 是 0×0 空数组，corrcoef(A,B) 返回一个 NaN 值的 2×2 矩阵。

数据类型: single | double
复数支持: 是

名称-值参数

全部折叠

以 Name1=Value1,...,NameN=ValueN 的形式指定可选参量对组，其中 Name 是参量名称，Value 是对应的值。名称-值参量必须出现在其他参量之后，但对各个参量对组的顺序没有要求。

在 R2021a 之前，使用逗号分隔每个名称和值，并用引号将 Name 引起来。

示例: R = corrcoef(A,'Alpha',0.03)

`Alpha` — 显著性水平
0.05 (默认) | 介于 0 和 1 之间的数字

显著性水平，指定为一个 0 到 1 之间的数值。'Alpha' 参数的值为相关系数定义百分比置信水平，即 100*(1-Alpha)%，用来确定 RL 和 RU 中的边界。

数据类型: single | double

`Rows` — 使用 `NaN` 选项
`'all'` (默认) | `'complete'` | `'pairwise'`

使用 NaN 选项，指定为下列值之一：

'all' - 计算相关系数时将输入中的所有 NaN 值纳入在内。
'complete' - 计算相关系数时忽略输入中任何包含 NaN 值的行。此选项始终返回一个半正定矩阵。
'pairwise' - 对于每个两列相关系数计算，忽略任何仅包含成对 NaN 的行。此选项可返回非半正定矩阵。

数据类型: char

输出参量

全部折叠

`R` — 相关系数
矩阵

`P` — P 值
矩阵

P 值，以矩阵形式返回。P 是对称的，且大小与 R 相同。对角线元素全部为 1，非对角线元素是每个变量对组的 p 值。P 值的范围是从 0 到 1，其中接近 0 的值对应于 R 中的显著相关性，表示观测到原假设情况的概率较低。

有关确定哪些相关性为显著的详细信息，请参阅Identify and Visualize Correlated Variables。

`RL` — 相关系数的下界
矩阵

相关系数的下界，以矩阵形式返回。RL 是对称的，且大小与 R 相同。对角线元素全部为 1，非对角线元素是 R 中相应系数的 95% 置信区间下界。如果 R 包含复数值，则返回 RL 的语法无效。

`RU` — 相关系数的上界
矩阵

相关系数的上界，以矩阵形式返回。RU 是对称的，且大小与 R 相同。对角线元素全部为 1，非对角线元素是 R 中相应系数的 95% 置信区间上界。如果 R 包含复数值，则返回 RL 的语法无效。

详细信息

全部折叠

参考

[1] Fisher, R.A. Statistical Methods for Research Workers, 13th Ed., Hafner, 1958.

[2] Kendall, M.G. The Advanced Theory of Statistics, 4th Ed., Macmillan, 1979.

[3] Press, W.H., Teukolsky, S.A., Vetterling, W.T., and Flannery, B.P. Numerical Recipes in C, 2nd Ed., Cambridge University Press, 1992.

扩展功能

全部展开

tall 数组
对行数太多而无法放入内存的数组进行计算。

corrcoef 函数支持 tall 数组，但存在以下使用说明和限制：

A 和 B 必须是相同大小的 tall 数组，即使两个数组均为向量亦如此。
corrcoef(A,B) 的输入 A 和 B 不能为标量。
第二个输入 B 必须为二维。
不支持 'pairwise' 选项。

有关详细信息，请参阅 tall 数组。

C/C++ 代码生成
使用 MATLAB® Coder™ 生成 C 代码和 C++ 代码。

用法说明和限制：

仅当前两个输入都是向量和非标量时，才支持行向量输入。

基于线程的环境
使用 MATLAB® `backgroundPool` 在后台运行代码或使用 Parallel Computing Toolbox™ `ThreadPool` 加快代码运行速度。

此函数完全支持基于线程的环境。有关详细信息，请参阅在基于线程的环境中运行 MATLAB 函数。

GPU 数组
通过使用 Parallel Computing Toolbox™ 在图形处理单元 (GPU) 上运行来加快代码执行。

corrcoef 函数完全支持 GPU 数组。要在 GPU 上运行该函数，请将输入数据指定为 gpuArray (Parallel Computing Toolbox)。有关详细信息，请参阅在 GPU 上运行 MATLAB 函数 (Parallel Computing Toolbox)。

分布式数组
使用 Parallel Computing Toolbox™ 在集群的组合内存中对大型数组进行分区。

此函数完全支持分布式数组。有关详细信息，请参阅使用分布式数组运行 MATLAB 函数 (Parallel Computing Toolbox)。

版本历史记录

在 R2006a 之前推出

另请参阅

主题

Identify and Visualize Correlated Variables

corrcoef

语法

说明

示例

矩阵的随机列

两个随机变量

矩阵的 P 值

相关性边界

NaN 值

输入参数

A — 输入数组 矩阵

B — 其他输入数组 向量 | 矩阵 | 多维数组

名称-值参数

Alpha — 显著性水平 0.05 (默认) | 介于 0 和 1 之间的数字

Rows — 使用 NaN 选项 'all' (默认) | 'complete' | 'pairwise'

输出参量

R — 相关系数 矩阵

P — P 值 矩阵

RL — 相关系数的下界 矩阵

RU — 相关系数的上界 矩阵

详细信息

相关系数

参考

扩展功能

tall 数组 对行数太多而无法放入内存的数组进行计算。

C/C++ 代码生成 使用 MATLAB® Coder™ 生成 C 代码和 C++ 代码。

基于线程的环境 使用 MATLAB® backgroundPool 在后台运行代码或使用 Parallel Computing Toolbox™ ThreadPool 加快代码运行速度。

GPU 数组 通过使用 Parallel Computing Toolbox™ 在图形处理单元 (GPU) 上运行来加快代码执行。

分布式数组 使用 Parallel Computing Toolbox™ 在集群的组合内存中对大型数组进行分区。

版本历史记录

另请参阅

主题

`NaN` 值

`A` — 输入数组
矩阵

`B` — 其他输入数组
向量 | 矩阵 | 多维数组

`Alpha` — 显著性水平
0.05 (默认) | 介于 0 和 1 之间的数字

`Rows` — 使用 `NaN` 选项
`'all'` (默认) | `'complete'` | `'pairwise'`

`R` — 相关系数
矩阵

`P` — P 值
矩阵

`RL` — 相关系数的下界
矩阵

`RU` — 相关系数的上界
矩阵

tall 数组
对行数太多而无法放入内存的数组进行计算。

C/C++ 代码生成
使用 MATLAB® Coder™ 生成 C 代码和 C++ 代码。

基于线程的环境
使用 MATLAB® `backgroundPool` 在后台运行代码或使用 Parallel Computing Toolbox™ `ThreadPool` 加快代码运行速度。

GPU 数组
通过使用 Parallel Computing Toolbox™ 在图形处理单元 (GPU) 上运行来加快代码执行。

分布式数组
使用 Parallel Computing Toolbox™ 在集群的组合内存中对大型数组进行分区。