Main Content

本页翻译不是最新的。点击此处可查看最新英文版本。

ttest2

双样本 t 检验

说明

示例

h = ttest2(x,y) 使用双样本 t 检验返回原假设的检验决策,该原假设假定向量 xy 中的数据来自均值相等、方差相同但未知的正态分布的独立随机样本。备择假设是 xy 中的数据来自均值不相等的总体。如果检验在 5% 的显著性水平上拒绝原假设,则结果 h1,否则为 0

示例

h = ttest2(x,y,Name,Value) 返回针对双样本 t 的检验决策,该检验使用由一个或多个名称-值对组参数指定的附加选项。例如,您可以更改显著性水平或进行无需假设方差齐性的检验。

示例

[h,p] = ttest2(___) 还使用上述语法中的任何输入参数返回检验的 p 值 p

示例

[h,p,ci,stats] = ttest2(___) 还返回总体均值差的置信区间 ci,以及包含检验统计量信息的结构体 stats

示例

全部折叠

加载数据集。创建包含数据矩阵第一列和第二列的向量,以表示学生在两次考试中的成绩。

load examgrades
x = grades(:,1);
y = grades(:,2);

检验原假设,即两个数据样本来自均值相等的总体。

[h,p,ci,stats] = ttest2(x,y)
h = 0
p = 0.9867
ci = 2×1

   -1.9438
    1.9771

stats = struct with fields:
    tstat: 0.0167
       df: 238
       sd: 7.7084

返回值 h = 0 表明 ttest2 在默认的 5% 显著性水平上未拒绝原假设。

加载数据集。创建包含数据矩阵第一列和第二列的向量,以表示学生在两次考试中的成绩。

load examgrades
x = grades(:,1);
y = grades(:,2);

检验原假设,即两个数据向量来自均值相等的总体,而不假设总体还具有方差齐性。

[h,p] = ttest2(x,y,'Vartype','unequal')
h = 0
p = 0.9867

返回值 h = 0 表明 ttest2 在默认的 5% 显著性水平上未拒绝原假设,即使没有假设方差齐性也是如此。

加载样本数据。创建一个分类向量,根据车辆年份标注车辆里程数据。

load carbig.mat;

decade = categorical(Model_Year < 80,[true,false],["70s","80s"]);

创建每十年的里程数据的箱线图。

boxchart(decade,MPG)
xlabel("Decade")
ylabel("Mileage")

Figure contains an axes object. The axes object with xlabel Decade, ylabel Mileage contains an object of type boxchart.

根据每十年的里程数据创建向量。使用左尾双样本 t 检验来检验原假设,即数据来自均值相等的总体。使用备择假设,即 20 世纪 70 年代生产的汽车里程的总体均值小于 20 世纪 80 年代生产的汽车里程的总体均值。

MPG70s = MPG(decade == "70s");
MPG80s = MPG(decade == "80s");

[h,~,~,stats] = ttest2(MPG70s,MPG80s,"Tail","left")
h = 1
stats = struct with fields:
    tstat: -14.0630
       df: 396
       sd: 6.3910

返回值 h = 1 表明 ttest2 在 5% 的默认显著性水平上拒绝了原假设,而支持备择假设,即 20 世纪 70 年代生产的汽车里程的总体均值小于 20 世纪 80 年代生产的汽车里程的总体均值。

绘制相应的 Student t 分布、返回的 t 统计量和临界 t 值。使用 tinv 计算默认置信水平为 95% 时的临界 t 值。

nu = stats.df;
k = linspace(-15,15,300);
tdistpdf = tpdf(k,nu);
tval = stats.tstat
tval = -14.0630
tvalpdf = tpdf(tval,nu);
tcrit = -tinv(0.95,nu)
tcrit = -1.6487
plot(k,tdistpdf)
hold on
scatter(tval,tvalpdf,"filled")
xline(tcrit,"--")
legend(["Student's t pdf","t-statistic", ...
    "Critical Cutoff"])

Figure contains an axes object. The axes object contains 3 objects of type line, scatter, constantline. These objects represent Student's t pdf, t-statistic, Critical Cutoff.

橙色圆点表示 t 统计量,位于表示临界 t 值的黑色虚线左侧。

输入参数

全部折叠

样本数据,指定为向量、矩阵或多维数组。ttest2NaN 值视为缺失数据,并忽略它们。

  • 如果 xy 指定为向量,则它们不需要长度相同。

  • 如果将 xy 指定为矩阵,则它们必须具有相同的列数。ttest2 对每列执行单独的 t 检验并返回结果向量。

  • 如果将 xy 指定为多维数组,则除了第一个非单一维度外,其他维度必须具有相同的大小。

数据类型: single | double

样本数据,指定为向量、矩阵或多维数组。ttest2NaN 值视为缺失数据,并忽略它们。

  • 如果 xy 指定为向量,则它们不需要长度相同。

  • 如果将 xy 指定为矩阵,则它们必须具有相同的列数。ttest2 对每列执行单独的 t 检验并返回结果向量。

  • 如果将 xy 指定为多维数组,则除了第一个非单一维度外,其他维度必须具有相同的大小。ttest2 基于第一个非单一维度进行检验。

数据类型: single | double

名称-值参数

将可选的参数对组指定为 Name1=Value1,...,NameN=ValueN,其中 Name 是参数名称,Value 是对应的值。名称-值参数必须出现在其他参数后,但参数对组的顺序无关紧要。

在 R2021a 之前,使用逗号分隔每个名称和值,并用引号将 Name 引起来。

示例: 'Tail','right','Alpha',0.01,'Vartype','unequal' 指定在 1% 显著性水平上的右尾检验,并且不假设 xy 具有相等的总体方差。

假设检验的显著性水平,指定为以逗号分隔的对组,其中包含 'Alpha' 和范围 (0,1) 内的一个标量值。

示例: 'Alpha',0.01

数据类型: single | double

用于检验均值的输入矩阵的维度,指定为以逗号分隔的对组,其中包含 'Dim' 和一个正整数值。例如,指定 'Dim',1 检验列均值,而 'Dim',2 检验行均值。

示例: 'Dim',2

数据类型: single | double

要计算的备择假设的类型,指定为以逗号分隔的对组,其中包含 'Tail' 和以下项之一:

  • 'both' - 检验总体均值不相等的备择假设。

  • 'right' - 检验 x 的总体均值大于 y 的总体均值的备择假设。

  • 'left' - 检验 x 的总体均值小于 y 的总体均值的备择假设。

ttest2 根据指定的备择假设检验总体均值相等的原假设。

示例: 'Tail','right'

方差类型,指定为以逗号分隔的对组,其中包含 'Vartype' 和以下项之一。

'equal'假设 xy 来自方差未知但具有齐性的正态分布,并对此假设进行检验。
'unequal'假设 xy 来自方差未知且不具有齐性的正态分布,并对此假设进行检验。这称为贝伦斯-费希尔问题。ttest2 使用萨特思韦特逼近计算有效自由度。

Vartype 必须为单一方差类型,即使 x 是矩阵或多维数组也是如此。

示例: 'Vartype','unequal'

输出参数

全部折叠

假设检验结果,返回为 10

  • 如果 h = 1,这表明在 Alpha 显著性水平上拒绝原假设。

  • 如果 h = 0,这表明未能在 Alpha 显著性水平上拒绝原假设。

检验的 p 值,以 [0,1] 范围内的标量值形式返回。p 是观测到的检验统计量与原假设下观测到的值一样极端或更极端的概率。p 值较小会让人对原假设的有效性产生怀疑。

xy 的总体均值差的置信区间,以二元素向量形式返回,其中包含 100 × (1 – Alpha)% 置信区间的上下边界。

双样本 t 检验的检验统计量,以包含以下内容的结构体形式返回:

  • tstat - 检验统计量的值。

  • df - 检验的自由度。

  • sd - 总体标准差的合并估计(方差具有齐性时),或包含总体标准差的非合并估计的向量(方差具有非齐性时)。

详细信息

全部折叠

双样本 t 检验

双样本 t 检验是一种参数化检验,它比较两个独立数据样本的位置参数。

检验统计量的计算公式为:

t=x¯y¯sx2n+sy2m,

其中 x¯y¯ 是样本均值,sx 和 sy 是样本标准差,n 和 m 是样本大小。

在假设两个数据样本来自具有方差齐性的总体的情况下,原假设下的检验统计量具有自由度为 n + m – 2 的 Student t 分布,样本标准差被替换为池化标准差

s=(n1)sx2+(m1)sy2n+m2.

在不假设两个数据样本来自具有方差齐性的总体的情况下,原假设下的检验统计量具有近似 Student t 分布,其自由度的数目由萨特思韦特逼近给出。此检验有时称为韦尔奇 t 检验。

多维数组

多维数组有两个以上的维度。例如,如果 x 是 1×3×4 数组,则 x 是三维数组。

第一个非单一维度

第一个非单一维度是其大小不等于 1 的数组的第一个维度。例如,如果 x 是 1×2×3×4 数组,则第二个维度是 x 的第一个非单一维度。

提示

  • 使用 sampsizepwr 计算:

    • 对应于指定检验功效和参数值的样本大小;

    • 给定真实参数值时,特定样本大小的检验功效;

    • 可用指定的样本大小和检验功效检测的参数值。

扩展功能

版本历史记录

在 R2006a 之前推出

另请参阅

| |