第3章 T检验


均值检验是最常见的假设检验。对大样本或正态分布小样本,其样本均值服从正态分布,因此可以做标准化。

对正态分布小样本,总体方差往往不可知,因此用样本方差代替。此时样本方差服从自由度为\(n-1\)\(\chi^2\)分布,因此在原假设(取定总体均值)下,可以构造\(T\)统计量。若总体方差已知,则可以直接在原假设下构造\(Z\)统计量。

对大样本,由中心极限定律,样本均值服从于一正态分布。此时可以以修正样本方差为总体方差的近似值,直接构造\(Z\)统计量。

3.1 单样本T检验

单样本T检验的原假设为

\[H_0: \mu=\mu_0\]

备择假设可以是

\[H_1: \mu < \mu_0 | H_1: \mu > \mu_0 | H_1: \mu\mu_0\]

其中,\(\mu_0\)为给定的常数(被视为总体均值)。

均值检验适用于大样本及正态总体小样本。对于大样本,检验统计量为

\[Z_0=\frac{\overline X-\mu_0}{σ_\overline X}=\frac{\overline X-\mu_0}{σ/\sqrt n}≈\frac{\overline X-\mu_0}{S/\sqrt n}\sim N(0,1)|H_0\]

对于正态总体小样本,由于方差往往未知,检验统计量为

\[T_0=\frac{\overline X-\mu_0}{S\sqrt{n-1}}\sim t(n-1)|H_0\]

根据备择假设,可以计算相应的拒绝域或\(p\)值,当观测值落入拒绝域或\(p\)值过小,则可以拒绝原假设。一般而言,选择\(p\)值可以确定更精确的概率。

3.1.1 流程

均值检验的流程为:

  1. 选择变量;
  2. 建立原假设与备择假设;
  3. 检查样本是否是大样本,或为正态总体小样本,若两个条件都不符合,则不适用;
  4. 代入数据,计算检验统计量\(Z_0\)\(T_0\),并比较\(p\)值与给定的显著性水平\(\alpha\),如果\(p<\alpha\),那么可以认为检验结果在统计上显著;
  5. 若检验结果显著,进行解释。

3.1.2 代码实现

Stata

R

3.2 比例检验

比例检验是均值检验的变种。比例检验适用的对象是01变量。若变量为二分变量,则将之转化为01变量;若变量为多分类变量,则将关心的值设置为1,其他值设置为0。

3.2.1 代码实现

Stata

比例检验使用prtest命令。

R