第3章 T检验

均值检验是最常见的假设检验。对大样本或正态分布小样本，其样本均值服从正态分布，因此可以做标准化。

对正态分布小样本，总体方差往往不可知，因此用样本方差代替。此时样本方差服从自由度为\(n-1\)的\(\chi^2\)分布，因此在原假设（取定总体均值）下，可以构造\(T\)统计量。若总体方差已知，则可以直接在原假设下构造\(Z\)统计量。

对大样本，由中心极限定律，样本均值服从于一正态分布。此时可以以修正样本方差为总体方差的近似值，直接构造\(Z\)统计量。

3.1 单样本T检验

单样本T检验的原假设为

\[H_0: \mu=\mu_0\]

备择假设可以是

\[H_1: \mu < \mu_0 | H_1: \mu > \mu_0 | H_1: \mu\mu_0\]

其中，\(\mu_0\)为给定的常数（被视为总体均值）。

均值检验适用于大样本及正态总体小样本。对于大样本，检验统计量为

\[Z_0=\frac{\overline X-\mu_0}{σ_\overline X}=\frac{\overline X-\mu_0}{σ/\sqrt n}≈\frac{\overline X-\mu_0}{S/\sqrt n}\sim N(0,1)|H_0\]

对于正态总体小样本，由于方差往往未知，检验统计量为

\[T_0=\frac{\overline X-\mu_0}{S\sqrt{n-1}}\sim t(n-1)|H_0\]

根据备择假设，可以计算相应的拒绝域或\(p\)值，当观测值落入拒绝域或\(p\)值过小，则可以拒绝原假设。一般而言，选择\(p\)值可以确定更精确的概率。

均值检验的流程为：

选择变量；
建立原假设与备择假设；
检查样本是否是大样本，或为正态总体小样本，若两个条件都不符合，则不适用；
代入数据，计算检验统计量\(Z_0\)或\(T_0\)，并比较\(p\)值与给定的显著性水平\(\alpha\)，如果\(p<\alpha\)，那么可以认为检验结果在统计上显著；
若检验结果显著，进行解释。

比例检验是均值检验的变种。比例检验适用的对象是01变量。若变量为二分变量，则将之转化为01变量；若变量为多分类变量，则将关心的值设置为1，其他值设置为0。

比例检验使用prtest命令。