双尾检验的流程
问题提出与假设设定
明确研究问题:首先要确定想要研究的问题,这个问题通常涉及比较两个或多个总体的参数(如均值、比例等)是否存在差异,而不预先指定差异的方向。例如,研究一种新的药物是否会改变患者的血压,不考虑是升高还是降低血压。
建立假设:
- 原假设($H_0$):设定为两个总体参数相等,即不存在差异。例如,对于药物对血压影响的研究,原假设可以是使用新药后患者的平均血压($\mu$)与未使用新药时患者的平均血压($\mu_0$)相等,即$\mu = \mu_0$。
- 备择假设($H_1$):表示两个总体参数不相等,即存在差异,如$\mu \neq \mu_0$。
选择合适的检验方法和收集数据
- 选择检验方法:根据数据的类型(连续型、分类型)、样本大小、总体分布等因素来确定合适的检验方法。如果是比较两个样本的均值,对于大样本($n\geq30$)且已知总体方差可以使用Z检验;对于小样本($n < 30$)且总体方差未知使用T检验;如果是研究分类变量之间的关系可能会用到卡方检验等。例如,在研究药物对血压影响时,假设血压数据近似正态分布,且样本量较小(如$n = 20$),总体方差未知,可选择T检验。
- 收集数据:按照研究设计收集相关的数据。在药物案例中,收集使用新药的患者组和未使用新药的对照组的血压数据,包括收缩压、舒张压等信息,确保数据的准确性和完整性。
计算检验统计量
- 计算过程(以T检验为例):对于比较两个独立样本均值的T检验,统计量计算公式为$T=\frac{(\bar{X_1}-\bar{X_2})-(\mu_1 – \mu_2)}{S_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}$,其中$\bar{X_1}$和$\bar{X_2}$是两个样本的均值,$n_1$和$n_2$是两个样本的大小,$\mu_1 – \mu_2$在原假设下通常为0,$S_p$是合并标准差,计算公式为$S_p=\sqrt{\frac{(n_1 – 1)S_1^2+(n_2 – 1)S_2^2}{n_1 + n_2 – 2}}$,$S_1^2$和$S_2^2$是两个样本的方差。假设在药物案例中,使用新药组($n_1 = 20$)平均血压$\bar{X_1}=130$,方差$S_1^2 = 10$;未使用新药组($n_2 = 20$)平均血压$\bar{X_2}=125$,方差$S_2^2 = 8$,先计算$S_p$,再计算$T$值。
确定显著性水平并做出决策
- 确定显著性水平($\alpha$):通常选择0.05、0.01等作为显著性水平。例如,设定$\alpha = 0.05$。
- 决策规则:对于双尾检验,将$\alpha$平分到分布的两侧,得到双侧临界值。对于T检验,根据自由度$df = n_1 + n_2 – 2$查T分布表得到双侧临界值$\pm T_{\alpha/2,df}$。在上述例子中,$df = 20 + 20 – 2 = 38$,查T分布表得$T_{0.025,38} \approx \pm 2.024$。如果计算出的$|T| > T_{\alpha/2,df}$,则拒绝原假设,认为两组数据的均值存在显著差异;如果$|T| \leq T_{\alpha/2,df}$,则不能拒绝原假设。
双尾检验案例
案例背景
- 一家教育机构想知道一种新的教学方法是否会影响学生的考试成绩。传统教学方法下学生的平均成绩是75分($\mu_0$)。现在抽取了采用新教学方法的30名学生($n = 30$)进行测试,得到样本平均成绩为78分($\bar{X}$),样本标准差为4分($S$)。
假设检验过程
明确假设:
- 原假设($H_0$):$\mu = 75$(新教学方法对成绩没有影响)
- 备择假设($H_1$):$\mu \neq 75$(新教学方法对成绩有影响),这是一个双尾检验。
- 选择检验方法:由于是小样本($n = 30$)且总体方差未知,选择T检验。
- 计算检验统计量:$T = \frac{\bar{X}-\mu_0}{\frac{S}{\sqrt{n}}} = \frac{78 – 75}{\frac{4}{\sqrt{30}}} \approx 4.11$
- 确定显著性水平并做出决策:设定显著性水平$\alpha = 0.05$,自由度$df = n – 1 = 30 – 1 = 29$。查T分布表得到双侧临界值$T_{0.025,29} \approx \pm 2.045$。由于$|4.11| > 2.045$,所以拒绝原假设,即有足够的证据表明新教学方法对学生的考试成绩有显著影响。