假设检验常见方法

 

假设检验常见方法

Z检验

  • 适用场景:主要用于大样本(通常样本量$n\geq30$)情况下,已知总体方差$\sigma^2$,对总体均值$\mu$进行假设检验。例如,已知某产品在市场上的总体满意度评分的方差,要检验从大量消费者(样本)中得到的平均满意度评分是否与总体均值相同。
  • 原理与计算:将样本均值$\bar{X}$标准化为$Z$统计量,公式为$Z = \frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}}$。假设总体均值为$\mu_0$,计算出$Z$值后,根据标准正态分布的性质进行判断。例如,若计算出$Z = 2$,在双侧检验中,可根据标准正态分布表查找对应的概率值。
T检验
  • 适用场景:适用于小样本($n < 30$)且总体方差未知的情况,用于检验样本均值与总体均值的差异,或者比较两组小样本的均值是否相等。要求样本来自正态分布总体。例如,在医学实验中,比较两种药物对少量患者的疗效,由于样本量小且总体方差通常未知,适合用T检验。
  • 原理与计算(以单样本T检验为例):因为总体方差未知,用样本方差$S^2$来估计。$T$统计量公式为$T = \frac{\bar{X}-\mu}{\frac{S}{\sqrt{n}}}$。根据自由度$df = n – 1$和设定的显著性水平$\alpha$,查T分布表得到临界值进行判断。例如,样本容量$n = 20$,自由度为$19$,计算出$T = 3$,在双侧检验下,查找T分布表判断是否拒绝原假设。
卡方检验($\chi^2$检验)
  • 适用场景:用于检验分类变量之间是否存在关联,或者检验实际观察频数与理论期望频数是否一致。例如,分析不同年龄段(分类变量)与产品购买偏好(分类变量)之间是否有关联。
  • 原理与计算(以独立性检验为例):通过计算卡方统计量$\chi^2 = \sum\frac{(O – E)^2}{E}$,其中$O$是观察频数,$E$是期望频数。根据自由度$df=(r – 1)(c – 1)$($r$为行数,$c$为列数)和显著性水平$\alpha$,查卡方分布表得到临界值。例如,对于一个$2\times3$的列联表,计算出卡方统计量后,根据自由度为$2$,查找卡方分布表进行判断。
F检验
  • 适用场景:常用于方差分析(ANOVA)中,比较两组或多组数据的方差是否相等,也用于检验回归模型的显著性。例如,在比较不同生产工艺(多组)下产品质量的方差是否相同,或者评估回归模型中自变量对因变量的解释能力是否显著。
  • 原理与计算(以方差分析中的F检验为例):$F$统计量是组间方差与组内方差的比值。在单因素方差分析中,设$MSB$为组间均方(组间方差),$MSW$为组内均方(组内方差),则$F = \frac{MSB}{MSW}$。根据分子自由度($df_1$,组间自由度)、分母自由度($df_2$,组内自由度)和显著性水平$\alpha$,查F分布表得到临界值进行判断。
单尾和双尾检验
双尾检验
  • 概念与原理:双尾检验是检验样本统计量与总体参数是否有显著差异,而不考虑差异的方向。它的原假设$H_0$通常是样本均值等于总体均值($\mu = \mu_0$),备择假设$H_1$是样本均值不等于总体均值($\mu \neq \mu_0$)。例如,在检验一种新的教学方法是否改变学生的平均成绩时,不管成绩是提高还是降低,只要与原来的平均成绩有显著差异,就拒绝原假设。
  • 决策规则与应用场景:在给定显著性水平$\alpha$下,将$\alpha$平分到分布的两侧。如果计算出的统计量(如$Z$、$T$、$\chi^2$、$F$等)的绝对值大于相应分布的双侧临界值,就拒绝原假设。例如,在Z检验中,若$\alpha = 0.05$,双侧临界值为$\pm1.96$,当计算出的$|Z| > 1.96$时,拒绝原假设。适用于只关心是否有差异,而不关心差异方向的情况,如比较两种产品的质量是否有差异,不预先设定哪种产品质量更好。
单尾检验
  • 概念与原理:单尾检验是关注样本统计量与总体参数在某一特定方向上的差异。分为左尾检验和右尾检验。左尾检验的原假设$H_0$一般是样本均值大于等于总体均值($\mu \geq \mu_0$),备择假设$H_1$是样本均值小于总体均值($\mu < \mu_0$);右尾检验的原假设$H_0$是样本均值小于等于总体均值($\mu \leq \mu_0$),备择假设$H_1$是样本均值大于总体均值($\mu > \mu_0$)。例如,在检验一种新的减肥药物是否能降低体重时,只关心体重是否下降,这就是左尾检验。
  • 决策规则与应用场景:在给定显著性水平$\alpha$下,只考虑分布的一侧。对于左尾检验,如果计算出的统计量小于相应分布的左尾临界值,就拒绝原假设;对于右尾检验,如果统计量大于右尾临界值,就拒绝原假设。例如,在T检验的右尾检验中,若$\alpha = 0.05$,自由度为$10$,右尾临界值约为$1.812$,当计算出的$T > 1.812$时,拒绝原假设。适用于有明确方向性预期的情况,如检验一种新的生产工艺是否能提高产品的产量,或者一种新的营销方案是否能增加销售额。
发表评论
暂无评论