假设检验在统计学中的应用

假设检验是统计学中一个重要的概念,它不仅限于统计学家或数据科学家使用。例如,在软件开发中,编写代码后也会进行测试。同样,对于组织面临的每个产品或问题,都需要通过提出假设来解决。这种假设可以通过“假设检验”来实现。

什么是假设检验?

假设检验是一种统计方法,用于检验关于总体参数的假设。分析师采用的方法取决于所使用的数据的性质和分析的目的。

假设检验的步骤

要进行假设检验,需要遵循以下步骤:

  1. 定义零假设和备择假设
  2. 检查数据,验证假设
  3. 计算检验统计量
  4. 确定相应的p值
  5. 对零假设做出决策

假设想要研究意大利18至30岁的成年人中,男性的平均身体质量指数(BMI)是否显著高于女性。这里的总体是意大利18至30岁的成年人,感兴趣的参数是BMI。

零假设(H0):男性和女性的平均BMI没有差异。

H0: U1 = U2

备择假设(HA):男性和女性的平均BMI存在显著差异。

HA: U1 ≠ U2

显著性水平设定为5%。

在这一步中,筛选数据,只包括18至30岁的意大利成年人。然后,需要进行一些统计计算,如平均值、最小值、最大值、标准差和样本大小,分别针对男性和女性。

需要检查的假设包括:

  • 样本是简单随机样本
  • 样本之间相互独立
  • 两个总体的响应大致呈正态分布,或者样本量足够大

检验统计量是衡量样本统计量与假设的总体参数之间的差异,以估计的标准误差为单位。

Z = (样本均值差 - 零假设值) / 估计的标准误差

样本均值差是男性和女性统计样本均值之间的差异,零假设值是假设的零值,估计的标准误差对于两个均值可能会有所不同,取决于采用的方法。

可以使用两种方法:汇总方法和非汇总方法。汇总方法假设两个总体的方差相等,而非汇总方法则放弃等方差的假设。

P值是在零假设为真的假设下,观察到的检验统计量值(Z)或更极端值的概率。

将使用Z分布来计算这个概率,其中自由度df = n1 + n2 - 2。由于备择假设是不等的,因此需要检查分布的上尾和下尾。

如果男性和女性总体平均BMI的差异真的为零,那么观察到的样本均值差异或更极端值的可能性相当高。这个值如此之大,几乎有20%的机会看到它,因此将继续不拒绝零假设。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485