假设检验是统计学中一个重要的概念,它不仅限于统计学家或数据科学家使用。例如,在软件开发中,编写代码后也会进行测试。同样,对于组织面临的每个产品或问题,都需要通过提出假设来解决。这种假设可以通过“假设检验”来实现。
假设检验是一种统计方法,用于检验关于总体参数的假设。分析师采用的方法取决于所使用的数据的性质和分析的目的。
要进行假设检验,需要遵循以下步骤:
假设想要研究意大利18至30岁的成年人中,男性的平均身体质量指数(BMI)是否显著高于女性。这里的总体是意大利18至30岁的成年人,感兴趣的参数是BMI。
零假设(H0):男性和女性的平均BMI没有差异。
H0: U1 = U2
备择假设(HA):男性和女性的平均BMI存在显著差异。
HA: U1 ≠ U2
显著性水平设定为5%。
在这一步中,筛选数据,只包括18至30岁的意大利成年人。然后,需要进行一些统计计算,如平均值、最小值、最大值、标准差和样本大小,分别针对男性和女性。
需要检查的假设包括:
检验统计量是衡量样本统计量与假设的总体参数之间的差异,以估计的标准误差为单位。
Z = (样本均值差 - 零假设值) / 估计的标准误差
样本均值差是男性和女性统计样本均值之间的差异,零假设值是假设的零值,估计的标准误差对于两个均值可能会有所不同,取决于采用的方法。
可以使用两种方法:汇总方法和非汇总方法。汇总方法假设两个总体的方差相等,而非汇总方法则放弃等方差的假设。
P值是在零假设为真的假设下,观察到的检验统计量值(Z)或更极端值的概率。
将使用Z分布来计算这个概率,其中自由度df = n1 + n2 - 2。由于备择假设是不等的,因此需要检查分布的上尾和下尾。
如果男性和女性总体平均BMI的差异真的为零,那么观察到的样本均值差异或更极端值的可能性相当高。这个值如此之大,几乎有20%的机会看到它,因此将继续不拒绝零假设。