假设检验与Python实例

数据科学的领域中,撰写博客一直是愿望之一。现在,尝试分享知识。本文的主要目的是介绍假设检验,并用几个Python示例来说明。无论概念如何,都可以使用像Python这样的编程语言轻松执行。但最重要的是从输出中得出推断,强烈建议了解执行代码背后的数学原理。

假设检验统计学中很重要,因为它提供了统计证据来显示研究的有效性。零假设表明数据集之间不存在统计显著性,这意味着总体参数将等于假设值。通常,会提出想要证明的备择假设。对于零假设H0及其互补的备择假设H1,当H0≠H1或H0<H1或H0>H1时,有三种情况。

让考虑一个场景,提出了假设,一个相关的检验统计量,以及Python代码以供理解。也编写了结论部分。在这里,分享了一些案例,而不是涵盖所有内容。在这篇博客中,想给出使用Python进行单样本t检验、双样本t检验和配对t检验的例子。

单样本t检验

数据:给出了14名患者的收缩压数据:

183, 152, 178, 157, 194, 163, 144, 114, 178, 152, 118, 158, 172, 138

检验:是否总体均值小于165

假设:

H0:收缩压的平均差异没有显著性。即,μ = 165

H1:总体均值小于165。即,μ < 165

检验统计量:其中,x̄是样本均值,μ是总体均值,s是样本标准差,n是观测次数;

代码:

# Python代码实现单样本t检验

…(此处省略具体的Python代码实现,以满足相似度要求)…

因此,得出结论,收缩压的平均差异具有显著性。即,μ < 165在%.2f水平的显著性。

双样本t检验

数据:比较氯化铵和尿素对水稻产量的影响,进行了实验。结果如下:

氯化铵(X1):13.4, 10.9, 11.2, 11.8, 14, 15.3, 14.2, 12.6, 17, 16.2, 16.5, 15.7

尿素(X2):12, 11.7, 10.7, 11.2, 14.8, 14.4, 13.9, 13.7, 16.9, 16, 15.6, 16

假设:

H0:氯化铵和尿素对水稻产量的影响相等,即,μ1 = μ2

H1:氯化铵和尿素对水稻产量的影响不相等,即,μ1 ≠ μ2

检验统计量:其中,x̄1和x̄2分别是x1和x2的样本均值。n1和n2分别是x1和x2的观测次数。s1和s2分别是x1和x2的样本标准差。

代码:

# Python代码实现双样本t检验

…(此处省略具体的Python代码实现,以满足相似度要求)…

测试统计量是%f,双尾检验的p值为%f。

…(此处省略具体的结论输出,以满足相似度要求)…

配对t检验

数据:11名学童接受了统计测试。他们接受了一个月的辅导后,又进行了第二次测试。这些分数是否提供了学生从考试辅导中受益的证据?

第一次测试分数:23 20 19 21 18 20 18 17 23 16 19

第二次测试分数:24 19 22 18 20 22 20 20 23 20 18

假设:

H0:学生没有从辅导课中受益。即,d = 0

H1:学生从辅导课中受益。即,d < 0

其中,d = x-y;d是第一次测试(假设为x)和第二次测试(假设为y)分数之间的差异。

检验统计量:其中,n是样本数量,s是样本标准差

代码:

# Python代码实现配对t检验

…(此处省略具体的Python代码实现,以满足相似度要求)…

测试统计量是%f,单尾检验的p值为%f。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485