假设检验基础解析

在各个领域中,假设检验都扮演着重要的角色。以熟知的救生圈品牌为例,假设救生圈宣称其产品能杀灭99.9%的细菌,那么这个声明是如何得出的呢?这就需要一种测试技术来证明这个声明是否正确。本文将这些概念分解成小块,帮助理解它们的动机和用途。阅读完本文后,将对假设检验的基础知识有一个清晰的了解。

假设检验的定义

假设检验是一种关于参数值(如均值、方差、中位数等)的陈述、假设或声明。它是一种对周围世界的有根据的猜测,应该是可测试的,可以通过实验或观察来验证。例如,如果说“Dhoni是有史以来最好的印度队长”,这是基于他领导下的团队胜负平均数做出的假设,可以根据所有比赛数据来测试这个声明。

零假设与备择假设检验

零假设是在假设其为真的情况下,可能被拒绝的假设。零假设的概念类似于“无罪推定,直到证明有罪”。假设无辜,直到有足够的证据证明嫌疑人有罪。简而言之,可以将零假设理解为已经接受的陈述,例如“天空是蓝色的”,已经接受这个陈述。它用H0表示。

备择假设补充了零假设。它是零假设的对立面,使得备择假设和零假设一起涵盖了所有可能的总体参数值。它用H1表示。

例如,一家肥皂公司声称其产品平均能杀灭99%的细菌。为了测试这家公司的声明,将制定零假设和备择假设。零假设(H0):平均=99%,备择假设(H1):平均不等于99%。注意,当测试一个假设时,假设零假设为真,直到样本中有足够证据证明其为假。在这种情况下,拒绝零假设并支持备择假设。如果样本未能提供足够证据使拒绝零假设,不能说零假设是真的,因为它是基于样本数据的。要证明零假设是真的,需要研究整个总体数据。

简单假设与复合假设检验

当一个假设指定了参数的确切值时,它是一个简单假设;如果它指定了参数值的范围,则称为复合假设。例如,摩托车公司声称某型号的平均油耗为每升100公里,这是一个简单假设的例子。而“一个班级学生的平均年龄大于20岁”这个声明是一个复合假设的例子。

单尾与双尾假设检验

如果备择假设在零假设指定的参数值的两个方向(小于和大于)上都提供了备择值,那么它被称为双尾检验。如果备择假设只在零假设指定的参数值的一个方向(小于或大于)上提供了备择值,那么它被称为单尾检验。例如,如果H0:均值=100,H1:均值不等于100,根据H1,均值可以大于或小于100。这是一个双尾检验的例子。同样,如果H0:均值>=100,那么H1:均值<100,这里均值小于100。它被称为单尾检验。

临界区域

临界区域是样本空间中,如果计算值落在这个区域,就拒绝零假设。以一个例子来理解这个概念:假设想租一间公寓,从不同的房地产网站上列出了所有可用的公寓。预算是每月15000卢比,不能花超过这个数。制作的公寓列表价格范围从每月7000到30000卢比。从列表中随机选择一个公寓,并假设以下假设:H0:会租这间公寓,H1:不会租这间公寓。现在,由于预算是15000,必须拒绝所有高于这个价格的公寓。在这里,所有高于15000的价格都成为临界区域。如果随机公寓的价格落在这个区域,必须拒绝零假设;如果随机公寓的价格不落在这个区域,不拒绝零假设。

临界区域在概率分布曲线的一尾或两尾上,根据备择假设。临界区域是一个预先定义的区域,对应于概率分布曲线上的一个截止值。它用α表示。临界值是将支持或拒绝零假设的值分开的值,它们是基于α计算的。将在后面看到更多的例子,这将清楚地说明如何选择α。根据备择假设,临界区域有三种情况:双尾检验、左尾检验和右尾检验。

I型错误与II型错误

I型错误和II型错误是假设检验中最重要的话题之一。让通过将其分解成更小的部分来简化这个话题。I型错误(假阳性)——当拒绝一个真实的零假设时。II型错误(假阴性)——当接受一个错误的零假设时。犯I型错误(假阳性)的概率等于显著性水平或临界区域α。α=P[在H0为真时拒绝H0]。犯II型错误(假阴性)的概率等于β,它被称为“测试的效力”。β=P[在h1为真时不拒绝H0]。

例如:一个人因被指控犯有盗窃罪而被逮捕。一个由法官组成的陪审团必须决定他是否有罪。H0:人是无辜的,H1:人是有罪的。如果陪审团定罪[拒绝H0],尽管这个人是无辜的[H0为真],那么就是I型错误。如果陪审团释放了这个人[不拒绝H0],尽管这个人是有罪的[H1为真],那么就是II型错误。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485