剖析假设检验的两类错误并举例说明课件_第1页
剖析假设检验的两类错误并举例说明课件_第2页
剖析假设检验的两类错误并举例说明课件_第3页
剖析假设检验的两类错误并举例说明课件_第4页
剖析假设检验的两类错误并举例说明课件_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

剖析假设检验的两类错误并举例说明组长:胡立文PPT制作:吴思远演讲人:胡立文组员:胡立文、吴思远、林君豪、白鲁宁、殷妃、陈芷琳剖析假设检验的两类错误并举例说明组长:胡立文1在假设检验时,根据检验结果做出的判断,即拒绝H0或不拒绝H0并不是100%的正确,可能发生两种错误在假设检验时,根据检验结果做出的判断,即拒绝H0或不拒绝H02第一类错误—弃真错误即H0本来正确,却拒绝了它,犯这类错误的概率不超过α,即P{拒绝H0/H0为真}≤α可能产生的原因:1.样本中极端数值2.采用决策标准较宽松第一类错误—弃真错误即H0本来正确,却拒绝了它,犯这类错误的3第二类错误—取伪错误即H0本不真,却接受了他,犯这类错误的概率记为β,即P{接受H0/H1为真}=β可能产生原因:1:实验设计不灵敏2.样本数据变异性过大3.处理效应本身比较小第二类错误—取伪错误即H0本不真,却接受了他,犯这类错误的概4两类错误的关系1:α与β是在两个前提下的概率,所以α+β不一定等于12:在其他条件不变的情况下,α与β不能同时增加或减少两类错误的关系1:α与β是在两个前提下的概率,所以α+β不一5案例说明例子:一个公司有员工3000人(研究的总体),为了检验公司员工工资统计报表的真实性,研究者作了50人的大样本随机抽样调查,人均收入的调查结果是:X(样本均值)=871元;S(标准差)=21元问能否认为统计报表中人均收入μ0=880元的数据是真实的?(显著性水平α=0.05)案例说明例子:一个公司有员工3000人(研究的总体),为6研究假设原假设H0:调查数据871元与报表数据880元之间没有显著性差异,公司员工工资均值的真实情况为880元;假设H1:调查数据和报表数据之间有显著性的差异,公司员工工资均值的真实情况不是880元。研究假设原假设H0:调查数据871元与报表数据8807α错误出现原因我们只抽了一个样本,而个别的样本可能是特殊的,不管你的抽样多么符合科学抽样的要求。理论上讲,在3000个员工中随机抽取50人作为调查样本,有很多种构成样本的可能性,相当于3000选50,这个数目是很大的。这样,在理论上就有存在很多个样本平均数。也就是说,由于小概率事件的出现,我们把本来真实的原假设拒绝了。这就是α错误出现的原因。α错误出现原因我们只抽了一个样本,而个别的样本可能是特殊的8β错误出现原因第二个问题是,统计检验的逻辑犯了从结论推断前提的错误。命题B是由命题A经演绎推论出来的,或写作符号A→B,命题C是我们在检验中所依据操作法则。如果A是真的,且我们从A到B的演绎推论如果也是正确的,那么B可能是真实的。相反,如果结果B是真实的,那么就不能得出A必定是真实的结论。这就是β错误出现的原因。β错误出现原因第二个问题是,统计检验的逻辑犯了从结论推断前9出现两类错误的概率计算α错误是由实际推断原理引起的,即“小概率事件不会发生”的假定所引起的,所以有理由将所有小概率事件发生的概率之和或者即显著性水平(α=0.05)看作α错误发生的概率,换言之,α错误发生的概率为检验所选择的显著性水平。如果是单侧检验,弃真错误的概率则为α/2。出现两类错误的概率计算α错误是由实际推断原理引起的,即“小10β错误的概率的计算犯β错误的概率的计算是比较复杂的,由于β错误的出现原因是属于逻辑上的,所以在总体参数不知道的情况下是无法计算它出现概率的大小的。我们在以上例子的基础上进一步设计:这个公司职员的实际工资不是880元,而是是870元,原假设为伪,仍然假设实际工资是880元。这样我们就可以在总体均值为870元和880元两种情况下,分别作出两条正态分布曲线(A线和B线),见下图。β错误的概率的计算犯β错误的概率的计算是比较复杂的,由于β错11剖析假设检验的两类错误并举例说明课件12犯β错误的概率大小就是相对正态曲线A而言,图1中阴影部分的面积:ZX1=1.41;ZX2=5.59查标准正态分布表可知,β=Φ(ZX2)-Φ(ZX1)=0.0793结果表明,如果总体的真值为870元,而虚无假设为880元的话,那么,平均而言每100次抽样中,将约有8次把真实情况当作880元被接受,即犯β错误的概率大小是0.0793。犯β错误的概率大小就是相对正态曲线A而言,图1中阴影13对相关命题的说明命题1:在统计检验中,在样本容量一定的条件下,α错误和β错误不可能同时减小。这个命题可以借助前面的图形1来理解,一旦正态分布A的拒绝域减小即α错误减小,则(21Χ−Χ)这个区域将增大,而图A上阴影部分的面积(β错误)也将增大。对相关命题的说明命题1:在统计检验中,在样本容量一定的条件14命题2:真实的总体参数(μ)与假设的总体参数(μ0)之间的差异(△μ)越小,犯β错误的概率越大。这个命题也可以从图形1得到说明。因为△μ越小,两个正态图就相距越近,阴影部分面积就增大。命题2:真实的总体参数(μ)与假设的总体参数(μ0)之间的15命题3:犯α错误的概率和犯β错误的概率之和不为1。α错误的概率是在图A上被指示的显著性水平的大小,而β错误的概率是图A上阴影部分的面积。既然假设的总体均值并不与真值相等(这是错β误产生的前提),图A与图B就不可能重合,因此α和之β和不可能为1。命题3:犯α错误的概率和犯β错误的概率之和不为116两类错误的危害犯第一类错误的危害较大,由于报告了本来不存在的现象,则因此现象而衍生出的后续研究、应用的危害将是不可估量的。想对而言,第二类错误的危害则相对较小,因为研究者如果对自己的假设很有信心,可能会重新设计实验,再次来过,直到得到自己满意的结果(但是如果对本就错误的观点坚持的话,可能会演变成第一类错误)。两类错误的危害犯第一类错误的危害较大,由于报告了本来不存在的17假设检验时应注意的事项要有严密的抽样研究设计,样本必须是从同质总体中随机抽取的;要保证组间的均衡性和资料的可比性。根据现有的资料的性质,设计类型,样本含量大小,正确选用检验方法对差别有无统计学意义的判断不能绝对化,因检验水准只是人为规定的界限,是相对的。差别有统计意义时,是指无效假设H0被接受的可能性只有5%或不到5%,甚至不到1%,根据小概率事件一次不可能拒绝H0,但尚不能排除有5%或1%出现的可能,所以可能产生第一类错误:同样,若不拒绝H0,可能产生第二类错误假设检验时应注意的事项要有严密的抽样研究设计,样本必须是从同18剖析假设检验的两类错误并举例说明课件19剖析假设检验的两类错误并举例说明组长:胡立文PPT制作:吴思远演讲人:胡立文组员:胡立文、吴思远、林君豪、白鲁宁、殷妃、陈芷琳剖析假设检验的两类错误并举例说明组长:胡立文20在假设检验时,根据检验结果做出的判断,即拒绝H0或不拒绝H0并不是100%的正确,可能发生两种错误在假设检验时,根据检验结果做出的判断,即拒绝H0或不拒绝H021第一类错误—弃真错误即H0本来正确,却拒绝了它,犯这类错误的概率不超过α,即P{拒绝H0/H0为真}≤α可能产生的原因:1.样本中极端数值2.采用决策标准较宽松第一类错误—弃真错误即H0本来正确,却拒绝了它,犯这类错误的22第二类错误—取伪错误即H0本不真,却接受了他,犯这类错误的概率记为β,即P{接受H0/H1为真}=β可能产生原因:1:实验设计不灵敏2.样本数据变异性过大3.处理效应本身比较小第二类错误—取伪错误即H0本不真,却接受了他,犯这类错误的概23两类错误的关系1:α与β是在两个前提下的概率,所以α+β不一定等于12:在其他条件不变的情况下,α与β不能同时增加或减少两类错误的关系1:α与β是在两个前提下的概率,所以α+β不一24案例说明例子:一个公司有员工3000人(研究的总体),为了检验公司员工工资统计报表的真实性,研究者作了50人的大样本随机抽样调查,人均收入的调查结果是:X(样本均值)=871元;S(标准差)=21元问能否认为统计报表中人均收入μ0=880元的数据是真实的?(显著性水平α=0.05)案例说明例子:一个公司有员工3000人(研究的总体),为25研究假设原假设H0:调查数据871元与报表数据880元之间没有显著性差异,公司员工工资均值的真实情况为880元;假设H1:调查数据和报表数据之间有显著性的差异,公司员工工资均值的真实情况不是880元。研究假设原假设H0:调查数据871元与报表数据88026α错误出现原因我们只抽了一个样本,而个别的样本可能是特殊的,不管你的抽样多么符合科学抽样的要求。理论上讲,在3000个员工中随机抽取50人作为调查样本,有很多种构成样本的可能性,相当于3000选50,这个数目是很大的。这样,在理论上就有存在很多个样本平均数。也就是说,由于小概率事件的出现,我们把本来真实的原假设拒绝了。这就是α错误出现的原因。α错误出现原因我们只抽了一个样本,而个别的样本可能是特殊的27β错误出现原因第二个问题是,统计检验的逻辑犯了从结论推断前提的错误。命题B是由命题A经演绎推论出来的,或写作符号A→B,命题C是我们在检验中所依据操作法则。如果A是真的,且我们从A到B的演绎推论如果也是正确的,那么B可能是真实的。相反,如果结果B是真实的,那么就不能得出A必定是真实的结论。这就是β错误出现的原因。β错误出现原因第二个问题是,统计检验的逻辑犯了从结论推断前28出现两类错误的概率计算α错误是由实际推断原理引起的,即“小概率事件不会发生”的假定所引起的,所以有理由将所有小概率事件发生的概率之和或者即显著性水平(α=0.05)看作α错误发生的概率,换言之,α错误发生的概率为检验所选择的显著性水平。如果是单侧检验,弃真错误的概率则为α/2。出现两类错误的概率计算α错误是由实际推断原理引起的,即“小29β错误的概率的计算犯β错误的概率的计算是比较复杂的,由于β错误的出现原因是属于逻辑上的,所以在总体参数不知道的情况下是无法计算它出现概率的大小的。我们在以上例子的基础上进一步设计:这个公司职员的实际工资不是880元,而是是870元,原假设为伪,仍然假设实际工资是880元。这样我们就可以在总体均值为870元和880元两种情况下,分别作出两条正态分布曲线(A线和B线),见下图。β错误的概率的计算犯β错误的概率的计算是比较复杂的,由于β错30剖析假设检验的两类错误并举例说明课件31犯β错误的概率大小就是相对正态曲线A而言,图1中阴影部分的面积:ZX1=1.41;ZX2=5.59查标准正态分布表可知,β=Φ(ZX2)-Φ(ZX1)=0.0793结果表明,如果总体的真值为870元,而虚无假设为880元的话,那么,平均而言每100次抽样中,将约有8次把真实情况当作880元被接受,即犯β错误的概率大小是0.0793。犯β错误的概率大小就是相对正态曲线A而言,图1中阴影32对相关命题的说明命题1:在统计检验中,在样本容量一定的条件下,α错误和β错误不可能同时减小。这个命题可以借助前面的图形1来理解,一旦正态分布A的拒绝域减小即α错误减小,则(21Χ−Χ)这个区域将增大,而图A上阴影部分的面积(β错误)也将增大。对相关命题的说明命题1:在统计检验中,在样本容量一定的条件33命题2:真实的总体参数(μ)与假设的总体参数(μ0)之间的差异(△μ)越小,犯β错误的概率越大。这个命题也可以从图形1得到说明。因为△μ越小,两个正态图就相距越近,阴影部分面积就增大。命题2:真实的总体参数(μ)与假设的总体参数(μ0)之间的34命题3:犯α错误的概率和犯β错误的概率之和不为1。α错误的概率是在图A上被指示的显著性水平的大小,而β错误的概率是图A上

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论