关于假设检验两类错误的课程设计报告_第1页
关于假设检验两类错误的课程设计报告_第2页
关于假设检验两类错误的课程设计报告_第3页
关于假设检验两类错误的课程设计报告_第4页
关于假设检验两类错误的课程设计报告_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、南京理工大学应用统计学假设检验 课程设计报告 课程名称 课程设计 年 级 2013级 专 业 应用统计专业 学生姓名 xxx 成 绩: 一引言 假设检验是一种实际应用非常广泛的统计推断方法,它是从对总体参数或总体的分布函数,相互关系等所作的某种假设开始,在假设成立的条件下构造出一种与假设有关且具有已知分布的统计量,进而通过样本提供的信息,在一定的概率把握前提下,对所作的假设进行检验,以作出接受或拒绝假设的判断或决策。假设检验在人们生活中已经有了广泛的应用,它的意义也是巨大的。比如,在审计工作的实质性测试中,审计人员有时须形成账户余额或交易数值错报金额的判断,此过程中统计分析方法有其独到用处。在

2、审计实际工作及有关审计文献中,较多关注与使用的是对被审计单位相关经济指标的参数估计法,而本文针对账面余额与审计金额间的差异提出了新的统计检验方法假设检验。从实证结果看,利用假设检验不仅可以检验审计人员的判断是否准确,还能度量审计人员做出错误结论的风险,有利于审计人员对审计事项的整体把握,提高工作效率。 1假设检验的分类: 双侧假设检验:在关于假设的检验中,当统计量Z的观测值的绝对值大于临界值时,拒绝原假设,由于这里的拒绝域分别位于接受域的两侧,因此称这类假设检验为双侧检验。 单侧假设检验:相应的将拒绝域只位于一侧的假设检验称为单侧假设检验。 2假设检验的基本思想:小概率原理小概率事件在一次试验

3、中基本不会发生。 假设检验中最关键的步骤就是要构造检验统计量,并利用该统计量给出拒绝域,拒绝域的形式一般就是检验统计量的取值范围,完成这一步骤的基本的统计思想就是小概率原理,即小概率事件在一次试验中基本不会发生。在原假设正确的条件下,合理的构造小概率事件W,再根据一次试验的结果考察W有没有出现,若W出现,则说明原假设正确的前提有问题,因为在这一前提下,根据小概率原理,W作为小概率事件是本来不应该出现的,因此W的出现便否定了;若W没有出现,则没有理由认为不正确。 这种推理方法可以说是一种“反证法”,但这种“反证法”使用的不是纯数学中的逻辑推理,不同于一般的反证法,一般的反证法要求在原假设成立的条

4、件下导出的结论是绝对成立的,如果事实与之矛盾,那么完全绝对的否定原假设。而这里的“反证法”是带概率性质的反证法,它的逻辑是:如果小概率事件在一次试验中发生,我们就以很大的把握否定原假设。而这里的“小概率”则需要事先给定,一般记为,是很小的正数,通常取为0.01,0.05,0.1,在这里称之为显著性水平。我们记为在成立的条件下事件A的概率,同样地,记为在成立的条件下事件A 的概率,则对拒绝域W应该有: 3 假设检验的基本原理: 假设检验的最基本原理是显著性原理,是根据样本观测值来判断是否有显著差异,这个差异是由两种可能因素引起的,一是系统性因素,一是偶然性因素。问题的关键在于:这个差异是否可以仅

5、以偶然性这个因素去解释,也就是说是否有充分的理由去否定这种解释。如果有,就否定原假设,如果没有,就只能接受它。 4假设检验的一般步骤:1 根据研究问题的需要提出原假设和备择假设,而提出原假设应本着“保守”或“不轻易拒绝原假设”的原则。通常原假设代表一种久已存在的状况,故我们往往把有把握的、不轻易否定的命题作为原假设,其表达式需包括等号在内;而备择假设反映一种改变,故我们往往把没有把握的、不轻易肯定或需要强有力支持的命题(希望证实的假设)作为备择假设。2 找出检验的统计量及其分布。提出假设以后,要作出拒绝还是接受原假设的决定。需根据样本提供的信息,从概率意义上来判断。由于样本所含信息较为分散,因

6、此需要构造一个检验的统计量来判断,许多因素(如总体是否服从正态分布;样本容量的大小;被检验的参数是什么;总体的方差是否已知等)决定了如何构造统计量,统计量服从什么样的精确(或渐进)分布。3 规定显著性水平,确定临界值、拒绝域。根据检验统计量的分布和显著性水平可以得到检验的临界值和拒绝域;4 根据实测的样本值,具体计算出所用统计量的值。5 做出拒绝或接受原假设的判断。若统计量的值落在拒绝域内,说明样本描述的情况和原假设有显著差异,应拒绝原假设而接受备择假设;反之,若统计量的值落在接受域内,则接受原假设而拒绝备择假设。 5假设检验的两类错误: 假设检验中也存在犯两类错误的可能。其中,由于犯第二类错

7、误的概率(记为)与总体参数的真实水平有关, 因而对它的研究和讨论一直停留在理论上,难以在实践中实现对它的控制。郭宝才(2010)、励晶晶(2010)等都对该问题展开过有益的讨论,但未能提出实际可行的控制方法。本文对于两类错误的成因以及如何控制第二类错误进行了探讨,希望对于第二类错误的控制提出一些解决的方法,本文主要针对单总体参数的假设检验来讨论,涉及样本均为简单随机样本。同时,两类错误与势函数的关系十分密切,这也将是本文讨论的一个方面。二两类错误的定义 在假设检验中对原假设的真伪作判断时,如果我们给出了某个检验法则,也即给出了样本空间的一个划分与。当我们拒绝了原假设时,是因为在一次试验中小概率

8、事件发生了,即样本值落入拒绝域内了;当我们接受原假设时,是因为我们还不能从概率意义上找到拒绝它的依据(样本值落入拒绝域)了。然而,由于样本本身具有随机性,因而当我们利用样本信息进行推断时,有可能犯以下两类错误: 第一类(拒真)错误:当原假设为真时,而样本值却落入拒绝域内了,按照检验法则应拒绝。这时,我们把客观上为真判为不真,称这种错误为“第一类错误”或“拒真”错误。犯第一类错误的概率就是前面提及的小概率,即 第二类(采伪)错误:当原假设不真时,而样本值落入了接受域内了,按照检验法则应接受。这时,我们把客观上不真判为为真,称这种错误为“第二类错误”或“采伪”错误。犯第二类错误的概率通常用表示,即

9、 为明确起见,将假设检验的两类错误归纳在下表中。接受拒绝为真决策正确第一类(拒真)错误不真第二类(采伪)错误决策正确 犯第二类错误的概率计算比较复杂,它的数值跟参数的真值有关。三两类错误的起因 第一类和第二类错误都是相对于假设而言的,下面通过一个例子来分别说明这两类错误的起因。 例:一个公司有员工3000人,为了检验公司员工工资统计报表的真实性,研究者做了50人的大样本随机抽样调查,人均收入的调查结果是:(样本均值)=871元;S(标准差)=21元问能否认为统计报表中人均收入=880元的数据是真实的?(显著性水平=0.05) 研究假设:调查数据871与报表数据880之间没显著差异,公司员工工资

10、均值的真实情况为880元。 :调查数据和报表数据之间有显著性的差异,公司员工工资均值的真实情况不是880元。 完成以上统计检验遵循这样的法则: A:样本平均数的分布服从正态分布。如果被假设的真实情况880元确实为真,那么样本平均数的区间估计为:,即874.18-885.82元; B:如果在这一次的抽样调查中,样本的平均数落在以上区间之内,那么就认为为真;反之,则拒绝。 C:由于在这次实际的抽样调查中,样本的平均数为871元,没有超出以上估计区间,所以接受,即认为这个公司员工工资的实际平均数为880元。 从上面的逻辑和操作过程中,我们可以看到如下两个方面的问题,正是由于这两个问题分别产生了和错误

11、:第一个问题是,我们只抽了一个样本,而个别的样本可能是特殊的,不管抽样多么符合科学抽样的要求,理论上讲,在3000个员工中随机抽取50人作为调查样本,有很多种构成样本的可能性。如果一个样本的平均数是880元,不代表任何一个样本的平均数都是880元。按照正态分布理论,也有5%的样本平均数不在874.18-885.82范围之内,这样的事件称为小概率事件。由于实际上我们只做了一次调查,不知道是否这个样本平均数就是小概率事件,如果这个调查的平均数超出了上述所说的范围,而且是小概率事件发生的结果(由我们假设),并且根据小概率原理这样的事件是基本不会发生的,那么我们必然要拒绝原假设,但是基本不会发生也就是

12、说还是可能发生,虽然错误发生的可能性比a小,但这样的可能毕竟是存在的。也就是说当确属为真时,检验统计量也有概率为的可能落人拒绝域,这一错误的概率就是,是为真的情况下计算出的统计量落入拒绝域的概率,这一概率也就是下图阴影部分的面积。 第二个问题是,统计检验的逻辑犯了从结论推断前提的错误。法则B是由法则A推断出来的。即如果A是正确的,那么B可能是正确的。相反,如果结果B是真实的,A的正确与否我们还不能判断。也就是说,如果一次调查的结果的样本平均数落在上述区间之内,我们无法判断所有员工平均工资为800元这一结论就是真。这就是第二类(纳伪)错误出现的原因。也就是说,由于检验是在Ho:的前提下展开的,故

13、检验是在平均数为的正态分布中进行的,只要x落入接受域,就可能犯纳伪错误,这一错误的产生不是以为为中心的正态曲线下在该区间的面积,不是,因为这时X实际所服从的是以()为中心的正态分布,因此纳伪错误的概率就是落入后者接受域的概率,这一概率就是所服从的以为中心的正态分布曲线下在该区间的面积,见下图。 四第二类错误的计算 1.设总体X,且方差已知时,,其中; 当为真时,有 由于,则犯第二类错误的概率为但实际上为假,即,即,则因此2.方差已知时,;可知改检验问题的拒绝域为,类似的有: (1)3.均值未知,其中当为真时,有故第二类错误的概率为:4.均值未知时,;可知该检验问题的拒绝域为类似的有,S为样本标

14、准差五如何控制犯“二类”错误 1. 两类错误间的关系: 很多时候,我们只注意到了的选取,都认为犯第一类错误的概率越小越好,但这是不正确的,我们可以从上面的犯第二类错误的概率值看出,在其他条件都不变的情况下,越小,越大;反之,。例如(1)式,当越小时,越大,由于分布函数是单调递增的,因此越小,越大。 2. 与第二类错误有关的因素: (1)与显著性水平有关,越小,越大。即之间存在“此消彼长”的关系。 (2)与真实值有关。同理从(1)式看出,越大,越小。也就是说,的差异越明显,犯第二类错误的概率越小。 (3)与样本值n有关。显然,其他不变时,n越大,越大,也将越小。并且,其他量一定时,随着n的增大,

15、为使减小一个相同的绝对量,需要增加的n 将越来越大。同时也可以这样理解,增加了样本量之后,均数的抽样误差小,样本均数的代表性强,也就是样本均数较接近总体均数,因而可使犯第一和第二类错误的概率减少。 i.下面举例,给定参数计算第一种情况的二类错误,并说明如何确定样本量n。例:设,均值只取两值之一,记为样本容量为n(n=36)的样本均值,检验假设 由于总体X服从正态分布,样本均值,拒绝或接受取决于随机变量(或)落在什么区间。我们把样本空间划分成互不相交的两部分,若检验的法则规定:,即;接受。于是有 (2) (3) 假设n一定,欲使小,则由(2)式知应增大,由于是严格增函数,故要求C增大,但从(3)

16、式知,C增大也会随之增大;反之,欲使小必会导致增大。 取=0.05,查正态分布表得临界值 即 =63.742 犯第二类错误的概率为 显然这个概率是相当大的。 在其他条件不变的情况下,如果要降低第二类错误的概率(=0.05),且保持=0.05不变,此时只能增大样本容量。 由 易得: 即 查表得 则n=271 ii.下面举例,给定参数计算第三种情况的第二类错误: 例:均值未知,样本容量n=16,显著性水平,考虑检验问题: 由上面的理论推导知,“取伪”概率 3. 具体说明在不同情况下样本容量的选择 (1)均值检验的样本容量选择 假设为来自正态总体的简单随机样本,样本均值为,样本容量为n,已知。 a

17、方差已知的情形。当方差已知时,重置抽样下 若为真,;若为真,。 建立原假设为: : 在这样的假定下,有 其中,c为临界值,经标准化后服从N(0,1),所以 根据上面两式分别解出c,有 可查表求得,于是解之可得 同理,对于左侧检验和双侧检验,样本容量的确定公式分别为: 左侧检验 双侧检验 b 方差未知的情况。当方差未知时,其中,S=。建立原假设为: ,于是,与方差已知时分析思路相同得到:由,因而可用来分别替代,那么因此,样本容量确定公式为同理,对于左侧检验和双侧检验,两类错误条件下的样本容量确定公式为:左侧检验双侧检验 (2)方差检验的样本容量选择 建立原假设为: 当为真时,; 当为真时,。 于

18、是: 同时 因此 从而解得: 那么对于左侧检验和双侧检验,两类错误条件下的样本容量确定公式分别为:左侧检验双侧检验六势函数(功效函数) 1.定义:设某检验问题的拒绝域为W,则样本观测值X落在拒绝域W内的概率称为该检验的功效函数,记为,为原假设和备择假设中的参数。 2.势函数的计算: 方差已知时,,其中; = (2)方差已知时,; = (3) 均值未知,其中; = (4)均值未知时,; = 7. 控制犯“二类”错误的重要性及应用 在生活和生产中的许多方面都需要用到假设检验,用到假设检验就不得不考虑两类错误,为了尽量同时减少两类错误的发生,人们往往会通过增大样本容量的方法达到目的。但是有的时候,增

19、大样本容量反而会使试验成本增加得不偿失。因此在有些应用上,需要在第一类和第二类错误中做出选择,尽可能的减少损失。下面是控制假设检验二类错误的理论在体育学中的应用。 如果知道运动员挫伤的自然治愈率为0.25,为了试验一种外用新药是或否有效,把它给10个运动员使用。我们事先规定一个决策规划:若这10个病人中至少有4人治愈过程加快,则认为这种药有效,提高了治愈率;反之,则认为无效。下面我们来计算一下: (1)虽然新药有效,并把治愈率提高到了0.35,但通过试验却被否定的概率(即犯第一类错误的概率) (2)新药完全无效,但通过检验却被判断为有效的概率(即犯第二类错误的概率)先来看(1)。在每次试验中,

20、此人治愈加快(“成功”)的概率P=0.35,治愈速度不变(“失败”)的概率为1-0.35=0.65.而且10个人的治愈加快与否可以认为彼此不影响,这样可以认为此问题为贝努里模型的10重贝努里试验。于是“否定新药”这一事件等价于P=0.35时,“10个人中至少有3个人治好”这一事件,故所求概率为P(否定新药)=就是说犯第一类错误的概率为0.5136.再来算犯第二类错误的概率,这时须注意的是,现在新药实际上是无效的,因而治愈加快率是自然治愈率0.25,而不是0.35.因此我们不能把(2)中的“判断新药有限”当成是(1)中的“否定新药”的对立事件,此时有P(判断新药有效)=如果我们把决策规则修改为“

21、若10个病人使用了新药后至少有三个人治好了,则认为这种药有效,它提高了治愈率;反之则认为无效”。这时由此例看到,当由0.5136减小至0.2615,反而由0.2241增至0.4744.我们在试验中应该正确认识这种的辩证关系,根据具体情况来决定是否应该增大而减小。拿此例来说,我们知道药品德效用是关系到人身健康的问题,因此,如果选择增大,即新药有效而被否定,犯了第一类错误,这是可能造成经济上的损失,但不会危机人的生命。如果新药无效而被肯定,则可能危机人的生命,也就是说,对于此类问题,应尽量减少犯第二类错误的概率8 结论 假设检验是统计学中十分关键的部分,为了更加精确的进行假设检验,我们就要考虑到两类错误的发生,一类是“弃真”错误,一类是“纳伪”错误。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论