版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第九章 检验的渐近相对效率非参数数据分析方法对产生数据的总体的分布不作假设,或仅给出很一般,例如连续型分布、对称分布等这样一些简单的假设。所以非参数数据分析方法的优点就是它可以在很多的情况下使用。既然非参数数据分析方法适用面广,人们会很自然地认为它的效率不高。与参数数据分析方法相比较,非参数数据分析方法的效率究竟有多高?这就是本章所要讨论的问题。本章仅将检验方法分别与单样本的符号检验方法和两样本的Wilcoxon秩和检验方法进行比较。检验是著名的正态总体假设下的参数检验方法,而Wilcoxon秩和检验是著名的非参数检验方法,符号检验是最为简单的非参数检验方法。至于其它的非参数检验方法与和它相对
2、应的参数检验方法的比较这里从略。有兴趣的读者请参阅参考书目24。通常使用的比较方法是,在待比较的两个检验有相同的样本容量的情况下,首先使得它们取同样的水平,然后分别计算它们的功效。由于功效表示备择假设成立时拒绝原假设的概率,所以功效越大,检验越好。由于1减去功效就是检验犯第二类错误的概率,所以这种比较方法实际上就是看样本容量相同并且犯第一类错误的概率也相同的两个检验,谁犯第二类错误的概率小。犯第二类错误概率小的那个检验为好。除了这个比较方法外,还有下面另一种比较方法。另一种比较方法首先使得待比较的两个检验取同样的水平,并取同样的功效,然后比较要达到水平和功效所需要的样本容量。所需要的样本容量比
3、较小的那个检验为好。不难看出,这两种比较方法相互等价。它们都是根据假设检验的NeymanPearson理论而引出的。本章将采用上述第二种方法将非参数检验方法与参数检验方法进行比较。一般来说,原假设是简单假设,而备择假设往往是复合假设。原假设成立时参数的取值空间是单点集,备择假设成立时参数的取值空间不是单点集,而是一个开区间。在备择假设成立时有了参数的值我们才能计算功效。究竟是对哪一些参数计算功效?这是我们在计算功效之前需要考虑的第1个问题。显然,我们最为关心的是接近于原假设的那一些参数的功效。如果一个检验在接近于原假设的那些参数的功效很大,那么这个检验就是一个好的检验。所以越是接近原假设的那些
4、参数的功效我们越关心。计算功效的参数要不要与样本容量有关?这是我们在计算功效之前需要考虑的又一个问题。对给定的某个参数,即使它非常接近原假设,当样本容量越来越大时,它的功效必然也越来越大。所以计算功效的参数要与样本容量有关,样本容量越大,计算功效的参数和原假设要越接近。样本容量趋于无穷大时计算功效的参数要趋于原假设。正因为考虑到这两个问题,所以本章是在样本容量比较大,直至趋于无穷大的时候比较两个水平相同的检验,比较它们为了在接近于原假设,直至趋于原假设的那一些参数处有相同的功效所需要的样本容量。9.1单样本符号检验与检验假设样本独立同分布,总体服从连续型分布,且的分布关于点对称,其密度函数为,
5、是偶函数。欲检验对称中心是否在原点0的右边,其原假设和备择假设分别为:和: (9.1)原假设成立时参数的取值空间是单点集,而备择假设成立时参数的取值空间是开区间。9.1.1 检验法可以使用检验法解(9.1)式的检验问题,其检验统计量为其中,如果总体X服从正态分布,则在原假设成立时,。如果不能确定正态总体假设是否成立,那么在原假设成立时,若,则有渐近标准正态分布。所以在样本容量比较大的时候,水平为的检验的拒绝域为。正如前面所说的,计算功效的参数要与样本容量有关,而且样本容量越大,计算功效的参数要与原假设,即原点0越接近。为此我们取一个参数序列,其中,是大于0的正数。显然,越大,越接近原点0,且在
6、时,。为什么令,而不是或其它,这是为了使得是一个常数,给数学处理带来方便。下面计算在参数处的功效,并使得这个功效等于给定的。所谓在处计算功效,就是在备择假设成立,当总体的分布关于点对称时计算功效,即计算概率的值。当总体的分布关于点对称时,根据中心极限定理我们有, (9.2)由于,所以功效 (9.3)由于在时,其中为总体的标准差,所以由(9.2)式知,从而由(9.3)式知,在时,。所以 (9.4)一般来说,水平比较小时,功效比较大,故,而。由(9.4)式我们得到满足的等式: (9.5)在参数接近原点0时,为了使其功效达到,检验需要多大的样本容量?有了(9.5)式,这个问题就容易解决了。为了区分使
7、用不同的检验方法需要的不同的样本容量,我们把使用检验法需要的样本容量记为。令,则由(9.5)式知,检验需要的样本容量 (9.6)下面我们计算符号检验在接近原点0的参数处达到功效所需要的样本容量。9.1.2符号检验法也可以使用符号检验法解(9.1)式的检验问题,其检验统计量为,在原假设成立时,并且在时,有渐近正态性:所以在样本容量比较大的时候,水平为的符号检验的拒绝域为在备择假设成立,当总体的分布关于点对称时,也有渐近正态性: (9.7)其中,由于是偶函数,所以假设在参数处的功效为,则有 (9.8)由于,所以在时, (9.9)又由于在时,所以 (9.10)由(9.7)、(9.9)和(9.10)三
8、式知,从而由(9.8)式知,在时所以,于是得到满足的等式: (9.11)在接近原点0的参数处功效达到时符号检验所需要的样本容量记为。令,则由(9.11)式知,符号检验需要的样本容量为 (9.12)显然,和的比值可用来表示符号检验对检验的优劣。和的比值小于1,说明要达到同样的水平和同样的功效,检验需要的样本容量小,而符号检验需要的样本容量大,故符号检验不如检验。反之,若和的比值大于1,说明符号检验优于检验。我们把和的比值称为符号检验对检验的渐近相对效率。由(9.6)和(9.12)两式知,符号检验对检验的渐近相对效率为。这个渐近相对效率与总体的方差以及总体的密度函数在对称中心处的值都有关系,所以我
9、们把它记为 (9.13)它称为在总体分布为时符号检验对检验的渐近相对效率(Asymptotic Relative Efficiency,简称ARE)。下面就几个重要的对称总体分布根据(9.13)式分别计算符号检验对检验的渐近相对效率。 当总体为标准正态分布时,所以 当总体为均匀分布时,所以 当总体为Laplace分布,密度函数为时,所以 当总体为Logistic分布,密度函数为时,所以符号检验非常简单,但是它对检验的渐近相对效率中也有一个大于1。我们同样也可以计算符号秩和检验对检验的渐近相对效率(它的计算过程留作本章习题第1题)。看了符号秩和检验对检验的渐近相对效率的计算结果(见表9.1),我
10、们对使用非参数数据分析方法就更有信心。表9.1 单样本符号与符号秩和检验对检验的渐近相对效率总体分布正态分布均匀分布Laplace分布Logistic分布密度函数,21符号秩和检验对检验的渐近相对效率只有在正态分布总体时才小于1。检验是由正态分布总体导出的检验,所以在正态总体时检验优于符号秩和检验理所当然。正态总体时符号秩和检验对检验的渐近相对效率为0.9549,很接近1。因而在正态总体时使用符号秩和检验仅仅略微降低效率。事实上,参数和非参数数据分析方法是针对不同情况提出来的两种统计分析方法,它们各有其优缺点,各有其适用范围,互为补充。有的时候,在解实际问题的时候,参数和非参数数据分析方法不妨
11、都用。9.2 两样本秩和检验与检验假设样本和分别来自相互独立的连续型随机变量总体X和Y,X和Y的分布函数分别为和。相应地,假设X和Y的密度函数分别为和。欲检验位置参数是否大于0,其原假设和备择假设分别为:和: (9.14)9.2.1 检验法可以使用检验法解(9.14)式的检验问题,其检验统计量为其中,如果总体服从正态分布,则在原假设成立时,。如果不能确定正态总体假设是否成立,那么在原假设成立时,若,且,是一个常数,则有渐近标准正态分布。所以在样本容量比较大的时候,水平为的检验的拒绝域为。由于我们是在,且时讨论问题,所以不妨假设,是一个常数,并让。取参数序列,其中,是一个大于0的正数。下面计算在
12、参数处的功效,并使得这个功效等于给定的。所谓在处计算功效,就是在备择假设成立,当总体X和Y的分布函数分别为和时计算功效,即计算概率的值。在备择假设成立时,若,则 (9.15)由于,所以功效 (9.16)由于在时,其中为总体的标准差,所以由(9.15)式知从而由(9.16)式知,所以有 (9.17)在接近原点0的参数处功效达到时检验所需要的样本容量记为。令,则由(9.17)式知,检验需要的样本容量为 (9.18)9.2.2秩和检验法下面使用Wilcoxon秩和检验法解(9.14)式的检验问题,其检验统计量为Y样本的秩和:其中为在合样本()中的秩。同检验,不妨假设,是一个常数。在原假设成立时,若,
13、则有渐近正态性:所以在样本容量比较大的时候,水平为的秩和检验的拒绝域为在备择假设成立时,计算Wilcoxon秩和检验的功效比较困难。考虑到Wilcoxon秩和检验法等价于MannWhitney U统计量检验法,所以我们转而计算MannWhitney U统计量检验的功效,然后计算MannWhitney U统计量检验对检验的渐近相对效率,从而得到Wilcoxon秩和检验对检验的渐近相对效率。MannWhitney U统计量检验法的检验统计量为其中在原假设成立时,且在时有渐近正态性:所以在样本容量比较大的时候,水平为的MannWhitney U统计量检验的拒绝域为同检验,取参数序列,其中 ,是大于0
14、的正数。由统计量的渐近正态性理论(详细内容请阅参考书目24)知,在备择假设成立,即当总体X和Y的分布函数分别为和时,也有渐近正态性:, (9.19)其中下面计算和的值。令,则所以令,则从而有假设在参数处的功效为,则有 (9.20)不难证明:在时,所以, (9.21)由于,所以当时, (9.22)从而由(9.19)、(9.21)和(9.22)三式知,在时由(9.20)式得,所以有 (9.23)在接近原点0的参数处功效达到时MannWhitney U统计量检验所需要的样本容量记为。令,则由(9.23)式知,MannWhitney U统计量检验需要的样本容量为 (9.24)显然,和的比值可用来表示MannWhitney U统计量检验,也就是Wilcoxon秩和检验对检验的优劣。和的比值称为Wilcoxon秩和检验对检验的渐近相对效率。由(9.18)和(9.24)两式知,这个渐近相对效率为,记为 (9.25)下面就几个重要的对称总体分布根据(9.25)式分别计算Wilcoxon秩和检验对检验的渐近相对效率,计算结果见表9.2。表9.2 两样本Wilcoxon秩和检验对检验的渐近相对效率总体分布正态分布均匀分布Laplace分布Logistic分布
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2030年中国平板电脑行业竞争策略及投资模式分析报告
- 农村电商模式研究
- 2024-2030年中国居民用水行业市场运营模式及未来发展动向预测报告
- 2024-2030年中国小微企业行业创新模式及未来发展规划展望报告
- 2024-2030年中国封闭式冷柜行业竞争状况与投资盈利预测报告
- 2024-2030年中国宾馆酒店行业发展趋势及经营战略分析报告
- 2024至2030年中国商用笔记本电脑数据监测研究报告
- 跨境法律金融课程设计
- 农业科学与农村文化创新儿童剧考核试卷
- 2024年汽车抵押贷款协议格式
- 国开电大 可编程控制器应用实训 形考任务6实训报告
- GB/T 34120-2023电化学储能系统储能变流器技术要求
- 跨国企业中方外派人员的跨文化适应
- 《道路交叉设计》课件
- 《活着》读后感-课件
- 体检报告汇总分析中风险的防范
- 村里建群管理制度
- 【城市轨道交通运营安全管理研究5300字】
- 2024年中核汇能有限公司招聘笔试参考题库含答案解析
- 上海市2024届高三7月模拟预测历史试题(等级考)(解析版)
- 肺炎护理查房课件
评论
0/150
提交评论