非参数统计的_第1页
非参数统计的_第2页
非参数统计的_第3页
非参数统计的_第4页
非参数统计的_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、非参数统计非参数统计(nonparametric statistics),数理统计学重要内容。研究非参数问题,探究非参数方法。非参数问题是指统计总体分布形式未知或虽已知却不能用有限个参数刻画的统计问题。在多数场合下,与参数问题界线清楚,只在少数情况下会因为各人出发点不同而有不同看法。非参数方法有拟合优度检验、次序统计量、U统计量、秩统计量与秩方法、置换检验、非参数回归与判别等等。非参数方法并非绝对只能解决非参数问题,有些也可用于典型的参数统计问题。非参数统计方法无法依赖总体的具体分布形式,构造的统计量常与具体分布无关,故又称非参数方法为自由分布方法。这样,非参数方法的性能对分布的实际形式如何并

2、不敏感,即非参数方法常具较好的稳健性。非参数方法需要考虑在约束条件十分宽松的情况下使用,有可能导致效率的下降。非参数统计难以建立小样本理论,基本属于大样本理论的内容。非参数统计形成于20世纪40年代,已成为一个体系庞大、理论精深且富有实用价值的统计分支。参数简介非参数统计是统计学的一个重要分支,它在实践中有着广泛的应用。所谓统计推断,就是由样本观察值去了解总体,它是统计学的基本任务之一。若根据经验或某种理论我们能在推断之前就对总体作一些假设,则这些假设无疑有助于提高统计推断的效率。这种情况下的统计方法称为“参数统计”。如果我们所知很少,以致于在推断之前不能对总体作任何假设,或仅能作一些非常一般

3、性(例如连续分布、对称分布等)的假设,这时如果仍然使用参数统计方法,其统计推断的结果显然是不可信的,甚至有可能是错的。在对总体的分布不作假设或仅作非常一般性假设条件下的统计方法称为“非参数统计”。由于非参数统计方法与总体究竟是什么分布几乎没有什么关系,所以它的应用范围很广,它在社会学、医学、生物学、心理学、教育学等领域都有着广泛的应用。由于有关于总体的假设,所以参数统计的推断方法是针对这个假设的。相对而言,非参数统计的推断方法是很一般的,它仅应用样本观察值中一些非常直观(例如次序)的信息。所以非参数统计分析含有丰富的统计思想。举例说明例如,检验“两个总体有相同分布”这个假设,若假定两总体的分布

4、分别为正态分布N(1,2)和N(2,2),则问题只涉及三个实参数1,2,2,这是参数统计问题。若只假定两总体的分布为连续,此外一无所知,问题涉及的分布不能用有限个实参数刻画,则这是非参数统计问题。又如,估计总体分布的期望,若假定总体分布为正态 N(,2),则问题是参数性的;若只假定总体分布的期望值存在,则问题是非参数性的。不过参数统计与非参数统计之间并没有泾渭分明的界线。例外有的统计问题,从不同的角度,可以理解为参数性的,也可以理解为非参数性的。例如线性回归(见回归分析)问题,若关心的是估计回归系数,它只是有限个实参数,因而可以看成是参数性的。但是,如果对随机误差的分布类型没有作任何假定,则从

5、问题的总体分布这个角度看,也可以看成是非参数性的。统计方法重要的非参数统计方法秩方法是基于秩统计量(见统计量)的一类重要的非参数统计方法。设有样本X1,X2,Xn,把它们由小到大排列,若Xi在这个次序中占第Ri个位置(最小的占第1个位置),则称Xi的秩为Ri(i=1,2,n)。1945年F.威尔科克森提出的两样本秩和检验是一个有代表性的例子。设X1,X2,Xm和Y1,Y2,Yn分别是从分布为 F(x)和 F(x-)的总体中抽出的样本,F连续但未知,也未知,检验假设 H:=0,备择假设为0(见假设检验)。记Yi在混合样本(X1,X2,Xm,Y1,Y2,Yn)中的秩为Ri,且为诸秩的和,当W C时

6、,否定假设H,这里C决定于检验的水平。这是一个性能良好的检验。秩方法的一个早期结果是C.斯皮尔曼于1904年提出的秩相关系数。设(X1,Y1),(X2,Y2),(Xn,Yn)是从二维总体(X,Y)中抽出的样本,Ri为Xi在(X1,X2,Xn)中的秩,Qi为Yi在(Y1,Y2,Yn)中的秩,定义秩相关系数为(Ri,Qi)(i=1,2,n)的通常的相关系数(见相关分析)。它可以作为X、Y之间相关程度的度量,也可用于检验关于X、Y独立性的假设。次序统计量和U 统计量在非参数统计中也有重要应用。前者可用于估计总体分布的分位数(见概率分布)、检验两总体有相同的分布及构造连续总体分布的容忍限和容忍区间(见

7、区间估计)等。后者主要用于构造总体分布的数字特征的一致最小方差无偏估计(见点估计)及基于这种估计的假设检验。苏联数学家.柯尔莫哥洛夫和.斯米尔诺夫在20世纪30年代的工作开辟了非参数统计的一个方面,他们的方法基于样本X1,X2,Xn的经验分布函数Fn(x)(见样本)。柯尔莫哥洛夫考察 Fn(x)与理论分布F(x)的最大偏差墹n,当墹n超过一定限度时,否定这个理论分布F(x)。这就是柯尔莫哥洛夫检验。斯米尔诺夫则考察由两个分布为F(x)和g(x)的总体中抽出的样本X1,X2,Xm和Y1,Y2,Yn计算其经验分布Fm(x)和gn(x)的最大偏差墹mn,当墹mn超过一定限度时,否定“F与g相等”这个

8、假设。这就是斯米尔诺夫检验。在非参数性估计方面,有关于估计分布的对称中心、概率密度函数和回归函数等比较重要的成果 。基本特点非参数统计问题中对总体分布的假定要求的条件很宽,因而针对这种问题而构造的非参数统计方法,不致因为对总体分布的假定不当而导致重大错误,所以它往往有较好的稳健性(见稳健统计),这是一个重要特点。但因为非参数统计方法需要照顾范围很广的分布,在某些情况下会导致其效率的降低。不过,近代理论证明了:一些重要的非参数统计方法,当与相应的参数方法比较时,即使在最有利于后者的情况下,效率上的损失也很小。由于非参数统计中对分布假定要求的条件宽,因而大样本理论(见大样本统计)占据了主导地位。第

9、二次世界大战前,非参数统计的大样本理论已有了一些结果,从20世纪50年代直到现代,更有了显著的进展,尤其是关于秩统计量与U 统计量的大样本理论,及基于这种理论的大样本非参数方法,研究成果很多。适用范围非参数统计最常用于具备下述特征的情况:1、待分析数据不满足参数检验所要求的假定,因而无法应用参数检验。例如,我们曾遇到过的非正态总体小样本,在t-检验法也不适用时,作为替代方法,就可以采用非参数检验。2、仅由一些等级构成的数据,不能应用参数检验。例如,消费者可能被问及对几种不同商标的饮料的喜欢程度,虽然,他们不能对每种商标都指定一个数字来表示他们对该商标的喜欢程度,却能将几种商标按喜欢的顺序分成等

10、级。这种情形也宜采用非参数检验。3、所提的问题中并不包含参数,也不能用参数检验。例如,我们想判断一个样本是否为随机样本,采用非参数检验法就是适当的。4、当我们需要迅速得出结果时,也可以不用参数统计方法而用非参数统计方法来达到目的。一般说来,非参数统计方法所要求的计算与参数统计方法相比,完成起来既快且易。有些非参数统计方法的计算,就算对统计学知识不熟练的人,也能在收集数据时及时予以完成 。相对优点非参数统计与传统的参数统计相比,有以下优点:1、非参数统计方法要求的假定条件比较少,因而它的适用范围比较广泛。2、多数非参数统计方法要求的运算比较简单,可以迅速完成计算取得结果,因而比较节约时间。3、大多数非参数统计方法在直观上比较容易理解,不需要太多的数学基础知识和统计学知识。4、大多数非参数统计方法可用来分析如象由等级构成的数据资料,而对计量水准较低的数据资料,参数统计方法却不适用。5、当推论多达3个以上时,非参数统计方法尤具优越性。相对缺点非参数统

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论