第七章 非参数统计.pptx_第1页
第七章 非参数统计.pptx_第2页
第七章 非参数统计.pptx_第3页
第七章 非参数统计.pptx_第4页
第七章 非参数统计.pptx_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七章 非参数统计 非参数统计(亦称非参数检验),是根据样本资料对总体的某种性质或关系进行假设检验的统计推断方法。主要特点不要求总体分布已知或对总体分布作任何限制性假定;不以估计总体参数为目的;定性变量中的定类数据或定序数据 ,也能适用于定距数据和定比数据这种定量变量 方法直观,易于理解,运算比较简单。缺点是检验的功效不如参数检验方法。主要内容2检验成对比较检验曼惠特尼U检验游程检验等级相关检验2检验一、什么是2检验2检验是利用随机样本对总体分布与某种特定分布拟合程度的检验,也就是检验观察值与理论值之间的紧密程度。 设有k(K2)个观察值,f0为它们的实际频数,fe为理论频数。构造一个统计量其

2、中,k-1为自由度。 皮尔生定理表明,当样本容量充分大时,样本分成K类,则2统计量服从2分布。自由度为k-11、拟合优度检验二、应用利用样本信息对总体分布作出推断,检验总体是否服从某种理论分布(如二项分布、均匀分布或正态分布等)。 检验步骤抽样并对样本资料编成频数分布,形成k个互斥的类型组。 (f0)对总体分布建立假设H0:总体服从某种理论分布H1:总体不服从该理论分布以“原假设H0为真”导出一组期望频数(fe)计算检验统计量比较2值与临界值作出检验判断自由度(df)k-1-m。其中k为组数。(各组理论频数不得小于5,如不足5,可合并相邻的组,如需合并,则k为合并后的组数)m为计算理论频数时所

3、估计参数的个数。(未指定总体的参数,需要观察值计算相应的统计量,作为未参数的估计值) 。2、独立性检验二、应用用于判断两个变量是否存在交互影响。如果两个变量不存在交互影响,就称为独立,所以这类检验也称为独立性检验。 检验步骤对总体的两个变量建立假设H0:两变量独立H1:两变量关联将样本资料编成rc列联表,并列出实际频数Oij计算理论频数计算检验统计量比较2值与临界值作出检验判断要点说明列联表形式(rc)O11O21O31.Or1O12O22O32.Or2O13O23O33.Or3.O1cO2cO3c.OrcO1O2O3.Or123.r行(r)列(c)123cxy合计 n.1 合计X的边缘频数y

4、的边缘频数理论频数Eij的计算先求理论频率(作为概率的近似)。概率论中关于概率独立的基本规则:如果两事件独立,则它们的联合概率等于它们各自概率的乘积,P(AB)=P(A)P(B)。因此,某一行某一列的联合概率:自由度(df)的确定df=(r-1)(c-1)rc=22的列联表资料,2值简算公式xy1212abcda+cb+da+bc+d合计合计n成对比较检验 是对两个相关样本的比较分析。有符号检验和威尔科克森带符号的等级检验两种方法。 符号检验 也称正负号检验,其基本思想是分析正负号出现的频率而忽略具体量的差异,以确定他们是否有显著差异的一种检验方法。 检验步骤 1.确定配对样本,分别计算差异正

5、与负的数目,无差异则记为0,将它从样本中剔除,并相应地减少样本容量n,把正负号数目之和视为样本总个数(n) 。2.建立假设:H0: p=0.5 ; H1:p0.53.观察样本容量,如果n25,则作为二项分布处理 如果n25,则作为正态近似处理。 4.设定显著性水平,并查表确定临界值,进行比较和作出判断。 例 1:随机抽取12个单位,放映一部描述吸烟有害健康的影片, 并调查得到观看电影前后各单位职工认为吸烟有害的人 数的百分比。检验该电影宣传是否有效果(=0.05)。解:H0:P=0.5 H1:P 0.5 P(0)=0.0002, P(1)=0.0030, P(2)=0.0161, P(3)=0

6、.0537P(0)+P(1)+P(2)=0.01930.05P(3)+0.01930.05370.0193=0.0730.05 0123456可见,拒绝域应为0,1,2。789101112拒绝域现检验统计量(-)=3 (即3个负号),0.0730.05所以,原假设H0:P=0.5在5%显著性水平上不能被拒绝。也即不能认为职工在观看影片前后的认识有显著提高。例2:随机抽取60名消费者对甲、乙两种品牌的饮料评 分,甲 、乙得分之差为“+”号者35个,“-”号15 个,“0”号10个。以显著性水平=0.05检验两种饮料是否同等受欢迎。解:H0:P=0.5, H1:P0.5n25,按正态分布近似处理该

7、成数抽样分布的均值和标准差分别为2.821.96,所以,拒绝原假设。认为两种饮料并不受到同等欢迎。且乙种优于甲种。威尔科克森带符号的等级检验这种检验方法不仅考虑了两组数据差异的正、负号,而且还利用了其差异大小的信息。因此,是一种更为有效的检验方法。1、应用条件和检验内容与符号检验相同。2、方法思想:若关联样本的两组数据没有显著差异,则不仅其差异的正、负符号应大致相等,而且将其差的数值按大小顺序排列编自然序号(即秩)后,它们的正号(+)的秩和(记为T+)与负号(-)的秩和(记为T-)也应该大致相等。其中之较小者也应趋近于总秩和的平均数( )。若正秩和(T+)与负秩和(T-)相差太大,其中较小者偏

8、离总秩和的平均( )较远,以致超过给定显著性水平所确定的临界点,就可以认为这两组数据存在显著差异,即总体的分布不相同。检验步骤将样本数据配对并计算各对正负差值将差数取绝对值按从小到大顺序排列并编上等级,即确定顺序号1、2、3等。对于相等的值,则取其位序的平均数为等级 建立假设:H0:T+= T- ; H1 : T+ T-(双侧) H1 :T+T-或T+T-(单侧) 计算检验统计量: 当n25时当n25时,取T+、T-中之小者设定,并查表确定临界值T(或Z/2)比较检验值与临界值作出判断,对于n25,TT, 拒绝H0; TT, 接受H0接受区域拒绝区域拒绝区域T=5 T=40 =22.5 曼惠特

9、尼U检验曼惠特尼U检验适用于从两个总体中分别独立抽取两个样本的检验,方法思想与威尔科克森秩和检验相同。检验步骤:从总体A、B中分别独立抽取样本nA和nB,将(nA+nB)个观察值从小到大编序分别计算两个样本,的秩和TA和TB建立假设H0:两总体A和B相对次数分布相同 H1:两总体相对次数分布不同计算检验统计量nA、nB10时,取UA、UB中小者 UA= nAnB+ nA(nA +1)/2-TA UB= nAnB+ nB(nB +1)/2-TBnA、nB10时设定显著性水平,查U表或Z表得到临界值比较统计量与临界值,作出判断,对于nA、nB20 UU,拒绝H0, UU,接受H0游程检验一、什么是

10、游程检验游程检验(亦称连贯检验)是根据样本标志表现排列所形成的游程的多少进行判断的检验方法。设某样本n=12人的标志表现为男、女,有以下三种排列。 (i) 男,男,女,女,女,男,女,女,男,男,男,男 (ii) 男,男,男,男,男,男,男,女,女,女,女,女 (iii) 男,女,男,女,男,女,男,女,男,女,男,男连续出现男或女的区段称为游程。每个游程包含的个数为游程长度。以r表示序列中游程的个数: (i)r=5, (ii)r=2, (iii) r=11(i)是随机性序列;(ii)(iii)是非随机性序列,所以,可以用游程的个数来检验样本的随机性,或总体的分布特征。二、游程检验方法 1检验

11、总体分布是否相同。将从两个总体中独立抽取的两个样本的观察值混合有序后,观察游程个数,进行比较。2检验样本的随机性将取自某一总体的样本的观察值按从小到大顺序排列,找出中位数(或平均数),分为大于中位数的小于中位数的两个部分。用上下交错形成的游程个数来检验样本是否是随机的。3检验规则(小样本,n1与n2都小于20) 应用表La和Lb,(=0.05,r为临界值)(1)单侧检验: 观察到的游程个数ro临界值(La表) 或ro临界值(Lb表) 反之,接受Ho。(2)双侧检验: 观察到的游程个数ror(La)ror(Lb) 接受Ho 下限 上限反之,拒绝Ho否定Ho4大样本(n1或n2大于20),游程个数r

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论