版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第四章 非参数方法,4.1 拟合优度检验 4.2 独立性检验 4.3 符号检验 4.4 威尔科克森符号秩检验 4.5 威尔科克森秩和检验 4.6 QQ图,4.1 拟合优度检验,一、分类数据的2检验 二、分布拟合的2检验,一、分类数据的2检验,假定一个总体可分为k个类A1,A2,Ak,并设类Ai在总体中所占的比例为P(Ai)(i=1,2,k),且 。又设p1,p2,pk是一组给定的数值,满足pk0(i=1,2,k), 。欲检验 H0:P(Ai)=pi,i=1,2,k H1:P(Ai)pi,至少存在一个I 容量为n的样本中属于类Ai的频数为fi(i=1,2,k),有 。皮尔逊(K.Pearson,
2、1900)提出了一个检验统计量,并指出,当H0为真且n充分大(通常还要求npi5,i=1,2,k)时,2近似服从2 (k1)分布。 该检验称为2拟合优度检验(chisquare goodness of fit test)。对给定的显著性水平,其拒绝规则为: 若 ,则拒绝H0 例4.1.1 在一正20面体的20个面上,分别标以数字09,每个数字在两个对称的面上标出。为检验其匀称性,共作800次投掷试验,各数字朝正上方的次数列于表4.1.1: 试问该正20面体是否匀称(=0.05)。,表4.1.1 正20面体的800次投掷试验中,各数字朝正上方的观测频数,以Ai表示数字i朝正上方,i=1,2,9。
3、要检验 当H0为真时, 。,表4.1.2正20面体匀称性的2检验统计量计算过程,故接受H0,即认为该正20面体匀称。 如果pi(i=1,2,k)含有r(k1)个未知参数(如k=3,且p1=2,p2=2(1) ,p3=(1) 2,其中含有一个未知参数),则这r个未知参数可用其极大似然估计代替。用 代替上式中的pi,得 费希尔(R.A.Fisher,1924)指出,当H0为真且n充分大时,2近似服从自由度为kr1的2分布。检验的拒绝规则类似于前面的式子,只需将自由度由k1改为kr1即可。,二、分布拟合的2检验,欲检验假设 H0:F(x)=F0(x),H1:F(x)F0(x) 1.总体x为离散型的情
4、形 2.总体x为连续型的情形,1.总体x为离散型的情形,H0:P(x=ai)=pi,i=1,2,, H1:x不具有H0中的分布列 可将x的取值a1,a2,分成若干类。具体做法是,把npi5的ai各自作为一类,而把npi5的ai合并成一些类或合并到npi5的类中,以使每一类的期望频数都大于等于5。 例4.1.2 为检验工作日上午到达某商店顾客数是否服从泊松分布的假设,随机抽取了一个由工作日上午的128个10分钟时间段组成的样本。试检验工作日上午的10分钟时间段的顾客数x是否服从泊松分布(=0.05)。,表4.1.3128个10分钟时间段到达某商店顾客数的观测频数,解 建立假设 H0:x服从泊松分
5、布,H1:x不服从泊松分布 的极大似然估计值为 。,表4.1.4到达顾客数的期望频数,表4.1.5分类后2统计量的计算过程,故不能拒绝H0。,2.总体x为连续型的情形,若要检验总体x是否服从某连续型分布,则需先把x的取值范围划分为k个互不相交的区间: (a0,a1,(a1,a2,(ak2,ak1,(ak1,ak) 其中=a0a1ak1ak=。这k个区间相当于k个类,当H0为真时,每个类在总体中所占的比例为 pi=P(ai1xai)=F0(ai)F0(ai1), i=1,2,k 式中若含有未知参数,则用极大似然估计值代替。分类时应使各类的期望频数npi5。,例4.1.3 试问表1.2.1中的多元
6、统计分析期末考试成绩数据是否提供了充分的证据,说明观测值并非来自正态总体(=0.05)。 解 依题意,需检验假设 H0:x服从正态分布,H1:x不服从正态分布 正态分布中含有两个未知参数和,它们的极大似 然估计值为 。 故当H0为真时,x的分布函数F0(x)可估计为,表4.1.6 考试成绩区间的期望频数,表4.1.7 2统计量的计算过程,故拒绝H0。,4.2 独立性检验,欲检验 H0:两个变量x和y相互独立 H1:两个变量x和y不相互独立 为了检验上述假设,我们可按变量x的取值将总体分为k个类A1,A2,Ak,同时又按变量y的取值将总体分为l个类B1,B2,Bl。记 pij=P(xAi,yBj
7、),i=1,2,k,j=1,2,l pi=P(xAi),i=1,2,k pj=P(yBj),j=1,2,l 显然有,设(x1,y1),(x2,y2),(xn,yn)是一个样本,用fij表示样本观测中x值落入类Ai而y值落入类Bj中的频数(i=1,2,k,j=1,2,l),用fi表示样本观测中x值落入类Ai中的频数(i=1,2,k),用fj表示样本观测中y值落入类Bj中的频数(j=1,2,l)。于是有 分类结果可列成如表4.2.1所示的二维表形式,该表称为列联表(contingency table)。,表4.2.1按两个变量值分类的列联表,各pi和pj的极大似然估计分别为: 采用检验统计量 当H
8、0为真,且n充分大,期望频数 时,2近似服从自由度为(k1)(l1)的2分布。对给定的,其拒绝规则为: 若 ,则拒绝H0,例4.2.1 在一项关于某些家庭用品的价格与质量关系的研究中,一个市场调查公司让一组家庭主妇来检验135种产品,并请她们按劣、中、优三个等级对这些产品作出评价。表4.2.2中所列的便是这些主妇按产品的价格类别对这135种产品所作的交叉分类。取=0.01,试检验价格与质量的独立性。,表4.2.2评价等级与价格类别列联表,解 依题意,需检验假设 H0:评价与价格独立,H1:评价与价格不独立 当H0为真时,各期望频数 ,其结果列于表4.2.3中,,表4.2.3表4.2.2中的期望
9、频数,从而得 故拒绝H0。,4.3 符号检验,本节介绍一种可用来对总体中位数进行假设检验的非参数方法符号检验(sign test)。 设x1,x2,xn是从具有连续型分布的总体x中抽取的一个样本。记m为x的中位数,欲检验 H0:m=m0,H1:mm0 令 yi=xim0,i=1,2,n 当H0为真时,y1,y2,yn中正号的个数s+服从于二项分布b(n,0.5),该p值也可通过查二项分布表获得。检验的拒绝规则为: 若p,则拒绝H0 H0:mm0,H1:mm0(或H0:m=m0,H1:mm0) H0:mm0,H1:mm0(或H0:m=m0,H1:mm0) 。,例4.3.1 为检验某商店日营业额的
10、中位数是否少于14万元,随机抽取13天的日营业额记录如下(单位:万元): 11.2,12.6,14.0,12.3,11.5,17.2,13.8, 11.5,13.2,12.4,14.8,15.4,12.5 试问这组数据是否提供了充分的证据,说明日营业额的中位数不到14万元(=0.05)。 解H0:m14,H1:m=0.05,故不能拒绝H0。,在n20的情形下,符号检验的p值通常可从二项分布表中查得。在n20的情形下,二项分布b(n,0.5)可用正态分布N(,2)近似代替,其中 。对给定的显著性水平,以上各假设的拒绝规则分别为: 若 ,则拒绝H0 若 ,则拒绝H0 若 ,则拒绝H0,例4.3.2
11、 检验某种维尼纶的纤度,测得100个数据列于表4.3.1中,试问这组数据是否提供了充分证据来否定该维尼纶纤度的中位数m为1.40的说法(=0.05)。 解 H0:m=1.40,H1:m1.40 题中,n=100,s+=43,由于 故接受H0。,表4.3.1 维尼纶纤度的100个数据,4.4 威尔科克森符号秩检验,一、对称总体的中位数检验 二、基于成对数据的比较两个总体分布的检验,一、对称总体的中位数检验,设x1,x2,xn是从总体x中抽取的一个样本,x为连续型随机变量,且其分布对称。记m为x的中位数,希望检验 H0:m=m0,H1:mm0 令 yi=xim0,i=1,2,n 将|y1|,|y2
12、|,|yn|从小到大依次排列,|yi|在其中的排列序号称为|yi|的秩(rank),记作Ri,i=1,2,n。若出现几个相同的绝对值,则使用它们的平均秩。威尔科克森符号秩检验(Wilcoxon signed-rank test)使用检验统计量 T=min(T+,T),其中 ,它们分别是y1,y2,yn中正值的秩和及负值的秩和,且满足 。对于给定 的显著性水平,检验的拒绝规则为: 若TT0,则拒绝H0 此处T0由附录二的表5给出。 H0:mm0,H1:mm0(或H0:m=m0,H1:mm0) 拒绝规则为: 若TT0,则拒绝H0 H0:mm0,H1:mm0(或H0:m=m0,H1:mm0) 拒绝规
13、则为: 若T+T0,则拒绝H0 这里两个检验中的T0仍从附录二的表5读出。,当样本容量n很大,如n25时,T+的抽样分布接近于正态分布。采用检验统计量 上述各假设的拒绝规则分别为: 若|u|u/2,则拒绝H0 若uu,则拒绝H0 若uu,则拒绝H0 例4.4.1 在例4.3.1中,假定该商店的日营业额分布是对称的,试用威尔科克森符号秩检验再做检验。 解 建立的假设是 H0:m14,H1:m14 令yi=xi14,从样本中剔除yi=0的天。正yi值的秩和为,对=0.05,查威尔科克森符号秩检验的T0值表得T0=17T+,故不能拒绝H0。,表4.4.1日营业额的符号秩,SAS输出中的符号检验统计量
14、为 威尔科克森符号秩检验统计量为,输出4.4.1 位置参数检验表,二、基于成对数据的比较两个总体分布的检验,从总体x和总体y中抽取成对样本(x1,y1),(x2,y2),(xn,yn)。 设总体x和总体y的分布函数分别为F(a)和G(a),欲检验 H0:F(a)=G(a),H1:F(a)G(a) 令di=xiyi(i=1,2,n),将这些差值的绝对值|di|由小到大排秩,|di|的秩记作Ri,使用检验统计量 T=min(T+,T) 其中 ,它们分别是正、负两种差值的秩 和。对于给定的,其检验的拒绝规则与(4.4.3)式(或(4.4.10)式)相同。,例4.4.2 为检验甲、乙两家邮件快递公司的
15、服务质量,选择十个不同的时刻,在其每一时刻同时将相同的两份邮件分别交给这两家公司,完成每次邮递所需的时间如表4.4.2所示(单位:小时)。试问这些数据是否表明两家公司的邮递时间有显著差异(=0.05)。,表4.4.2邮递时间,解 依题意,需检验假设 H0:两总体分布相同,H1:两总体分布不相同 令di=xiyi(i=1,2,10),有关结果列于表4.4.2中。将di=0的数据从样本中剔除,于是样本容量变为n=9。由于 从而 T=min(T+,T)=T+=15.56=T0 故不能拒绝H0。,4.5 威尔科克森秩和检验,如果来自两个总体的样本是相互独立的,则可以使用威尔科克森秩和检验(Wilcox
16、on rank-sum test)对两个总体进行比较检验。 设 是取自总体x的一个样本, 是取自总体y的一个样本,且两个样本相互独立。又设总体x和总体y的分布函数分别为F(a)和G(a),希望检验 H0:F(a)=G(a),H1:F(a)G(a) 将 和 混合在一起,并按其大小由小到大进行排秩,记xi在混合样本中的秩为Ri,i=1,2,n1。威尔科克森在1945年提出,把 在混合样本中的秩的总和,作为检验上述假设的检验统计量。对于给定的,检验的拒绝规则可制定为: 若TTL或TTU,则拒绝H0 其中TL的值可直接从附录二的表6读出,而TU的值可由下式算出。 TU=n1(n1+n2+1)TL H0
17、:F(a)G(a),H1:F(a)G(a) (或H0:F(a)=G(a),H1:F(a)G(a) 拒绝规则为: 若TTU,则拒绝H0,H0:F(a)G(a),H1:F(a)G(a) (或H0:F(a)=G(a),H1:F(a)G(a) 拒绝规则为: 若TTL,则拒绝H0 TL同样可从附录二的表6读出,TU由(4.5.4)式算得。 当n1和n2都大于或等于10时,T的抽样分布可作正态近似。采用检验统计量 对于给定的,上述各假设的拒绝规则分别为: 若|u|u/2,则拒绝H0 若uu,则拒绝H0 若uu,则拒绝H0,例4.5.1 有甲、乙两台机床加工同样的产品。从这两台机床加工的产品中分别随机地抽取
18、若干件,并测得其产品直径为(单位:毫米): 甲:18.2,18.3,17.0,18.4,17.5,17.2,18.5,17.5 乙:19.1,18.5,18.0,19.2,16.7,18.4,17.6,18.8,17.3 试问这些数据能否表明甲、乙两台机床加工产品的直径有显著差异(=0.05) 解 依题意,n1=8,n2=9,建立假设 H0:两总体分布相同,H1:两总体分布不相同 查TL值表得TL=51,又由(4.5.4)式算得 TU=n1(n1+n2+1)TL=8(8+9+1)51=93 由于TLT=60TU,故不能拒绝H0。,表4.5.1 产品直径,4.6 QQ图,QQ图可简便地从直观上判断一组样本数据是否来自具有某种分布形式的总体。 设x1,x2,xn是来自连续型总体x的一组样本观测值,x的分布函数为F(x),
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 汗腺炎的健康宣教
- 草莓鼻的健康宣教
- 中西医结合治疗过敏性鼻炎的环境控制
- 安徽交控集团界阜蚌公司招聘笔试冲刺题2025
- 瑞昌市工程建设监理事务所招聘笔试冲刺题2025
- 端午节活动方案模板
- 眼镜经典广告词
- 清明节缅怀先烈演讲稿
- 网络直播行业内容创作与传播策略研究报告
- 安徽公务员行测试题答案和解析完整版
- 数据分析基础与应用指南
- 人教版(PEP)小学六年级英语上册全册教案
- 广东省广州市海珠区2023-2024学年六年级上学期月考英语试卷
- 消防水域救援个人防护装备试验 大纲
- 机电样板施工主要技术方案
- 涉税风险管理方案
- 青岛市2022-2023学年七年级上学期期末道德与法治试题
- 高空作业安全免责协议书范本
- 石油化学智慧树知到期末考试答案章节答案2024年中国石油大学(华东)
- 手术后如何防止排尿困难
- 特种设备“日管控、周排查、月调度”表格
评论
0/150
提交评论