




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第七章 基于秩次的非参数检验前言:1. 问题的提出:前面学习了连续型资料两组样本均数差异的假设检验方法:小样本用t检验,条件是变量服从正态分布和方差齐。大样本用Z检验(中心极限定理)。如果是小样本,变量的分布不清、已知不服从正态分布或经数学转换后仍不服从正态分布时,如何检验两个样本或多个样本均数差异的统计学意义呢?需要一种不依赖于分布假定的检验方法,即非参数检验。2. 基本概念:前面介绍的检验方法首先假定变量服从特定的已知分布(如正态分布),然后对分布的参数(如均数)作检验。这类检验方法称为参数检验。今天介绍的检验方法不对变量的分布作严格假定,检验不针对特定的参数,而是模糊地对变量分布的中心位
2、置或分布形态作检验。这类检验称非参数检验,由于其对总体分布不作严格假定,所以又称任意分布检验。(1)非参数检验的优点:a. 不受总体分布的限制,适用范围广。b. 适宜定量模糊的变量和等级变量。c. 方法简便易学。(2)缺点:对于适合用参数检验的资料,如用非参数检验会造成信息的丢失,犯第类错误的概率增大,造成检验功效下降。(3)基于秩次的非参数检验(秩和检验)的基本思想:例:假设有一组观察值为1.1, 1.3, 1.7, 4.3, 11.4 。显然这一变量不服从正态分布,观察值间差异较大,既不对称,标准差也较大。如果将变量作转换,变成秩变量Y=1,2,3,4,5,则分布对称了,观察值间的差异也均
3、匀了,标准差也减小了。对秩和分布的中心位置(平均秩和)作检验,这就是秩和检验。一配对样本的符号秩检验(Wilcoxon signed rank test):例7.1:研究出生先后的孪生兄弟智力是否存在差异?表7.3 12对孪生兄弟智力测试结果对子号兄的得分弟的得分兄弟得分差秩次1868823271776737776-1-1.546864-4-45919655.5672720-77765-12-1089190-1-1.597065-5-5.510718099118881-7-8128772-15-11差值一般在5左右,但个别较大,如15,可能不服从正态分布。而且样本较小,不能利用中心极限定理作正
4、态假定。因此考虑使用非参数检验-符号秩检验。1符号秩检验的分布理论:假定有四对观察值,如果H0成立时,这四个值有同等的概率取正值或负值,即每个值取正值的概率等于二分之一。四个值共有24=16种组合,每种组合发生的可能性就是:。再考虑秩和,可能的结果数减少到11种,概率分布见表7.1。表7.1 n4时所有可能秩和情况和T*的分布正差数的秩次负差值的秩次正秩和T+负秩和T-概率P1,2,3,4-1000.06252,3,41910.06251,3,42820.06251,2,43730.12503,41,2731,2,34640.12502,41,3641,42,3550.12502,31,455
5、1,32,4460.125041,2,3461,23,4370.125031,2,43721,3,4280.062512,3,4190.0625-1,2,3,40100.0625如果零假设成立,观察的结果应该服从此分布,即出现极端的可能性很小。如果真是出现小概率,那么我们对零假设的真实性产生怀疑,拒绝零假设。2具体计算步骤:(1)检验假设:H0:差值的总体中位数为零。Md=0H1:差值的总体中位数不等于零。Md0=0.05。(2)编秩和计算秩和: 求差值,差值的绝对值由小到大编秩,差数为零不参加编秩,相同差值求平均秩。分别求正号和负号的秩和,取绝对值小的为T。(3)确定概率,下结论:查附表10
6、,在n=11时,T0.05=11。现T=24.511,故P0.05,按=0.05的水准,不拒绝H0。 (T小,P小)。3正态近似:当研究例数较大时(n50),秩和T的分布近似正态分布,可以用正态分布理论作假设检验:这时正态分布的均数和标准差分别等于:检验的公式为:二两独立样本的秩和检验(Wilcoxon rank sum test):表7.5 缺氧条件下猫与兔的生存时间(分)比较猫兔生存时间秩次生存时间秩次生存时间秩次生存时间秩次259.5151216281234151522172813441716323830144618174259.5351646191952711n1=5T1=78.5n2
7、=14 T2=111.5这是生存时间资料,一般不服从正态分布,个别寿命长的为特大值,样本也较小,需考虑用非参数检验-秩和检验。1具体计算步骤:(1) 检验假设:H0:两总体生存时间的中位数相等;H1:两总体生存时间的中位数不等; =0.05。(2) 编秩和计算秩和:两组由小到大混合编秩,有相同值求平均秩(同组相同值可不求平均秩),求例数较少组的秩和(T)。(数值为零应编秩。)(3) 确定概率,下结论:T值在表中两数值之间时,p值大于相应界值,T位于区间之外,P相应界值。本例T= T1=78.5,查附表11,T =78.578,P0.01,拒绝H0,可认为猫、兔在缺氧的条件下生存时间不等。2正态
8、近似:当样本较大时,秩和的分布近似正态分布,可以用正态分布理论作假设检验。这时正态分布的均数和标准差分别等于:检验公式为:三多个样本分布位置相同的假设检验:完全随机化设计资料分布位置的假设检验(Kruskal-Wallis test)表7.7不同吸烟习惯母亲的新生儿体重(秩次)(kg)ABCD2.7(3)2.9(4)3.3(7)3.5(11)2.4(2)3.2(5)3.6(12.5)3.6(12.5)2.2(1)3.2(6)3.4(9)3.7(14)3.4(9)3.4(9)4(n)34315(R)1537.537.5计算步骤:1. 检验假设:H0:k个总体中心位置相等H1:k个总体中心位置不全相等=0.052. 计算统计量:各组由小到大混合编秩;如不同组间出现相同值,求平均秩;计算各组的秩和。当H0成立时,该检验统计量近似服从自由度为(k-1)的c2分布。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工程消防评估合同范例二零二五年
- 二零二五版样品保密协议
- 2025年甘肃省民航机场集团劳务派遣工招聘58人笔试参考题库附带答案详解
- 最高额股权质押合同范例二零二五年
- 桩机劳务合同范例二零二五年
- 健康管理科课件
- 品鉴数学之美
- 2025年上海市自行交易版房屋租赁合同样本
- 冬奥里隐藏的数学知识
- 2025年度输电线路杆塔健康监测及环境优化工程设计与施工承包合同
- 消防设施操作员实战试题及答案分享
- 2025年北京电子科技职业学院高职单招(数学)历年真题考点含答案解析
- 山东省滨州市无棣县2024-2025学年七年级上学期期末生物试题(原卷版+解析版)
- 新东方在国际教育领域的布局与市场机会
- 2025年上半年海口市美兰区水务局下属事业单位招考易考易错模拟试题(共500题)试卷后附参考答案
- 2025届高三化学二轮复习 化学反应原理综合 课件
- 9.3.2《设计简单装置制作酸奶》跨学科实践主题学习单元教学设计
- 2025年郑州市九年级中考语文一模试卷附答案解析
- 2025年江苏苏州市(12345)便民服务中心招聘座席代表人员高频重点模拟试卷提升(共500题附带答案详解)
- 塔类设备绝热保冷施工方案
- 河北省石家庄市栾城区冶河镇初级中学-励志主题班会-拒绝间歇性努力不做45青年【课件】
评论
0/150
提交评论