版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第八章 秩转换的非参数检验 (nonparametric test) 非参检验非参检验 参数检验无法使用的情况下:参数检验无法使用的情况下:1.资料分布不满足参数检验条件;资料分布不满足参数检验条件;2.不满足方差齐性;不满足方差齐性;3.数据不能精确测量,如数据不能精确测量,如“50mg”;4.结局变量为有序分类的资料。结局变量为有序分类的资料。2非参检验非参检验 经典统计的多数检验都假定了总体的背景经典统计的多数检验都假定了总体的背景分布。分布。 但也有些没有假定总体分布的具体形式,但也有些没有假定总体分布的具体形式,仅仅依赖于数据观测值的相对大小(秩)仅仅依赖于数据观测值的相对大小(秩)
2、或零假设下等可能的概率等和数据本身的或零假设下等可能的概率等和数据本身的具体总体分布无关的性质进行检验。具体总体分布无关的性质进行检验。 这都称为非参数检验这都称为非参数检验 在资料能够进行参数检验或者能够通过转在资料能够进行参数检验或者能够通过转换换符合符合参数检验的参数检验的条件条件下,下,首选参数检验首选参数检验,因为非参仅仅考虑参数的位置分布,而,因为非参仅仅考虑参数的位置分布,而忽略了详细的信息,忽略了详细的信息,检验效能检验效能降低。降低。32008年8月方法小节非参数检验非参数检验用途用途参数检验参数检验非参数检验非参数检验 非参数检验的方法选择多样: 独立独立两样本两样本所来自
3、总体比较:所来自总体比较: wilconxon rank sum test/ wilconxon mann-whitney u kolmogorov-smimov z: 检验样本是否来自同一总体 moses extreme reactions: 当样本中同时含有正值和负值时选用的方法。 wald-wolfowitz runs:检验两个样本所在总体的任一点分布情况是否相同51. 成组设计两成组设计两样本的比较样本的比较! 配对配对/相关相关两样本两样本所来自的总体的比较:所来自的总体的比较: wilcoxon: wilcoxon符号秩和检验,为相关样本差值的秩和检验,系统默认值; sign:符号
4、检验,利用正负号检验,效率低 mcnemar: 常用的配对卡方检验,只用于两分类资料,检验两组间分类有差异的频数,不考虑相同分类的频数; marginal homogeneity: 与mcnemar类似,只分析有差异的情况!6非参数检验非参数检验2. 配对设计两配对设计两样本的比较样本的比较! 多多个个样本样本所来自的总体均数的比较:所来自的总体均数的比较: kruskal-wallis h: 最为常用的多个样本所来自的总体比较的秩和检验 median/中位数:中位数:检验效能最低 jonckheere-terpstra:用于双向有序变量资料分析时,检验效能高于kruskal-wallis h
5、检验7非参数检验非参数检验3. 成组设计多成组设计多个样本的比较个样本的比较! 多组多组配伍配伍/相关样本相关样本所来自总体均数的检验:所来自总体均数的检验: friedman: m检验,k个相关样本最常用的检验; kendalls w检验:检验:kendall协和系数检验,表示k个指标间相互关联的程度; cochrans q检验:检验:适用于二分类变量,是两相关样本mcnemar在多个样本情况下的推广。8非参数检验4. 配伍设计多个配伍设计多个样本的比较样本的比较!非参检验资料的几种类型非参检验资料的几种类型一、成组设计两样本比较的秩和检验一、成组设计两样本比较的秩和检验 ( wilcoxo
6、n 两样本比较法)两样本比较法)二、配对设计差值的符号秩和检验二、配对设计差值的符号秩和检验 (wilcoxon 配对法)配对法)三、成组设计多个样本比较的秩和检验三、成组设计多个样本比较的秩和检验 (kruskal-wallis法)法)四、随机区组设计资料的秩和检验四、随机区组设计资料的秩和检验 (friedman法)法)9n数据格式:数据格式:1 1个分组变量个分组变量“group group ”,1 1个反应变量个反应变量 “x x ”。n步骤:步骤:analyze nonparametric tests 2 independent samples test variable list:
7、 x grouping variable: group test type: mann-whitney u 一、两独立样本比较的秩和检验(原始数据)一、两独立样本比较的秩和检验(原始数据)10例例1:两独立样本比较的秩和检验:两独立样本比较的秩和检验 某实验室观察某种抗癌新药治疗小鼠移某实验室观察某种抗癌新药治疗小鼠移植性肿瘤的疗效,两组各植性肿瘤的疗效,两组各10只小鼠,以只小鼠,以生存日数作为观察指标,结果如下,试生存日数作为观察指标,结果如下,试检验两组小鼠生存日数有无差别?检验两组小鼠生存日数有无差别?试验组:试验组:24 26 27 30 32 34 36 40 60天以上天以上对照
8、组:对照组:4 6 7 9 10 10 12 13 16 161112资料的读数中,“60”不是确定值, 因而只能采用非参数检验的方法进行处理!13资料的读数中,如果资料的读数中,如果“60”是确定值是确定值, 该资料能够采用该资料能够采用参数检验的方法进行处理吗!参数检验的方法进行处理吗!1415发现发现“确定确定”按钮没有激活按钮没有激活的情况,需要的情况,需要考虑是否存在考虑是否存在未完成的选项!未完成的选项!16n检验步骤检验步骤l计算计算wilcoxon统计量统计量w和和mann-whitney统计量统计量ul分别求出两个样本的秩的和,分别求出两个样本的秩的和,wx和和wy。若。若m
9、n,统计量,统计量w=wy ;若;若m=n,统计量为第一个变量值所在样本组的,统计量为第一个变量值所在样本组的w值值lmann-whitney统计量定义为统计量定义为l小样本情况下,统计量服从小样本情况下,统计量服从mann-whitney分布,分布,大样本情况下,近似服从正态分布,检验统计量为大样本情况下,近似服从正态分布,检验统计量为l根据根据p值作出决策值作出决策两个独立样本mann-whitney检验(k为为w对应样本组的样本数据个数对应样本组的样本数据个数)mann-whitney 检验检验18n数据格式:数据格式:1个分组变量个分组变量“group”,1个反应变量个反应变量 “x”
10、,1个频数变量个频数变量“freq”。n步骤:步骤: data weight cases weight cases by: freq analyze nonparametric tests 2 independent samples test variable list: x grouping variable: group test type: mann-whitney u 一、两独立样本比较的秩和检验(频数资料)一、两独立样本比较的秩和检验(频数资料)19例例2、两独立样本比较的秩和检验、两独立样本比较的秩和检验 为研究甲乙两种药物对某一疾病的治疗效果,为研究甲乙两种药物对某一疾病的治疗效
11、果,观察采用不同药物治疗后的观察采用不同药物治疗后的208名患者,结名患者,结果如下,问,甲乙两种药物对这一疾病的治果如下,问,甲乙两种药物对这一疾病的治疗效果有无差异?疗效果有无差异?甲药甲药乙药乙药+6542+186+3023-13112021甲药甲药乙药乙药+6542+186+3023-131122二、配对设计差值的符号秩和检验二、配对设计差值的符号秩和检验n数据格式:数据格式:2个反应变量,分别为个反应变量,分别为“x1”和和“x2”。n步骤:步骤:analyze nonparametric tests 2 related samples test pair(s) list: x1x2
12、 test type: wilcoxon 23例例3:配对设计差值的符号秩和检验配对设计差值的符号秩和检验 尿铅的传统测定方法比较繁琐,现有人希望用新尿铅的传统测定方法比较繁琐,现有人希望用新方法代替原有方法,方法代替原有方法,10份样本分别采用两种方法份样本分别采用两种方法进行测定,结果如下,试分析两种方法的测定结进行测定,结果如下,试分析两种方法的测定结果有无差别?果有无差别?样本号样本号老方法老方法新方法新方法13.463.4722.182.2935.345.0449.159.3551.130.98651.34150.28721.3122.5984.354.0890.020.01105.
13、625.282425262728与配对t检验相比,有什么异同?29n数据格式:数据格式:1个分组变量个分组变量“group”,1个反应个反应 变量变量 “x”。n步骤:步骤: analyze nonparametric tests k independent samples test variable list: x grouping variable: group test type: kruskal wallis h 三、多个独立样本比较的秩和检验三、多个独立样本比较的秩和检验(原始数据原始数据)30例例3、多个独立样本比较的秩和检验、多个独立样本比较的秩和检验 测得某中学教室中测得某中学
14、教室中6个采样点不同时间空气中的个采样点不同时间空气中的co2含量,结果如下,问不同时间空气中的含量,结果如下,问不同时间空气中的co2含量有无差别?(本例未将同一采样点作为一个含量有无差别?(本例未将同一采样点作为一个区组设置,实际工作中要考虑有无设置区组的必区组设置,实际工作中要考虑有无设置区组的必要)要)课前:课前:课中:课中:课后:课后:0.484.452.950.534.733.070.554.773.180.554.823.200.584.893.300.625.004.453132333435n数据格式:数据格式: 1个分组变量个分组变量“group”,1个反应变量个反应变量 “
15、x”, 1个频数变量个频数变量“frequncy”。n步骤:步骤:data weight cases weight cases by: freqanalyze nonparametric tests k independent samples test variable list: x grouping variable: group test type: kruskal wallis h三、多个独立样本比较的秩和检验三、多个独立样本比较的秩和检验(频数表频数表)36例例4、多个独立样本比较的秩和检验、多个独立样本比较的秩和检验 三种病人肺切除术的针麻效果,见下三种病人肺切除术的针麻效果,见下
16、表,问,此三种病人肺切除术的针麻表,问,此三种病人肺切除术的针麻效果有无差异?效果有无差异?针麻效果针麻效果+ +肺癌肺癌1010171719194 4肺化脓症肺化脓症2424414133337 7肺结核肺结核4848656536368 837针麻效果针麻效果+ +肺癌肺癌10104 419191717肺化脓症肺化脓症24247 733334141肺结核肺结核48488 83636656538卡方检验统计量不能够体现出结局为等级资料的等级差异对结果的影响,所以不能在此类资料的分析中采用!39kruskal-wallis 检验检验40中值检验41n数据格式:数据格式: 反应变量分别为反应变量分别
17、为“x1”,“x2”, “x3”,“x4”n步骤:步骤:analyze nonparametric tests k related samples test variables: x1 x2 x3 x4 test type: friedman四、随机区组设计资料的秩和检验四、随机区组设计资料的秩和检验42例例5、随机区组设计资料的秩和检验、随机区组设计资料的秩和检验 受试者受试者5人,每人穿人,每人穿4种防护服,测得脉种防护服,测得脉搏数结果见下表,问,搏数结果见下表,问,5个受试者穿个受试者穿4种种防护服测得脉搏数有无差别?防护服测得脉搏数有无差别?编号编号12345防护服防护服113011
18、1114123115防护服防护服214411610698104防护服防护服3143119115120111防护服防护服41331181131041104344注意此资料的录入格式注意此资料的录入格式与随机区组设计的方差与随机区组设计的方差分析有什么区别?变量分析有什么区别?变量个数?录入的形式?个数?录入的形式?项目编号不是分析所必须的,但是一个区组的或者说有关联的样本要在一行上录入。friedman 检验检验kendall w 检验检验45双向有序列联表的检验双向有序列联表的检验 1. 虽然分组变量和研究变量均为有序,但是研究者仅仅对分组产生的研究结果感兴趣,则可以按单向有序的资料进行分析;
19、 2. 如果想要明确两变量之间的相关关系,则需要采用spearman相关分析; 3. 可以采用jonckheere-terptra检验,该检验对双向有序资料的检验效率较其它方法高; 4. 如果是多中心临床试验的结果,那么不同中心结果可能会不一致,要考虑混杂因素的影响,可进行cochran-mantel-haenszel分析。4647医疗形式医疗服务满意度合 计不满意满意很满意自费361711 64半公费1318 8 39公费 1 2 4 7合计503723110 医疗形式与患者对医疗服务的满意度之间的关系48jonckheere-terpstra过程的操作提示 图7-6 选择jonckheer
20、e-terpstra检验 图7-7 选择精确概率检验49j jo on nc ck kh he ee er re e- -t te er rp ps st tr ra a t te es st ta a31102034.5001608.500155.8872.733.006.006.003.000number of levels in 医疗形式nobserved j-t statisticmean j-t statisticstd. deviation of j-tstatisticstd. j-t statisticasymp. sig. (2-tailed)exact sig. (2-ta
21、iled)exact sig. (1-tailed)point probability医疗服务满意度grouping variable: 医疗形式a. 例例3、二位放射科医生对一批矽肺胸片独、二位放射科医生对一批矽肺胸片独自做出矽肺分级诊断,见下表,问他们的自做出矽肺分级诊断,见下表,问他们的诊断结果是否一致,诊断水平有无差异?诊断结果是否一致,诊断水平有无差异?甲医生甲医生i级级ii级级 iii级级 合计合计乙医生乙医生 i级级321033ii级级 1554776iii级级0124557合计合计 476752166行行123123123列列111222333频频数数3210155470124
22、5注意区别以下适合注意区别以下适合配对配对卡方分析的情况卡方分析的情况502008年8月方法小节非参数检验非参数检验用途用途参数检验参数检验总结总结2:非参数检验:非参数检验1、成组设计两样本比较的秩和检验、成组设计两样本比较的秩和检验 2 independent samples mann-whitney u 2、配对设计差值的符号秩和检验、配对设计差值的符号秩和检验 2 related samplestest type: wilcoxon 3、成组设计多个样本比较的秩和检验、成组设计多个样本比较的秩和检验 k independent samplestest type: kruskal wal
23、lis h 4、随机区组设计资料的秩和检验、随机区组设计资料的秩和检验k related samplestest type: friedman在利用在利用spss进行进行非参数检验的时候,非参数检验的时候,如何根据条件进行如何根据条件进行方法的选择?方法的选择?52参数检验 parametric test (1) 总体分布类型已知,如率服从二项分布、样本均数服从正态分布;(2) 由样本参数推断未知总体参数。 这时, 基于一定的参数分布对总体参数的假设检验称为参数检验。如 t 检验: f 检验:0:171.2hcm012:kh 非参数检验非参数检验 (nonparametric test) 对数
24、据的总体分布类型不作严格假定,又称任意分布检验任意分布检验 (distribution-free test), 它直接对总体分布的位置位置作假设检验。 参数统计:参数统计: 通常要求样本来自正态总体,或方差齐等,在通常要求样本来自正态总体,或方差齐等,在此基础上此基础上用样本统计量对总体参数进行推断或作假用样本统计量对总体参数进行推断或作假设检验的统计分析方法。设检验的统计分析方法。非参数统计:非参数统计: 有许多资料有许多资料不符合参数统计的要求不符合参数统计的要求,分布未知,分布未知,不能用参数统计的方法进行检验,而需要一种不依不能用参数统计的方法进行检验,而需要一种不依赖于总体分布类型,
25、也不对总体参数进行统计推断赖于总体分布类型,也不对总体参数进行统计推断的假设检验,而是对总体的分布或分布位置进行检的假设检验,而是对总体的分布或分布位置进行检验,称为非参数检验。验,称为非参数检验。参数检验与非参数检验比较参数检验与非参数检验比较参数检验参数检验 非参检验非参检验 要求资料服从要求资料服从特定分布特定分布 1.1. 对资料的分布没有特殊要求,总对资料的分布没有特殊要求,总体为偏态、总体分布未知的计量体为偏态、总体分布未知的计量资料(尤其在资料(尤其在n30n60,60秩次 3 6 4 9 2 8 1 5 7 10 11 10.5 10.5例例2 7名名 肺炎病人的治疗结果:肺炎
26、病人的治疗结果:危险程度危险程度 治愈治愈 治愈治愈 死亡死亡 无效无效 治愈治愈 有效有效 治愈治愈秩次 1 2 7 6 3 5 4 2.5 2.5 7 6 2.5 5 2.5 秩转换 rank transformation秩相同取平均秩!秩相同取平均秩!缺点:缺点:方法比较粗糙,对于符合参数检验条件者,采用方法比较粗糙,对于符合参数检验条件者,采用非参数检验非参数检验会损失部分信息,其检验效能较低会损失部分信息,其检验效能较低;样本含;样本含量较大时,两者结论常相同量较大时,两者结论常相同以下情况首选以下情况首选非参数检验非参数检验: 1. 1. 不满足正态和方差齐性条件不满足正态和方差齐
27、性条件的小样本资料;的小样本资料;2. 2. 总体总体分布类型不明分布类型不明的小样本资料;的小样本资料;3. 3. 一端或二端是不确定数值(如一端或二端是不确定数值(如0.0020.002、6565等)的资料等)的资料(必选必选);4. 4. 单向有序列联表单向有序列联表资料;资料;5. 5. 各种资料的各种资料的初步分析初步分析。在资料符合参数检验的条件下,请一定采在资料符合参数检验的条件下,请一定采用参数检验的方法。非参数检验中所利用用参数检验的方法。非参数检验中所利用的信息量有限,在的信息量有限,在同等条件下的检验效能同等条件下的检验效能低于参数检验低于参数检验。非参数检验第一节第一节
28、 配对样本比较的配对样本比较的wilcoxon符号秩和检验符号秩和检验第二节第二节 两个独立样本比较的两个独立样本比较的wilcoxon秩和检验秩和检验第三节第三节 完全随机设计多个样本比较的完全随机设计多个样本比较的kruskal-wallis h 检验检验第四节第四节 随机区组设计多个样本比较的随机区组设计多个样本比较的friedman m 检验检验第一节配对样本比较的wilcoxon符号秩检验 (wilcoxon signed-rank test)常用于以下两种情况:1配对样本差值的中位数与0的比较2单个样本中位数和总体中位数比较常见的配对设计类型 1. 同一研究对象处理前后的比较; 2
29、. 同一研究对象分别接受不同的处理; 3. 不同研究对象,根据研究因素以外的会影响研究结果的重要因素配成对子,分别接受不同的处理,比较不同处理的效果。 例8-1 12份血清原方法(检测时间20分钟)新方法(检测时间10分钟)测谷-丙转氨酶问两法所得结果有无差别?1配对样本差值的中位数和配对样本差值的中位数和0比较比较表8-1 12份血清两法测血清谷-丙转氨酶(nmol s-1/l)的比较 配对秩和检验编秩规则:配对秩和检验编秩规则: 算出各对值的算出各对值的代数差代数差; 根据差值的根据差值的绝对值大小绝对值大小编秩编秩,; 将秩次按差值正负冠以正负号,计将秩次按差值正负冠以正负号,计算算正、
30、负秩和正、负秩和(t+,t-);); 用用不为不为“0”的对子数作为的对子数作为n (5) 取绝对值取绝对值小的秩和小的秩和作为统计量作为统计量t表8-1 12份血清两法测血清谷-丙转氨酶(nmol s-1/l)的比较 *下面资料中新法测定的结果中有未能确定的值,所以必须采用非参数检验的方法。编秩的方法为按照编秩的方法为按照绝对值绝对值的大小从的大小从小小到到大大编。编。0h:差值的总体中位数0dm 1h:0dm 0.05 1. 建立检验假设,确定检验水平2. 求检验统计量t值 省略所有差值为0的对子数,余下的有效对子数记录为n,见表8-1第(4)栏,本例 n=11;检验步骤 按差值的绝对值从
31、小到大编秩,然后分别冠以正负号。遇差值绝对值相等【称为相同秩(ties)】则取平均秩,(样本较小时,如果相同秩较多,检验结果会存在偏性,因此应提高测量精度,尽量避免出现较多的相同秩尽量避免出现较多的相同秩) 一般取较小者为t,本例取t=11.5。3. 确定p值,作出推断结论 (1)当n50时,查t界值表(附表9, p716)判断原则判断原则:t 在范围之外在范围之外,p (t范围越小,p越大)n=11, =0.10 :13-53 =0.05 :10-56本例11n ,11.5t ,查附表 9 得双侧0.050.10p,按0.05水准不拒绝0h,尚不能认为两法测谷-丙转氨酶结果有差别。 所查到的
32、界值是在h0成立的情况下,根据预先设定的和相应的样本量,可以接受的t值范围。(2)若当n50,超出附表9范围,可用正态近似法作z检验。 3(1)/4()(1)(21)2448jjtn nzttn nn式中jt(j=1,2,)为第j个相同秩的个数 假定相同秩(即平均秩)中有 2 个 1.5,5 个 8,3 个 14,则 12t ,25t ,33t , 33()(2jjtt 332)(55)(33)150 重复秩次的个数重复秩次的个数如果如果h h0 0成立,成立,即两总体无差异,在理论上的样本的正负秩和相等,即两总体无差异,在理论上的样本的正负秩和相等, 即即 t t值应为总秩和值应为总秩和(
33、(t t总总= n= n(n+1n+1)/2/2)的一半,)的一半, 即即 t t=n=n(n+1n+1)/4/4。若若t t值在界值范围内,不拒绝值在界值范围内,不拒绝h h0 0,当当t t值在界值上或界值范围外,值在界值上或界值范围外,h h0 0成立的概率很小,成立的概率很小,拒绝拒绝h0 ,认为两总体分布不同,认为两总体分布不同配对资料符号秩和检验的配对资料符号秩和检验的基本思想基本思想例8-2 已知某地正常人尿氟含量的中位数为45.30 。(总体中位数)12名工人尿氟含量见表8-2第(1)栏(样本)。问该厂工人的尿氟含量是否高于当地正常人?mol/l2单个样本中位数和总体中位数比较
34、 如果资料符合进行参数检验的条件,则应该采用样如果资料符合进行参数检验的条件,则应该采用样本均数与总体均数比较的本均数与总体均数比较的t检验。检验。表8-2 12名工人的尿氟含量与45.30( )比较 mol/l本例由于存在数值不明的资料,所以采用非参数检验。0h:尿氟含量的总体中位数45.30m 1h:45.30m 0.05 据表8-2第(3)、(4)栏,取t=1.5。 第二节两个独立样本比较的两个独立样本比较的wilcoxon秩和检验秩和检验wilcoxon rank sum test表8-5 肺癌病人和矽肺0期工人的rd值(cm)比较 本例两样本资料经方差齐性检验,推断得两总体方差不等(
35、0.01p ) 例8-31原始数据的两样本比较 在不符合参数检验条件时,计量资料两独立样本的比较在不符合参数检验条件时,计量资料两独立样本的比较不能采用两独立样本均数不能采用两独立样本均数 t 检验,需考虑非参数检验检验,需考虑非参数检验表8-5 肺癌病人和矽肺0期工人的rd值(cm)比较 本例两样本资料经方差齐性检验,推断得两总体方差不等(0.01p ) 例8-30h:肺癌病人和矽肺 0 期工人的rd 值总体分布位置相同 1h:肺癌病人的 rd 值高于矽肺 0 期工人的 rd 值 0.05 检验步骤求检验统计量求检验统计量t 值:值: 把两样本数据混合从小到大编秩, 遇数据相等者取把两样本数
36、据混合从小到大编秩, 遇数据相等者取平均秩;平均秩; 以样本例数小者为以样本例数小者为1n,其秩和(,其秩和(1t)为)为t,若两,若两样本例数相等,可任取一样本的秩和(样本例数相等,可任取一样本的秩和(1t或或2t)为为t,本例,本例141.5t 。 (同一组可直接写秩号同一组可直接写秩号)确定p值,作出推断结论: 当110n 和2110nn时, 查t界值表(附表 10) 。本例110n ,212nn,141.5t , 查 附 表10 , 得 单 侧0.0250.05p,按0.05水准拒绝0h,接受1h,可认为肺癌病人的 rd 值高于矽肺 0 期工人的 rd 值。 若110n 或2110nn
37、,超出附表 10 的范围,可用正态近似法作z检验,令12nnn,按下式计算z值。 13123(1)/2()(1)112jjtn nzttn n nnn式中(1,2,)jtj l为第j个相同秩的个数 在h0成立的情况下,含量为含量为n n1 1样本的秩和样本的秩和t t1 1应在应在n n1 1(n+1n+1)/2/2的的左右变化。左右变化。两独立样本比较的秩和检验采用两独立样本比较的秩和检验采用z检检验的原理验的原理适用条件:适用条件:完全随机设计的两个样本比较,若不满足参数检验的应用完全随机设计的两个样本比较,若不满足参数检验的应用条件,则用本法,此外两个等级资料比较也采用本方法。条件,则用
38、本法,此外两个等级资料比较也采用本方法。基本思想:基本思想:如果如果h h 0 0成立,在两样本来自分布相同的总体,两样本的成立,在两样本来自分布相同的总体,两样本的平均秩次应相等或很接近,与总的平均秩次(平均秩次应相等或很接近,与总的平均秩次(n+1n+1)/2/2相相差较小。含量为差较小。含量为n n1 1样本的秩和样本的秩和t t1 1应在应在n n1 1(n+1n+1)/2/2的左右变的左右变化。若化。若t t值偏离此值太远,值偏离此值太远,h h 0 0发生的可能性就很小。若偏发生的可能性就很小。若偏离出给定的离出给定的值所确定的范围时,即值所确定的范围时,即p p,拒绝,拒绝 h
39、h 0 0 表8-6 吸烟工人和不吸烟工人的hbco(%)含量比较 2两样本频数表和等级资料的比较 表8-6 吸烟工人和不吸烟工人的hbco(%)含量比较 0h:吸烟工人和不吸烟工人的 hbco 含量总体分布位置相同 1h:吸烟工人的 hbco 含量高于不吸烟工人的 hbco 含量 0.05 先确定各等级的合计人数、秩范围和平均秩,见表8-6的(4)栏、(5)栏和(6)栏,再计算两样本各等级的秩和,见(7)栏和(8)栏; 本例t=1917; 3191739 (79 1)/23.702339 40 (79 1)52230(1)127979z139n ,240n ,394079n 计算z值3333
40、33()(33)(3131)(2727)(1414)(44) 52230jjtt3mann-whitney u检验检验 两 独 立 样 本 比 较 还 常 用两 独 立 样 本 比 较 还 常 用 m a n n -whitney u检验检验原理:原理:把第一个样本的把第一个样本的n1(小于等于小于等于n2 )个变量值的每一个值,个变量值的每一个值,与第二个样本的每个变量值与第二个样本的每个变量值x逐个进行比较,每次比逐个进行比较,每次比较均记录比较的结果:较均记录比较的结果:小于小于x记记1,与,与x相等记相等记0.5,大于,大于x记记0。比较结果之和即为比较结果之和即为u值。值。例如:表例
41、如:表8-5资料资料 肺 癌 病 人 矽 肺 0 期 工 人 rd 值 秩 rd 值 秩 2.78 1 3.23 2.5 3.23 2.5 3.50 4 4.20 7 4.04 5 4.87 14 4.15 6 5.12 17 4.28 8 6.21 18 4.34 9 7.18 19 4.47 10 8.05 20 4.64 11 8.56 21 4.75 12 9.60 22 4.82 13 4.95 15 5.10 16 110n 1141.5t 212n 2111.5t 表8-5 肺癌病人和矽肺0期工人的rd值(cm)比较 1211.58233.5u 代入代入p129公式(公式(8-3
42、)计算)计算z值值小于小于x记记1,与,与x相等记相等记0.5,大于,大于x记记0 两独立样本资料进行比较时,在资料不符合参数检验的条件下,除上述方法外,还可以采用中位数检验, median test。中位数检验的检验效能在非参数检验中相对较低,结论比较保守。对于同一份资料,用mann-whitney u和wilcoxon方法计算得到的z值是相等的,所下的统计结论也是等价的。第三节完全随机设计多个样本比较的kruskal-wallis h检验一、多个独立样本(计量)比较的kruskal-wallis h检验h0 : :多个总体分布位置相同多个总体分布位置相同; ; h1 : :多个总体分布位置
43、不全相同。多个总体分布位置不全相同。 基本思想:如果各总体分布相基本思想:如果各总体分布相同,则各组混合编秩的平均秩同,则各组混合编秩的平均秩次应该相差不大次应该相差不大如果满足参数条件,这类资料一般作完全随机设计如果满足参数条件,这类资料一般作完全随机设计anova例例8-5样本数据存在相同秩的情况样本数据存在相同秩的情况 例例8-6 比较小白鼠接种三种不同菌型伤寒杆菌9d、11c和dsc1后存活日数,结果见表8-10。问小白鼠接种三种不同菌型伤寒杆菌的存活日数有无差别? 2.多个有序(等级)数据样本的比较多个有序(等级)数据样本的比较 例例8-7二、多个独立样本作两两比较的二、多个独立样本
44、作两两比较的nemenyi法检验法检验 当经过多个独立样本比较的kruskal-wallis h检验拒绝h0,接受h1 ,认为多个总体分布位置不全相同时,若要进一步推断是哪两两总体分布位置不同,可用nemenyi法检验(nemenyi test)。第四节随机区组设计多个样本比较的friedman m检验 例例8-9 8名受试对象在相同实验条件下分别接受4种不同频率声音的刺激,他们的反应率(%)资料见表8-12。问4种频率声音刺激的反应率是否有差别?一、friedman m检验方法 表8-12 8名受试对象对4种不同频率声音刺激的反应率(%)比较 频率a 频率b 频率c 频率d 受试号 反应率
45、秩 反应率 秩 反应率 秩 反应率 秩 1 8.4 1 9.6 2 9.8 3 11.7 4 2 11.6 1 12.7 4 11.8 2 12.0 3 3 9.4 2 9.1 1 10.4 4 9.8 3 4 9.8 2 8.7 1 9.9 3 12.0 4 5 8.3 2 8.0 1 8.6 3.5 8.6 3.5 6 8.6 1 9.8 3 9.6 2 10.6 4 7 8.9 1 9.0 2 10.6 3 11.4 4 8 7.8 1 8.2 2 8.5 3 10.8 4 ir 11 16 23.5 29.5 二、两两比较的二、两两比较的q检验检验当经过多个相关样本比较的当经过多个相关样本比较的friedman m检验拒绝检验拒绝h0 ,接受,接受h1 ,认为多个总,认为多个总体分布位置不全相同时,若要进一步体分布位置不全相同时,若要进一步推断是哪两两总体分布位置不同,可推断是哪两两总体分布位置不同,可用用q检验。检验。.本例根据表8-12有:8n,4g ,22222111623.529.51799.5ir, 33()226jjtt。 8 4 (4 1)(2 4 1)/6 1799.5/8 6/120.69(8 1)(4 1)ms 误差 1,429.5 117.878 0.69q 同样可算得1,3q,1,2q,2,4q,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- IT行业技术培训工作总结
- 智能电网物联网平台建设方案
- 父母与子女关系重建协议书
- 急救中心输血不良反应应对预案
- 消防水系统智能化管理方案
- 地产项目目标客户群体分析方案
- 施工现场突发水管破裂应急处理预案
- 医疗器械售后支持服务方案
- 商贸中心智能化客户关系管理方案
- 人教版一年级数学上随堂2 专项二 应用
- 扣款通知单 采购部
- 2023年日历模板excel版本
- Unit 1 Laugh out Loud!单元教学设计-2023-2024学年高中英语外研版(2019)选择性必修第一册
- 有限空间辨识与作业安全管理台账(模板)
- 【课件】第5课+森さんは+7時に+起きます+课件-高中日语新版标准日本语初级上册
- 小学英语-Mum bug's bag教学设计学情分析教材分析课后反思
- 《我国运动员在奥林匹克运动会取得的辉煌成绩》 课件
- 旅行社团队确认书三篇
- 《超市水果陈列标准》
- 施美美的《绘画之道》与摩尔诗歌新突破
- 跌倒坠床PDCA循环管理降低住院患者跌倒坠床发生率
评论
0/150
提交评论