




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、概述(i sh) 前面已介绍了两个率比较的检验,在观察例数不够大或拟对多个前面已介绍了两个率比较的检验,在观察例数不够大或拟对多个率进行比较时,检验就不适宜了,因为直接对多个样本率进行比较时,检验就不适宜了,因为直接对多个样本(yngbn)(yngbn)率作两两间的检验有可能增加第一类误差。率作两两间的检验有可能增加第一类误差。2 2检验可解决此类问检验可解决此类问题。题。 卡方检验是用途很广的一种假设检验方法,这里我们主要学习它卡方检验是用途很广的一种假设检验方法,这里我们主要学习它在分类资料统计推断中的应用,包括:两个率或两个构成比比较在分类资料统计推断中的应用,包括:两个率或两个构成比比
2、较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。的相关分析等。第1页/共38页第一页,共39页。四格(s )表资料 定性指标分为有序的(如:疗效分为定性指标分为有序的(如:疗效分为“治愈、显效、好转、无效、死亡治愈、显效、好转、无效、死亡”)和名义的(如:血型分为和名义的(如:血型分为“O“O、A A、B B、AB”AB”型)类,对于每个受试者型)类,对于每个受试者来说,有序指标的观测结果只能是该有序指标若干等级中的级(如某人的来说,有序指标的观测结果只能是该有序指标若干等级中的级(如某人的疗效为疗效为“显效显效”
3、);名义指标的观测结果只能是该名义指标若干标志中的);名义指标的观测结果只能是该名义指标若干标志中的个(如某人的血型为型),显然,无法像处理定量指标那样去直接分析定个(如某人的血型为型),显然,无法像处理定量指标那样去直接分析定性指标,故这类资料常被整理成列联表的形式后再进行分析。性指标,故这类资料常被整理成列联表的形式后再进行分析。 当表中只有个定性指标时,称为维列联表;有个或个以上定性指标当表中只有个定性指标时,称为维列联表;有个或个以上定性指标时,称为多维列联表。常用时,称为多维列联表。常用R R、C C表示维列联表的行数和列数,并称为表示维列联表的行数和列数,并称为R RC C表;当表
4、;当R=C=R=C=时,称为表(或四格表)。表看起来很简时,称为表(或四格表)。表看起来很简单,但根据单,但根据(gnj)(gnj)资料所具备的条件有许多不同的处理方法。资料所具备的条件有许多不同的处理方法。第2页/共38页第二页,共39页。四格表卡方检验(jinyn)的SAS程序 在在SAS/STATSAS/STAT模块中模块中FREQFREQ、TABULATETABULATE和和SUMMARYSUMMARY等过程可用于等过程可用于分类资料的统计描述,其中分类资料的统计描述,其中(qzhng)FREQ(qzhng)FREQ过程兼具统计描述和统计推过程兼具统计描述和统计推断的功能,对分类变量计
5、算频数分布,产生从一维到断的功能,对分类变量计算频数分布,产生从一维到n n维的频数表和列联维的频数表和列联表;对于二维表,可进行表;对于二维表,可进行2 2检验,对于三维表,可作检验,对于三维表,可作Mentel-HanszelMentel-Hanszel分层分析。分层分析。FREQFREQ过程是过程是SASSAS用于分析分类资料的一个常用过程。本节将用于分析分类资料的一个常用过程。本节将先向大家介绍先向大家介绍FREQFREQ过程的语句及其格式。过程的语句及其格式。 FREQFREQ过程的语句基本格式如下:过程的语句基本格式如下: Proc freq data= order= ; Proc
6、 freq data= order= ; Table Table 分类变量分类变量* *分类变量分类变量/ ;/ ; Weight Weight 变量变量; ; Run; Run;第3页/共38页第三页,共39页。四格表卡方检验(jinyn)的SAS程序 DATADATA数据集:规定数据集:规定PROC FREQPROC FREQ语句使用的数据集;语句使用的数据集; ORDERORDERFREQFREQ,按频数递减顺序排列;,按频数递减顺序排列;ORDERORDERDATADATA,按数据集,按数据集中出现的顺序排列;中出现的顺序排列;ORDERORDERINTERNALINTERNAL,按内
7、部值排列,按内部值排列( (缺省缺省) );ORDERORDERFORMATTEDFORMATTED,按外部格式值排列;,按外部格式值排列; TableTable语句指定构成表格的变量和表格结构。表格的结构由变量个数和变语句指定构成表格的变量和表格结构。表格的结构由变量个数和变量排列顺序决定,一个量排列顺序决定,一个(y )table(y )table语句允许列出多个表格结构。语句允许列出多个表格结构。PROC PROC FREQFREQ过程中可有多条过程中可有多条TABLESTABLES语句,语句,TABLESTABLES语句后可接多个表格请语句后可接多个表格请求式,每个请求式可包含任何数量
8、的变量,从而得到所需的表格。求式,每个请求式可包含任何数量的变量,从而得到所需的表格。第4页/共38页第四页,共39页。四格表卡方检验(jinyn)的SAS程序 如果如果(rgu)TABLES(rgu)TABLES语句缺省,则语句缺省,则FREQFREQ过程对数据集中的所有变量都给出相应过程对数据集中的所有变量都给出相应的一维频数表。不规定任何选项时,若需某变量的一维频数,的一维频数表。不规定任何选项时,若需某变量的一维频数,FREQFREQ给出该变量每给出该变量每一水平的频数、累积频数、频数的百分比和累积百分比;若需二维频数表,一水平的频数、累积频数、频数的百分比和累积百分比;若需二维频数表
9、,FREQFREQ产生交叉分组列表,即包括各格的频数、总频数的格百分数、行频数的格百分数和产生交叉分组列表,即包括各格的频数、总频数的格百分数、行频数的格百分数和列频数的格百分数。列频数的格百分数。 请求式由一个或多个用请求式由一个或多个用“* *”连接起来的变量名组成。几个变量可放在括号中,如:连接起来的变量名组成。几个变量可放在括号中,如: TABLES ATABLES A* *(B C)(B C);等价于;等价于TABLES ATABLES A* *B AB A* *C C; TABLES (A-C)TABLES (A-C)* *D D;等价于;等价于TABLES ATABLES A*
10、*D BD B* *D CD C* *DD;第5页/共38页第五页,共39页。四格表卡方检验(jinyn)的SAS程序 下列选项可用于下列选项可用于TABLESTABLES语句中语句中“/”“/”的后面:的后面: OUTOUT数据集:建立一个包含变量值和频数计数的输出数据集。如果数据集:建立一个包含变量值和频数计数的输出数据集。如果TABLESTABLES语句中不止一个请求式,数据集的内容相应于语句中不止一个请求式,数据集的内容相应于TABLESTABLES语句中语句中最后一个请求。最后一个请求。 CHISQCHISQ对每层作对每层作c2c2检验,包括检验,包括Pearson c2Pearso
11、n c2、似然比、似然比c2c2和和Mantel-Mantel-Haenszel c2Haenszel c2。此外还给出与。此外还给出与c2c2检验有关的关联指标包括检验有关的关联指标包括PhiPhi系数、列联系数、列联系数和系数和Cramers VCramers V。对于。对于2 22 2表,给出表,给出FisherFisher精确概率。精确概率。 AGREE AGREE 进行配对进行配对c 2c 2检验。检验。 EXACT EXACT 对大于对大于2 22 2的列联表计算的列联表计算FisherFisher精确概率。同时也给出精确概率。同时也给出CHISQCHISQ选项的全部选项的全部(q
12、unb)(qunb)统计量。统计量。 第6页/共38页第六页,共39页。四格(s )表卡方检验的SAS程序 MEASURESMEASURES对每层的二维表计算一系列关联指标及相应的标准误,包括对每层的二维表计算一系列关联指标及相应的标准误,包括PearsonPearson和和SpearmanSpearman相关系数,以及相关系数,以及GammaGamma和和KendallKendall系数等。对于系数等。对于2 22 2表,还给出常用的危险度指标及其标准误。表,还给出常用的危险度指标及其标准误。 CMH CMH 给出给出Cochran-Mantel-HaenszelCochran-Mantel
13、-Haenszel统计量,可检验在调整了统计量,可检验在调整了TABLESTABLES语语句中其它变量后,行变量与列变量之间的关联程度。对于句中其它变量后,行变量与列变量之间的关联程度。对于2 22 2表,表,FREQFREQ过程过程给出相对危险度估计及其可信区间,还给出各层关联度指标是否齐性的给出相对危险度估计及其可信区间,还给出各层关联度指标是否齐性的BreslowBreslow检验。检验。 ALL ALL 给出给出CHISQCHISQ、MEASURESMEASURES、CMHCMH所请求所请求(qngqi)(qngqi)的全部统计量。的全部统计量。 ALPHAALPHAp p给出检验水准
14、。缺省为。给出检验水准。缺省为。第7页/共38页第七页,共39页。四格(s )表卡方检验的SAS程序 EXPECTEDEXPECTED给出期望频数。给出期望频数。 DEVIATIONDEVIATION给出每格的实际给出每格的实际(shj)(shj)频数与期望频数的差值。频数与期望频数的差值。 CELLCHISQCELLCHISQ给出每格对总给出每格对总c2c2的贡献,即计算每格的的贡献,即计算每格的( (实际实际(shj)(shj)频数频数- -期望频数期望频数)2/)2/期望频数。期望频数。 CUMCOLCUMCOL给出累积列百分数。给出累积列百分数。 NOFREQNOFREQ不给出列联表中
15、的格频数。不给出列联表中的格频数。 NOPERCENTNOPERCENT不给出列联表中的格百分数。不给出列联表中的格百分数。第8页/共38页第八页,共39页。四格(s )表卡方检验的SAS程序 NOROWNOROW不给出列联表中各格的行百分数。不给出列联表中各格的行百分数。 NOCOLNOCOL不给出列联表中各格的列百分数。不给出列联表中各格的列百分数。 NOCUMNOCUM不给出频数表的累积频数和累积百分数。不给出频数表的累积频数和累积百分数。 NOPRINTNOPRINT不给出表格,但给出不给出表格,但给出CHISQCHISQ、MEASURESMEASURES或或CMHCMH等语句等语句(
16、yj)(yj)所指定的统计量。所指定的统计量。 TrendTrend指令系统对指令系统对2 2C C频数表的频数表的C C个百分率进行个百分率进行Cochran-ArmitageCochran-Armitage趋趋势检验;势检验; WEIGHTWEIGHT语句语句(yj)(yj):通常每个观察值提供数值:通常每个观察值提供数值1 1给频数计数,当给频数计数,当WEIGHTWEIGHT语句语句(yj)(yj)出现时,每个观察值提供的是该观察值的加权变量出现时,每个观察值提供的是该观察值的加权变量值。该值必须非负,但可不必为整数。只能使用一个值。该值必须非负,但可不必为整数。只能使用一个WEIGH
17、TWEIGHT语句语句(yj)(yj),且该语句,且该语句(yj)(yj)作用于所有的表。作用于所有的表。第9页/共38页第九页,共39页。四格(s )表卡方检验 理论理论(lln)(lln)频数,记为频数,记为T T。理论。理论(lln)(lln)数的计算公式为:数的计算公式为:nnnTcrrc 第10页/共38页第十页,共39页。四格(s )表卡方检验 卡方检验的统计量是卡方检验的统计量是2 2值,它是每个格子实际频数值,它是每个格子实际频数A A与理论频数与理论频数T T差值平方差值平方(pngfng)(pngfng)与理论频数之比的累计和。每个格子中的理论与理论频数之比的累计和。每个格
18、子中的理论频数频数T T是在假定两组的发病率相等的情况下计算出来的,故是在假定两组的发病率相等的情况下计算出来的,故2 2值越值越大,说明实际频数与理论频数的差别越明显,两组发病率不同的可大,说明实际频数与理论频数的差别越明显,两组发病率不同的可能性越大。能性越大。 TTA22)( 第11页/共38页第十一页,共39页。例题(lt) 某医院欲比较异梨醇口服液(试验组)和氢氯噻嗪某医院欲比较异梨醇口服液(试验组)和氢氯噻嗪+ +地塞米松(对照组)降低颅内压的疗效。将地塞米松(对照组)降低颅内压的疗效。将200200例颅内例颅内压增高症患者随机分为两组。问两组降低颅内压的总体有效率有无压增高症患者
19、随机分为两组。问两组降低颅内压的总体有效率有无(yu w)(yu w)差别?差别?第12页/共38页第十二页,共39页。连续性校正(jiozhng)公式 2 2分布是正态变量的一种分布是正态变量的一种(y zhn)(y zhn)分布。设分布。设 是是k k个独立的标准正态变量,则个独立的标准正态变量,则 。 2 2界值表就是根据这种连续性分布计算出来的。界值表就是根据这种连续性分布计算出来的。 2 2统计量计算统计量计算公式实质上是正态近似法。分类资料是间断性的,由此计算的公式实质上是正态近似法。分类资料是间断性的,由此计算的 2 2值不连续,尤其自由度为值不连续,尤其自由度为1 1的四格表,
20、求出的概率可能偏小,的四格表,求出的概率可能偏小,此时需要对此时需要对 2 2值进行连续性校正,公式为值进行连续性校正,公式为 kXXX,21TTA22)5 . 0(第13页/共38页第十三页,共39页。 2检验(jinyn)的应用条件 连续性校正主要针对四格表资料,尤其理论数较小时,连续性校正不可忽略。连续性校正主要针对四格表资料,尤其理论数较小时,连续性校正不可忽略。 四格表四格表2 2检验检验(jinyn)(jinyn)的应用条件为:的应用条件为: 当当n40n40且所有且所有T5T5时,用普通的时,用普通的2 2检验检验(jinyn)(jinyn),若所得,改用确切概率法;,若所得,改
21、用确切概率法; 当当n40n40但有但有1T51T5时,用校正的时,用校正的2 2检验检验(jinyn)(jinyn); 当当n40n40或有或有T1T1时,不能用时,不能用2 2检验检验(jinyn)(jinyn),改用确切概率法。,改用确切概率法。第14页/共38页第十四页,共39页。例题(lt) 某医师某医师(ysh)(ysh)欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将7878例脑血管疾病患者随机分为两组。例脑血管疾病患者随机分为两组。问两种药物治疗脑血管疾病的有效率是否有差别?问两种药物治疗脑血管疾病的有效率是否有差别?第15页
22、/共38页第十五页,共39页。配对计数资料(zlio)的卡方检验 把每一份样本平均分成两份,分别用两种方法进行化验,比较此两种化验方法的结果(两类计数资料)是把每一份样本平均分成两份,分别用两种方法进行化验,比较此两种化验方法的结果(两类计数资料)是否有本质的不同;或者分别采用甲、乙两种方法对同一批病人进行检查,比较此两种检查方法的结果(两否有本质的不同;或者分别采用甲、乙两种方法对同一批病人进行检查,比较此两种检查方法的结果(两类计数资料)是否有本质的不同,此时类计数资料)是否有本质的不同,此时(c sh)(c sh)要用配对卡方检验。要用配对卡方检验。第16页/共38页第十六页,共39页。
23、配对(pi du)计数资料的卡方检验 比较两法结果有无差别比较两法结果有无差别(chbi)(chbi),要着眼于两法结果不一致的部,要着眼于两法结果不一致的部分。表中观察变量是对子中两法的差值或差别分。表中观察变量是对子中两法的差值或差别(chbi)(chbi),由,由b b和和c c两格数据来反映,总体中与两格数据来反映,总体中与b b和和c c对应的数据可用对应的数据可用B B和和C C表示(表示(a a格格和和d d格表示两法差值为格表示两法差值为0 0,不予考虑)。,不予考虑)。 当当4040时,时, 当当4040时,需作连续性校正:时,需作连续性校正: 1,)(22 cbcb1,)1
24、(22 cbcb第17页/共38页第十七页,共39页。例题(lt) 某实验室分别某实验室分别(fnbi)(fnbi)用乳胶凝集法和免疫荧光法对用乳胶凝集法和免疫荧光法对5858名可疑系统红斑狼疮患者血清中抗核抗体进行测定。名可疑系统红斑狼疮患者血清中抗核抗体进行测定。问两种方法的检测结果有无差别?问两种方法的检测结果有无差别?第18页/共38页第十八页,共39页。行列表资料(zlio)的2检验 前面介绍了两个样本前面介绍了两个样本(yngbn)(yngbn)率比较的率比较的2 2检验方法,其基本数据有检验方法,其基本数据有2 2行行2 2列,称为列,称为2 22 2表或四格表资料。表或四格表资
25、料。本节介绍的行列表资料的本节介绍的行列表资料的2 2检验,用于多个样本检验,用于多个样本(yngbn)(yngbn)率的比较、两个或多个构成比的比较以及双率的比较、两个或多个构成比的比较以及双向有序或无序分类资料的检验等。向有序或无序分类资料的检验等。 R RC C表可以分为双向无序、单向有序、双向有序属性相同和双向有序属性不同表可以分为双向无序、单向有序、双向有序属性相同和双向有序属性不同4 4类。类。第19页/共38页第十九页,共39页。双向无序(w x)RC表 R RC C表中两个分类变量皆为无序分类变量,对于该类资料:若研究目的为多个样本率(或构成比)的比表中两个分类变量皆为无序分类
26、变量,对于该类资料:若研究目的为多个样本率(或构成比)的比较较(bjio)(bjio),可用行列表资料的,可用行列表资料的2 2检验;若研究目的为分析两个分类变量之间有无关联性以及关系的检验;若研究目的为分析两个分类变量之间有无关联性以及关系的密切程度时,可以用行列表资料的密切程度时,可以用行列表资料的2 2检验以及检验以及PearsonPearson列联系数进行分析。列联系数进行分析。 第20页/共38页第二十页,共39页。例题(lt)1 某医师研究物理疗法、药物治疗某医师研究物理疗法、药物治疗(zhlio)(zhlio)和外用膏药三种疗法治疗和外用膏药三种疗法治疗(zhlio)(zhlio
27、)周围性面神经麻痹的疗效。问周围性面神经麻痹的疗效。问三种疗法的有效率有无差别?三种疗法的有效率有无差别?第21页/共38页第二十一页,共39页。例题(lt)2 测得某地测得某地58015801人的人的ABOABO血型和血型和MNMN血型结果血型结果(ji gu)(ji gu),问两种血型系统之间是否有关联?,问两种血型系统之间是否有关联?第22页/共38页第二十二页,共39页。单向(dn xin)有序RC表 有两种形式。一种是有两种形式。一种是R RC C表中的分组变量是有序的,而指标变量是无序的。此种单向有序表中的分组变量是有序的,而指标变量是无序的。此种单向有序R RC C表资料可表资料
28、可用行列表资料的用行列表资料的2 2检验检验(jinyn)(jinyn)进行分析。另一种情况是进行分析。另一种情况是R RC C表中的分组变量是无序的,而指标变量表中的分组变量是无序的,而指标变量是有序的,此种单向有序是有序的,此种单向有序R RC C表资料宜用秩和检验表资料宜用秩和检验(jinyn)(jinyn)进行分析。进行分析。第23页/共38页第二十三页,共39页。例题(lt) 某地城市与农村高血压患者严重程度情况,试比较该地城市和农村高血压患者高血压严重程度是否某地城市与农村高血压患者严重程度情况,试比较该地城市和农村高血压患者高血压严重程度是否(sh (sh fu)fu)有差别?有
29、差别?第24页/共38页第二十四页,共39页。双向有序RC表 双向有序属性双向有序属性(shxng)(shxng)相同的相同的R RC C表表 R RC C表中的两分类变量皆为有序且属性表中的两分类变量皆为有序且属性(shxng)(shxng)相同。实际上相同。实际上是是2 22 2配对设计的扩展,此时宜用一致性检验(或称配对设计的扩展,此时宜用一致性检验(或称KappaKappa检验)。检验)。 双向有序属性双向有序属性(shxng)(shxng)不同的不同的R RC C表表 R RC C表中的两分类变量皆为有序且属性表中的两分类变量皆为有序且属性(shxng)(shxng)不相同。对于不相
30、同。对于该类资料,需要分析两有序分类变量间是否存在线性变化趋势,宜用有序分组资料的线性趋势检验。该类资料,需要分析两有序分类变量间是否存在线性变化趋势,宜用有序分组资料的线性趋势检验。第25页/共38页第二十五页,共39页。行列(hng li)均为顺序变量的相关检验 变量虽然是有序的,但毕竟还不是定量的,需要给有序变量的各等级赋值方可进行相关分析。最简单的赋变量虽然是有序的,但毕竟还不是定量的,需要给有序变量的各等级赋值方可进行相关分析。最简单的赋值法是按顺序赋给秩次值法是按顺序赋给秩次( (即得分即得分) ),即给行变量的等级赋值,即给行变量的等级赋值1 1,2 2,R R和给列变量的等级赋
31、值和给列变量的等级赋值1 1,2 2,C C。这样。这样(X,Y)(X,Y)的不同取值就有的不同取值就有R RC C对,表中的对,表中的R RC C个频数就是这个频数就是这R RC C对取值所对应的频数,然后计算对取值所对应的频数,然后计算SpearmanSpearman秩相关系数,并作显著性检验秩相关系数,并作显著性检验(jinyn)(jinyn),这是比较粗糙的分析方法。,这是比较粗糙的分析方法。第26页/共38页第二十六页,共39页。行列均为顺序变量的相关(xinggun)检验 SpearmanSpearman秩相关分析比较粗糙,这是因为它给有序变量的等级赋值过于简秩相关分析比较粗糙,这
32、是因为它给有序变量的等级赋值过于简单,不能最大限度地获得有序变量之间的相关信息。而典型相关分析是在使单,不能最大限度地获得有序变量之间的相关信息。而典型相关分析是在使有序变量的相关达到极大的前提下给有序变量的各等级赋值,就是对于表的有序变量的相关达到极大的前提下给有序变量的各等级赋值,就是对于表的边缘(指边缘(指“行合计行合计”与与“列合计列合计”)设法产生一双变量正态,从而进行相关)设法产生一双变量正态,从而进行相关分析。因产生各等级的得分值的计算过程中涉及矩阵运算,故手工计算较麻分析。因产生各等级的得分值的计算过程中涉及矩阵运算,故手工计算较麻烦,将用烦,将用SASSAS程序实现统计计算。
33、一旦有了各等级的得分值后,就可运用求程序实现统计计算。一旦有了各等级的得分值后,就可运用求维频数资料相关系数的公式计算了。典型相关分析可以得出几个维频数资料相关系数的公式计算了。典型相关分析可以得出几个(j )(j )典典型相关系数型相关系数R R, 与每一个典型相关系数对应的检验为卡方检验,其数值为与每一个典型相关系数对应的检验为卡方检验,其数值为nR2nR2,其中,其中n n为为R RC C表中的总频数,与第表中的总频数,与第k k个卡方值对应的自由度个卡方值对应的自由度dfk=R+C-2k-1dfk=R+C-2k-1。第27页/共38页第二十七页,共39页。行列(hng li)均为顺序变
34、量的相关检验 与定量资料的相关与回归与定量资料的相关与回归(hugu)(hugu)分析类似,也可对分析类似,也可对R RC C表资料中有序变量之间是否存在线性趋势作显著表资料中有序变量之间是否存在线性趋势作显著性检验,通常这两种检验的结果是基本一致的,即相关分析结果显著,线性趋势检验结果也显著。可以通性检验,通常这两种检验的结果是基本一致的,即相关分析结果显著,线性趋势检验结果也显著。可以通过检验实现线性趋势检验,即利用回归过检验实现线性趋势检验,即利用回归(hugu)(hugu)分析思想产生的与线性回归分析思想产生的与线性回归(hugu)(hugu)有关的卡分量和偏离有关的卡分量和偏离线性回
35、归线性回归(hugu)(hugu)的卡分量。的卡分量。第28页/共38页第二十八页,共39页。行列均为顺序变量的相关(xinggun)检验 首先计算首先计算R RC C表的值,然后将总的值分解成线性回归分量与偏离线性回归分量。若两分量均具有统计学意表的值,然后将总的值分解成线性回归分量与偏离线性回归分量。若两分量均具有统计学意义,说明两分类变量存在相关关系,但关系不是简单义,说明两分类变量存在相关关系,但关系不是简单(jindn)(jindn)的直线关系;若线性回归分量有统计学意义,的直线关系;若线性回归分量有统计学意义,偏离线性回归分量无统计学意义时,说明两分类变量不仅存在相关关系,而且是线
36、性关系。偏离线性回归分量无统计学意义时,说明两分类变量不仅存在相关关系,而且是线性关系。 第29页/共38页第二十九页,共39页。行列均为顺序(shnx)变量的相关检验 计算计算 总的值总的值 计算线性回归分量计算线性回归分量 回归回归 b b为回归系数为回归系数 计算偏线性回归分量计算偏线性回归分量 将总的将总的 值分解成线性回归分量和偏离线性回归分量。若两分量均有统计学意义值分解成线性回归分量和偏离线性回归分量。若两分量均有统计学意义(yy)(yy),说明两分类变量存在相关关系,但关系不是简单的直线关系;若线性回归,说明两分类变量存在相关关系,但关系不是简单的直线关系;若线性回归分量有统计
37、学意义分量有统计学意义(yy)(yy),偏离线性回归分量无统计学意义,偏离线性回归分量无统计学意义(yy)(yy)时,说明两变量不时,说明两变量不仅存在相关关系,而且是线性关系。仅存在相关关系,而且是线性关系。221,nn2222回归总回回归RSSSSSbbXXYYXXXYSl*nl,llb2b2第30页/共38页第三十页,共39页。例题(lt) 某研究者欲研究年龄某研究者欲研究年龄(ninlng)(ninlng)与冠状动脉粥样硬化等级之间的关系,将与冠状动脉粥样硬化等级之间的关系,将278278例尸解资料整理成行乘列表,例尸解资料整理成行乘列表,问年龄问年龄(ninlng)(ninlng)与
38、冠状动脉粥样硬化等级之间是否存在线性变化趋势?与冠状动脉粥样硬化等级之间是否存在线性变化趋势?第31页/共38页第三十一页,共39页。分层资料(zlio)的分析 按一个或多个因素分层后,研究行变量与列变量间的联系按一个或多个因素分层后,研究行变量与列变量间的联系(linx)(linx)。 通过控制分层变量的影响,检验研究行变量与列变量的关系。通过控制分层变量的影响,检验研究行变量与列变量的关系。第32页/共38页第三十二页,共39页。例题(lt) 某研究某研究(ynji)(ynji)者欲研究者欲研究(ynji)(ynji)男女性使用别嘌男女性使用别嘌 呤是否引发皮疹。呤是否引发皮疹。第33页/
39、共38页第三十三页,共39页。本章(bn zhn)小节 2 2检验是用途很广的一种假设检验方法,这里我们主要学习它在分类资料统计检验是用途很广的一种假设检验方法,这里我们主要学习它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。成比比较的卡方检验以及分类资料的相关分析等。 本章第一节介绍了四格表的普通本章第一节介绍了四格表的普通 2 2检验方法,理论频数与实际频数的定义,检验方法,理论频数与实际频数的定义, 2 2检验统计量的计算方法,检验统计量的计
40、算方法, 2 2分布以及分布以及 2 2界值表确定界值表确定P P值的方法。说明了四格表值的方法。说明了四格表 2 2检验的应用条件,以及连续性校正公式和四格表专用公式。通过检验的应用条件,以及连续性校正公式和四格表专用公式。通过SASSAS分析实分析实例例(shl)(shl)演示了四格表演示了四格表 2 2检验过程以及结果解释。我们需要重点理解检验过程以及结果解释。我们需要重点理解 2 2检验的检验的含义以及应用。掌握含义以及应用。掌握 2 2检验的应用条件以及连续性校正公式等。检验的应用条件以及连续性校正公式等。第34页/共38页第三十四页,共39页。本章(bn zhn)小节 R RC C表可以分为双向无序、单向有序、双向有序属性相同和双向有序属表可以分为双向无序、单向有序、双向有序属性相同和双向有序属性不同性不同4 4类。双向无序类。双向无序R RC C表,表,R RC
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度报废车买卖及报废车辆拆解与环保设施投资合同
- 2025年度车辆租赁市场拓展与推广委托协议
- 2025年度体育赛事中间人代理协议
- 2025年度文化产业债权转让与数字内容创作合作协议
- 二零二五年度生物技术成果赠与协议范本
- 二零二五年度车辆质押融资项目合作协议
- 2025年度新型冷冻库租赁及仓储管理服务合同
- 2025年度事业单位专业技术人员聘用合同
- 2024-2025学年福建省晋江二中、奕聪中学、广海中学、泉港五中、马甲中学高二上学期期中联考生物试卷
- 2025年湖北省鄂州市单招职业适应性测试题库审定版
- 韩国语入门教学资料
- 《大学生职业能力训练》
- 人民警察忠诚品质
- 冠状动脉搭桥手术后的健康生活促进
- 《英国饮食文化》课件
- 《SolidWorks建模实例教程》第4章 综合应用实例
- JCT2110-2012 室内空气离子浓度测试方法
- 视频号运营规则
- 文印服务投标方案(技术方案)
- 初三语文总复习全程计划表
- 九年级初中语文阅读理解专题训练及答案
评论
0/150
提交评论