版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第12章 相对数,学习目标,理解相对数的含义 熟悉几种常用的相对数 熟悉应用相对数时应注意的问题 掌握率标准化的两种方法(直接法和间接法)以及SAS程序 掌握率假设检验方法和SAS程序,概述,分类资料的变量值是定性的,对其观察结果的分析与比较常用率、构成比、相对比等统计指标描述。这些指标都是由两个有联系的指标之比组成,又称相对数。,相对数,调查或实验搜集来的原始资料,经过汇总之后得到的小计或总计数值称为绝对数(即总量指标)。如发病人次数、医院收容人数、治愈人数等。总量指标反映一定条件下某种事物的规模或水平,是计划或总结工作的依据,同时,又是计算相对数与平均数的基础,但是绝对数往往不便于比较,因
2、此在实际工作中还必须计算相对数与平均数。,相对数,相对数是两个有关的绝对数之比,通常用百分比、千分比或万分比等表示,是医学研究中最常用的统计指标之一。 计算相对数的意义是把基数化做相等,便于相互比较。如:每千人中的发病数,每百名某病患者的死亡人数等。,例题,例如:某时期内,甲部队患感冒者17人,乙部队10人,我们不能因为17人多于10人,而得出甲部队感冒发病率高的结论,如果甲部队有1068人,乙部队为313人,那么甲乙部队感冒率分别为: 甲部队:17/10681000=15.9 乙部队:10/3131000=31.9 根据这两个感冒发病率可以看出,甲部队感冒的发病强度是乙部队的1/2左右。,率
3、,又称频率指标,表示在一定范围内,某现象的发生数与可能发生某现象的总数之比,说明某现象出现的强度或频度(即频繁的程度)。计算公式为:,率,在医学上常用的强度相对数有患病率、发病率、感染率、病死率、死亡率及人口自然增长率等。计算公式如下: 某病患病率=某病患病人数/调查人数100% 某病发病率=某期间内某病新病例数/同期间内平均人口数100% 某病感染率=带有某种病原体人数/检查人数100% 某病病死率=死于某病人数/某病患病人数1000 某病死亡率=某年某地某病死亡人数/同年该地平均人口数100% 出生率=某地某年活产数/该地同年年平均人口数1000 死亡率=某地某年死亡率/该地同年年平均人口
4、数1000 自然增长率=(某地某年活产数-死亡数)/该地同年年平均人口数1000=出生率-死亡率表示每年每1000人口增加的人数。,构成比,表示某部分在全部分中所占比重,以100作为基数,计算公式为: 全体内各组结构相对数的总和应为100%。,例题,例如:某年某地区各种疟疾发病例数为:恶性疟68名,间日疟12名,三日疟17名。则三种疟疾分别占疟疾患者总数的百分比为: 恶性疟=68/(68+12+17)100%=70.1% 间日疟=12/(68+12+17)100%=12.4% 三日疟=17/(68+12+17)=17.5% 各部分百分比之和为100%,即70.1%+12.4%+17.5%=10
5、0%,比,是两个有关指标之比。通常以某种现象的数量为1或100作基数,看另一种现象的数量是多少。计算公式为: 两个比较指标可以性质相同,也可以性质不同。如相对危险度、变异系数等;A、B两个指标可以是绝对数、相对数或平均数等。,比,常用的指标有三种: 对比指标:指两个同类事物某种指标(绝对数、两个率或其它同类指标)的比。例如某地区流脑发病率1975年为4.48/10万,1998年为0.49/10万,得,表示1975年为1998年的9.14倍。 关系指标:指两个有关的、但非同类事物的数量的比。如某医院医护人员与病床数之比。 计划完成指标:说明计划完成的程度,常用实际数达到计划数的百分之几或几倍。,
6、应用相对数注意事项,分母必须够大。习惯上,分母大于100时,所得相对数代表性最强,分母略小于100时,相对数仍有一定意义。如果分母太小,如20例甚至3例5例,则求得的相对数就不太可靠。在实际工作中,遇到这种情况时,还是用绝对数表达较为妥当。如:某病住院患者四人中死亡一人等。 分母必须选择恰当。例如:调查某部队人员的蛔虫感染情况时,收集的资料有部队人数、被检查人数、阳性人数。计算蛔虫阳性率时,应以被检查人数为分母,不应以部队人数为分母。此例所说的恰当,是指分母中每一个体都有可能进入分子。,应用相对数注意事项,用相对数进行比较时,就注意是否具备可比性例如:某部队对老战士计算三年累计的痢疾发病率,而
7、对新战士只计算本年度痢疾发病率,结果得出“新战士的痢疾发病率低于老战士”的结论,这显然是不正确的。因为计算的时期,不具备可比性,如果都计算本年度的发病率就可以比较了。影响率或构成比变化的因素很多,除了研究因素(即比较的因素)外,其余的影响因素应尽可能相同或相近,即在相同条件下比较才有意义。,应用相对数注意事项,分析时不能以构成比代替率。构成比只能说明事物个组成部分的比重或分布,并不说明某现象发生的频率或强度。二者概念和计算方法都不同,所得结论也应不同。 对观察单位数不同的几个率,不能直接相加求其总率。 对样本率(或构成比)的比较应随机抽样,并做假设检验。遵循随机抽样的原则才能以该“样本”来推断
8、总体。由于样本率和构成比也有抽样误差,所以不能仅凭数字表面相差的大小作结论,而须进行样本率差别的假设检验。,率的标准化,在工作中,比较几个强度相对数(率)时,应注意它们的内部构成是否有差异,当几个率的内部构成不同时,就要先进行率的标准化,而后再作比较,否则容易导致错误的结论。 解决这个矛盾的方法是进行率的标准化(简称标化)。进行标化时,首先要选定一个“标准构成”,如标准人口构成。一般选数量较大的,有代表性的、稳定的作标准构成。在实际工作中,对出生、死亡、发病率等进行标化时,选用标准人口构成。有时也用两个或几个比较组的合计数作标准构成。,率的标准化,率的标准化法,就是在一个指定的标准构成条件下进
9、行率的对比的方法。当我们对两个频率指标进行比较时,应该注意这两组(或两组以上)对象内部构成是否存在差别足以影响分析结果,如果存在的话,可应用标准化法加以校正。这种经标准化校正后的率,称为标准化率,简称标化率。率的标准化法有直接法的间接法。,直接法,如果观察人群中各组年龄别发病(或死亡)率已知,计算时就利用一组标准人口构成比来调整,求出标化率。 将标准人口构成的各年龄组人数乘上原来相应年龄组的发病率,得出各年龄组按标准人口计算的预期发病数 分别把各年龄组按标准人口计算的预期发病数相加,得出按标准人口计算的预期总发病人数,再除以标准总人口数,即得标化发病率。,间接法,如果在观察人群中,不知道各年龄
10、组的发病(或死亡)率,而是利用标准人口的年龄别率与观察人群中相对年龄组人数相乘,求出年龄组预期发病(或死亡)人数的总的预期数,再与实际数相比,得出标化发病(或死亡)比;最后乘以标准人口总发病(或总死亡)率,得出该人群的标化发病(或死亡)率。该计算法就称间接法。其计算式为: 标化发病比实际观察发病人数/预期发病人数 或 标化死亡比=实际观察死亡人数/预期死亡人数 标化发病率=标准人口发病率标化发病比 标化死亡率=标准人口死亡率标化死亡比,率的假设检验,一般地,从一个阳性率为的总体中,随机抽取含量为n的样本,则样本中的阳性数X服用二项分布 ,样本阳性率p的概率分布为: 其中, 样本率p的总体均数
11、样本率p的总体标准差,率的假设检验,样本均数的标准差称为均数的标准误,同理,样本率的标准差称为率的标准误。因样本率的均数为总体率,故样本率的标准差,也就是率的标准误描述了样本率相对于总体率分布的离散程度。当样本含量n较大,总体阳性率不接近于0也不接近于1时,样本中的阳性数近似正态分布 ,样本阳性率也近似正态分布 ,故95%的样本率满足:,样本率与总体率的比较,观察样本数较大时,样本率的频数分布近似正态分布,可应用正态分布的规律性检验率的差异显著性。其公式为: 式中p为样本率, 为总体率, 为根据总体率计算的标准误。由于 服从正态分布,故可根据正态分布作判断,进行统计推断。,两个样本率差异的意义
12、检验,当n较大,p与(1p)均不太小时,样本率的分布近似正态分布。根据独立的两个正态变量的差也服从正态分布的性质,当两个样本的含量你n1与n2较大,且p1、(1p1)p2、(1p2)均不太小,例如n1p1、n1(1p1)、n2p2、n2(1p2)均大于5时,可用下面介绍的检验,由两个样本率对应的两个总体率作出统计推断。,两个样本率差异的意义检验,统计量的计算公式为: 其中, 以上公式中:P1,P2为两个样本率; pc为合并样本率; X1和X2分别为两样本阳性例数;,本章小节,相对数是两个有关的绝对数之比,通常用百分比、千分比或万分比等表示,是医学研究中最常用的统计指标之一。计算相对数的意义是把
13、基数化做相等,便于相互比较。如:每千人中的发病数,每百名某病患者的死亡人数等。几种常用的相对数包括率(表示在一定范围内,某现象的发生数与可能发生某现象的总数之比,说明某现象出现的强度或频度)、构成比(表示某部分在全部分中所占比重,以100作为基数)和比(是两个有关指标之比)。,本章小节,在工作中,比较几个强度相对数(率)时,应注意它们的内部构成是否有差异,当几个率的内部构成不同时,就要先进行率的标准化,而后再作比较,否则容易导致错误的结论。率的标准化法,就是在一个指定的标准构成条件下进行率的对比的方法。当我们对两个频率指标进行比较时,应该注意这两组(或两组以上)对象内部构成是否存在差别足以影响
14、分析结果,如果存在的话,可应用标准化法加以校正。这种经标准化校正后的率,称为标准化率,简称标化率。率的标准化法有直接法的间接法。文中具体说明了直接法和间接法计算标准化率,并编写SAS程序进行运算。,第13章 行列表分析,学习目标,掌握四格表普通卡方检验和配对卡方检验方法以及相应的SAS程序; 了解FREQ过程语句格式; 熟悉RC表资料的分类类型以及相应的统计检验方法; 掌握行均分检验以及SAS程序; 掌握行列均为顺序变量的相关检验以及SAS程序; 掌握分层行列表的分析以及SAS程序; 掌握趋势卡方检验方法以及SAS程序; 了解卡方分割与卡方合并; 熟悉Fishers确切概率计算方法。,概述,前
15、面已介绍了两个率比较的检验,在观察例数不够大或拟对多个率进行比较时,检验就不适宜了,因为直接对多个样本率作两两间的检验有可能增加第一类误差。2检验可解决此类问题。 卡方检验是用途很广的一种假设检验方法,这里我们主要学习它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。,四格表资料,定性指标分为有序的(如:疗效分为“治愈、显效、好转、无效、死亡”)和名义的(如:血型分为“O、A、B、AB”型)类,对于每个受试者来说,有序指标的观测结果只能是该有序指标若干等级中的级(如某人的疗效为“显效”);名义指标的观测结果只能是该名
16、义指标若干标志中的个(如某人的血型为型),显然,无法像处理定量指标那样去直接分析定性指标,故这类资料常被整理成列联表的形式后再进行分析。 当表中只有个定性指标时,称为维列联表;有个或个以上定性指标时,称为多维列联表。常用R、C表示维列联表的行数和列数,并称为RC表;当R=C=时,称为表(或四格表)。表看起来很简单,但根据资料所具备的条件有许多不同的处理方法。,四格表卡方检验,为了解不同致癌剂的致癌作用,分别在两组大白鼠皮肤涂以不同致癌剂,观察不同致癌剂作用下的发癌率,结果如下表13-1,问两组发癌率有无差别? 表13-1 不同致癌剂作用下大白鼠的发癌率,四格表卡方检验,这四个格子是表中最基本的
17、数据,其余数据都是由这四个数据推算出来的,因此上表资料又被称之为四格表资料。 2检验的基本思想及计算步骤如下: 假设两总体率相等 H0: ,即两总体发癌率相等; H1: ,即两总体发癌率不等; 。,四格表卡方检验,不妨将H0看作 两样本合并的发癌率(Pc80.33),按合计率推算,本例第一行第一列理论上的致癌数为: 此结果称为理论频数,简称理论数,记为T。由上述过程可推导出理论数的计算公式为:,四格表卡方检验,式中Trc即第r行第c列的理论数,nr为Trc所在行合计,nc为Trc所在列合计。相应地,表中的4个基本数据为实际频数,简称为实际数,记为A。4个基本格子的实际数都不等于理论数。 经上述
18、推导,两样本率的差别就演绎为实际数与理论数之间的差别。即:两样本率相差越大,则实际数与理论数的差别就愈大。,四格表卡方检验,卡方检验的统计量是2值,它是每个格子实际频数A与理论频数T差值平方与理论频数之比的累计和。每个格子中的理论频数T是在假定两组的发癌率相等(均等于两组合计的发癌率)的情况下计算出来的,故2值越大,说明实际频数与理论频数的差别越明显,两组发癌率不同的可能性越大。,四格表卡方检验,实际数与理论数的差值服从2分布:在H0条件下,上述 差值属于随机误差,可获得统计量:,四格表卡方检验,差2分布表,确定P值并作出推论,以1查2界值表得: 本例26.4777,故0.05P0.01,按水
19、平拒绝H0,接受H1,因而可以认为两种致癌剂作用于大白鼠的发癌率有差别(统计学推论)。结果说明乙组致癌剂的发癌率高于甲组(结合样本率作实际推论)。,连续性校正公式,2分布是正态变量的一种分布。设 是k个独立的标准正态变量,则 。2界值表就是根据这种连续性分布计算出来的。2统计量计算公式实质上是正态近似法。分类资料是间断性的,由此计算的2值不连续,尤其自由度为1的四格表,求出的概率可能偏小,此时需要对2值进行连续性校正,公式为,2检验的应用条件,连续性校正主要针对四格表资料,尤其理论数较小时,连续性校正不可忽略。 四格表2检验的应用条件为: 当n40且所有T5时,用普通的2检验,若所得,改用确切
20、概率法; 当n40但有1T5时,用校正的2检验; 当n40或有T1时,不能用2检验,改用确切概率法。,四格表卡方检验的SAS程序,在SAS/STAT模块中FREQ、TABULATE和SUMMARY等过程可用于分类资料的统计描述,其中FREQ过程兼具统计描述和统计推断的功能,对分类变量计算频数分布,产生从一维到n维的频数表和列联表;对于二维表,可进行2检验,对于三维表,可作Mentel-Hanszel分层分析。FREQ过程是SAS用于分析分类资料的一个常用过程。本节将先向大家介绍FREQ过程的语句及其格式。 FREQ过程的语句基本格式如下: Proc freq data= order= ; Ta
21、ble 分类变量*分类变量/ ; Weight 变量; Run;,四格表卡方检验的SAS程序,DATA数据集:规定PROC FREQ语句使用的数据集; ORDERFREQ,按频数递减顺序排列;ORDERDATA,按数据集中出现的顺序排列;ORDERINTERNAL,按内部值排列(缺省);ORDERFORMATTED,按外部格式值排列; Table语句指定构成表格的变量和表格结构。表格的结构由变量个数和变量排列顺序决定,一个table语句允许列出多个表格结构。PROC FREQ过程中可有多条TABLES语句,TABLES语句后可接多个表格请求式,每个请求式可包含任何数量的变量,从而得到所需的表格
22、。,四格表卡方检验的SAS程序,如果TABLES语句缺省,则FREQ过程对数据集中的所有变量都给出相应的一维频数表。不规定任何选项时,若需某变量的一维频数,FREQ给出该变量每一水平的频数、累积频数、频数的百分比和累积百分比;若需二维频数表,FREQ产生交叉分组列表,即包括各格的频数、总频数的格百分数、行频数的格百分数和列频数的格百分数。 请求式由一个或多个用“*”连接起来的变量名组成。几个变量可放在括号中,如: TABLES A*(B C);等价于TABLES A*B A*C; TABLES (A-C)*D;等价于TABLES A*D B*D C*D;,四格表卡方检验的SAS程序,下列选项可
23、用于TABLES语句中“/”的后面: OUT数据集:建立一个包含变量值和频数计数的输出数据集。如果TABLES语句中不止一个请求式,数据集的内容相应于TABLES语句中最后一个请求。 CHISQ对每层作c2检验,包括Pearson c2、似然比c2和Mantel-Haenszel c2。此外还给出与c2检验有关的关联指标包括Phi系数、列联系数和Cramers V。对于22表,给出Fisher精确概率。 AGREE 进行配对c 2检验。 EXACT 对大于22的列联表计算Fisher精确概率。同时也给出CHISQ选项的全部统计量。,四格表卡方检验的SAS程序,MEASURES对每层的二维表计算
24、一系列关联指标及相应的标准误,包括Pearson和Spearman相关系数,以及Gamma和Kendall系数等。对于22表,还给出常用的危险度指标及其标准误。 CMH 给出Cochran-Mantel-Haenszel统计量,可检验在调整了TABLES语句中其它变量后,行变量与列变量之间的关联程度。对于22表,FREQ过程给出相对危险度估计及其可信区间,还给出各层关联度指标是否齐性的Breslow检验。 ALL 给出CHISQ、MEASURES、CMH所请求的全部统计量。 ALPHAp给出检验水准。缺省为0.05。,四格表卡方检验的SAS程序,EXPECTED给出期望频数。 DEVIATIO
25、N给出每格的实际频数与期望频数的差值。 CELLCHISQ给出每格对总c2的贡献,即计算每格的(实际频数-期望频数)2/期望频数。 CUMCOL给出累积列百分数。 NOFREQ不给出列联表中的格频数。 NOPERCENT不给出列联表中的格百分数。,四格表卡方检验的SAS程序,NOROW不给出列联表中各格的行百分数。 NOCOL不给出列联表中各格的列百分数。 NOCUM不给出频数表的累积频数和累积百分数。 NOPRINT不给出表格,但给出CHISQ、MEASURES或CMH等语句所指定的统计量。 Trend指令系统对2C频数表的C个百分率进行Cochran-Armitage趋势检验; WEIGHT语句:通常每个观察值提供数值1给频数计数,当WEIGHT语句出现时,每个观察值提供的是该观察值的加权变量值。该值必须非负,但可不必为整数。只能使用一个WEIGHT语句,且该语句作用于所有的表。,配对计数资料的卡方检验,把每一份样本平均分成两份,分别用两种方法进行化验,比较此两种化验方法的结果(两类计数资料)是否有本质的不同;或者分别采用甲、乙两种方法对同一批病人进行检查,比较此两种检查方法的结果(两类计数资料)是否有本质的不同,此时要用配对卡方
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 辽宁医药职业学院《Java+语言程序设计实验》2023-2024学年第一学期期末试卷
- 兰州工业学院《行为医学》2023-2024学年第一学期期末试卷
- 江西建设职业技术学院《土地测量与评价》2023-2024学年第一学期期末试卷
- 吉林职业技术学院《外国音乐史Ⅰ》2023-2024学年第一学期期末试卷
- 湖南电子科技职业学院《物流流程再造》2023-2024学年第一学期期末试卷
- 黑龙江司法警官职业学院《生物信息学》2023-2024学年第一学期期末试卷
- 重庆应用技术职业学院《集成电路版图设计》2023-2024学年第一学期期末试卷
- 重庆建筑工程职业学院《外语教育研究方法》2023-2024学年第一学期期末试卷
- 中央戏剧学院《计算机网络基础》2023-2024学年第一学期期末试卷
- 中国石油大学(北京)《数据库技术及应用实践》2023-2024学年第一学期期末试卷
- 南阳石油分公司非油品业务经营管理制度概要
- GB/T 2843-1981钢化玻璃抗冲击性试验方法(227克钢球试验)
- FZ/T 73042-2011针织围巾、披肩
- 统编部编版三年级道德与法治下册优秀课件【全册】
- 生物质能完整资料课件
- 2023年版义务教育音乐课程标准(标准版)
- 特色服装民族服饰项目大学生创业计划书
- (完整版)汉密尔顿焦虑量表(HAMA)
- 大型集团公司商学院培训体系建设方案
- 职工退休提取住房公积金申表版
- 电力电子技术全套课件
评论
0/150
提交评论