版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、分类变量资料统计分析7版) 第十章 分类变量资料的统计分析1 第十章第十章 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析2 主要内容主要内容 分类变量资料的统计描述分类变量资料的统计描述 分类变量资料的统计推断分类变量资料的统计推断 卡方检验卡方检验 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析3 什么是分类变量资料?什么是分类变量资料? 用什么指标进行描述?用什么指标进行描述? 甲、乙两地发生麻疹流行,甲地患儿100人,乙地患儿50 人,何地较为严重? 若甲地易感儿童667人,而乙地易感儿童250人。 甲地麻疹发病率为 100/667100%=15% 乙地麻疹发病
2、率为 50/250100%=20% 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析4 第一节第一节 分类变量资料的统计描述分类变量资料的统计描述 常用相对数常用相对数 应用相对数时的注意事项应用相对数时的注意事项 率的标准化法率的标准化法 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析5 相对数相对数 相对数:是两个有关联的数值或指标之比。相对数:是两个有关联的数值或指标之比。 常用的相对数有:常用的相对数有: 率率 构成比构成比 相对比相对比 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析6 率率(rate) 率:是指在一定观察时间内,某现象实际发生数与率
3、:是指在一定观察时间内,某现象实际发生数与 可能发生该现象的总数之比,用以说明某现象发生可能发生该现象的总数之比,用以说明某现象发生 的频率或强度。的频率或强度。 K K为比例基数,如为比例基数,如100%100%、10001000等。比例基数的选择主要依等。比例基数的选择主要依 习惯而定或使计算结果能保留习惯而定或使计算结果能保留1 12 2位整数。位整数。 K 单位总数可能发生该现象的观察 单位数实际发生某现象的观察 率 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析7 构成比构成比(constituent ratio) 构成比:是指事物内部某一部分的观察单位数与事构成比:是指
4、事物内部某一部分的观察单位数与事 物内部各组成部分的观察单位数总和之比,用以说物内部各组成部分的观察单位数总和之比,用以说 明事物内部各部分所占的比重或分布。明事物内部各部分所占的比重或分布。 100 事物内部某一部分的观察单位数 构成比 事物内部各部分的观察单位数总和 常用百分数表示,故又称百分比。常用百分数表示,故又称百分比。 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析8 各部分构成比之和为各部分构成比之和为100%。 此消彼长。此消彼长。 构成比的两个特点:构成比的两个特点: 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析9 例例10-1 2001年对某地中小
5、学学生进行年对某地中小学学生进行HbsAg检查,检查, 结果见表结果见表10-1,试计算各级学生,试计算各级学生HbsAg检出率及阳检出率及阳 性者构成比性者构成比 率和构成比不是同一指标,在应用时应注意加以区分。率和构成比不是同一指标,在应用时应注意加以区分。 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析10 相对比相对比 相对比:指两个有关指标之比,说明两个指标的比相对比:指两个有关指标之比,说明两个指标的比 例关系。例关系。 甲指标 相对比(或 100) 乙指标 两个指标可以是绝对数、相对数、平均数,可以是性质相同两个指标可以是绝对数、相对数、平均数,可以是性质相同 或性质
6、不同,但两个指标互不包含。或性质不同,但两个指标互不包含。 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析11 例例10-2 某地某地2003-2005年不同性别新生儿数见表年不同性别新生儿数见表 10-2,试计算该地不同年份新生儿性别比。,试计算该地不同年份新生儿性别比。 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析12 应用相对数的注意事项应用相对数的注意事项 计算相对数时分母不宜过小计算相对数时分母不宜过小 正确区分构成比和率,不能以构成比代替率正确区分构成比和率,不能以构成比代替率 正确计算平均率正确计算平均率 对率和构成比进行比较时,应注意资料的可比性对率和
7、构成比进行比较时,应注意资料的可比性 率的标准化率的标准化 样本率或构成比进行比较时要作假设检验样本率或构成比进行比较时要作假设检验 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析13 率的标准化率的标准化 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析14 在进行两个内部构成不同的总率比较时,采在进行两个内部构成不同的总率比较时,采 用统一的标准进行校正,然后计算校正后的标准用统一的标准进行校正,然后计算校正后的标准 化率,再进行比较的方法称为率的标准化法。化率,再进行比较的方法称为率的标准化法。 率的标准化法率的标准化法 分类变量资料统计分析7版) 第十章 分类变量
8、资料的统计分析15 计算标准化率时,首先要选定一个比较的计算标准化率时,首先要选定一个比较的“标准标准”。 如,对年龄构成进行标化时,可选用全国、全省等大范围人如,对年龄构成进行标化时,可选用全国、全省等大范围人 口构成资料作标准,也可将比较组的合并人口或以其中任一口构成资料作标准,也可将比较组的合并人口或以其中任一 组的人口构成作标准。组的人口构成作标准。 原则上,选定的标准人口应有代表性、较稳定,容易获得,原则上,选定的标准人口应有代表性、较稳定,容易获得, 便于比较。便于比较。 根据获得的资料和选定的标准不同,标准化法可分为直接法根据获得的资料和选定的标准不同,标准化法可分为直接法 和间
9、接法。和间接法。 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析16 直接法直接法 适用情况:已知被标化组各年龄组的实际率适用情况:已知被标化组各年龄组的实际率P Pi i, 用标准人口数或标准人口构成进行计算。用标准人口数或标准人口构成进行计算。 ii i ii pCp N pN p 或 其中其中 为第为第i 组标准人口数,组标准人口数, 为标准组总人数,为标准组总人数, 为第为第i 组的实际率,组的实际率, 为第组标准人口构成。为第组标准人口构成。 i N i p i C i N 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析17 甲社区标准化后的患病率甲社区标准化
10、后的患病率 乙社区标准化后的患病率乙社区标准化后的患病率 表表 10-4 甲、乙两社区 20 岁以上居民高血压标准化患病率(直接法) 甲社区 乙社区 年龄组 标准 人口 i N 实际患病率 (%) 1 i p 预期 患病数 1ii pN 实际患病率 (%) 2i p 预期 患病数 2ii pN 20- 1539 10.86 167 11.76 181 35- 1665 21.48 358 22.88 381 50- 1584 34.69 549 36.96 585 65- 1675 53.44 895 56.01 938 合计 6463 (N) 1969 ( 1ii pN) 2085 ( 2i
11、i pN) %47.30%100 6463 1969 p %26.32%100 6463 2085 p 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析18 如根据选定的标准人口构成做标准,如根据选定的标准人口构成做标准, 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析19 间接法间接法 适用情况:已知被标化组的死亡总数及年龄别人适用情况:已知被标化组的死亡总数及年龄别人 口数,但不知道各年龄组的实际死亡率。口数,但不知道各年龄组的实际死亡率。 ii PN r PP 标准化死亡比标准化死亡比 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析20 标准化死亡比:标
12、准化死亡比:被标化组实际死亡数与预期死亡被标化组实际死亡数与预期死亡 数之比,称为标准化死亡比(数之比,称为标准化死亡比(standard mortality ratio),简称为),简称为SMR。若。若SMR1,表示被标化人,表示被标化人 群的死亡率高于标准组;反之,若群的死亡率高于标准组;反之,若SMR1,表示被,表示被 标化人群的死亡率低于标准组。标化人群的死亡率低于标准组。 ii PnrSMR/ 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析21 例例10-410-4 某地观察了吸烟者与不吸烟者各年龄组人数如表某地观察了吸烟者与不吸烟者各年龄组人数如表 10-610-6,同
13、时观察期内吸烟者中有,同时观察期内吸烟者中有432432人死于肺癌,不吸烟者人死于肺癌,不吸烟者 中有中有210210人死于肺癌,试计算吸烟者与不吸烟者的标准化死人死于肺癌,试计算吸烟者与不吸烟者的标准化死 亡率。亡率。 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析22 吸烟者的肺癌标准化死亡比吸烟者的肺癌标准化死亡比 29124 67100 432 . . SMR 非吸烟者的肺癌标准化死亡比非吸烟者的肺癌标准化死亡比 210 0.8620 243.67 SMR 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析23 吸烟者的肺癌标准化死亡率吸烟者的肺癌标准化死亡率 非吸
14、烟者的肺癌标准化死亡率非吸烟者的肺癌标准化死亡率 万万10/83.298620.010/60.34 2 p 万万10/48.1482912.410/60.34 1 p 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析24 率的标准化应注意的问题率的标准化应注意的问题 (1 1)当各比较组内部构成(如年龄、性别等)不同时,)当各比较组内部构成(如年龄、性别等)不同时, 应对率进行标准化后,再作比较。应对率进行标准化后,再作比较。 (2 2)标准化率只表明各标化组率的相对水平,而不代表)标准化率只表明各标化组率的相对水平,而不代表 其实际水平。其实际水平。 (3 3)两总率各分组对应的率
15、有明显交叉时,则不能用标)两总率各分组对应的率有明显交叉时,则不能用标 准化率进行比较。准化率进行比较。 (4 4)如为抽样研究资料,两样本标准化率的比较也应作)如为抽样研究资料,两样本标准化率的比较也应作 假设检验。假设检验。 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析25 率的抽样分布率的抽样分布 率的抽样误差与标准误率的抽样误差与标准误 总体率的区间估计总体率的区间估计 率比较的率比较的u u检验检验 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析26 率的抽样分布率的抽样分布 从某个二项分类总体中随机抽取含量一定的样本,其从某个二项分类总体中随机抽取含量一定
16、的样本,其 样本率的分布概率是有规律的,这种规律为服从二项样本率的分布概率是有规律的,这种规律为服从二项 分布(分布(binomial distribution),即样本中阳性数或样),即样本中阳性数或样 本阳性率的分布概率等于二项式展开后各项。若总体本阳性率的分布概率等于二项式展开后各项。若总体 阳性率为阳性率为、样本含量为、样本含量为n,阳性数为,阳性数为X,则样本中出,则样本中出 现现X个阳性事件的概率可由下式求得。个阳性事件的概率可由下式求得。 n , 2, 1, , 0 )1 ( )!( ! ! )( X XnX n XP XnX 分类变量资料统计分析7版) 第十章 分类变量资料的统
17、计分析27 已知:已知:,n =10;,n =5;,n =10;,n =15。 试根据式(试根据式(10-6)求各阳性数事件的概率并作概率分布图。)求各阳性数事件的概率并作概率分布图。 图图10-1 10-1 率的抽样分布图率的抽样分布图 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析28 率的抽样分布特征率的抽样分布特征 1.为离散型分布;为离散型分布; 2.2.当当 =1-=1-时,呈对称分布;时,呈对称分布; 3.3.当当n n增大时,逐渐逼近正态分布。增大时,逐渐逼近正态分布。 一般认为,当一般认为,当nn和和n n(1-(1-)5)5时时, , 可近似看可近似看 作正态分
18、布。作正态分布。 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析29 率的抽样误差和标准误率的抽样误差和标准误 由于抽样所引起的样本率和总体率或各样本率由于抽样所引起的样本率和总体率或各样本率 之间存在着差异,这种差异称为率的抽样误差。之间存在着差异,这种差异称为率的抽样误差。 用率的标准误表示用率的标准误表示 。 n p n pp s p 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析30 例例10-6 10-6 为了解某地人群结核菌素试验阳性率情况,某医为了解某地人群结核菌素试验阳性率情况,某医 疗机构在该地人群中随机检测了疗机构在该地人群中随机检测了1773177
19、3人,结核菌素试验阳人,结核菌素试验阳 性有性有682682人,阳性率为人,阳性率为38.47%38.47%,试计算其标准误。,试计算其标准误。 %16.10116.0 1773 3847.03847.0 p s 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析31 总体率的区间估计总体率的区间估计 总体率的估计:总体率的估计: 点估计点估计 区间估计区间估计 正态近似法正态近似法 查表法查表法 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析32 正态近似法正态近似法 当样本含量当样本含量n足够大,样本率足够大,样本率p或或1-p均不太小时(如均不太小时(如np和和 n(
20、1-p)均大于均大于5),样本率的分布近似正态分布。),样本率的分布近似正态分布。 p Sup u u 是标准正态分布双侧临界值,在估计总体率的是标准正态分布双侧临界值,在估计总体率的95% 置信区间时,其值为;置信区间时,其值为;99%置信区间时,其值为。置信区间时,其值为。 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析33 95%的置信区间:的置信区间: 38.47%1.16%=36.20%40.74% 99%的置信区间:的置信区间: 38.47% 2.58 1.16%=35.48%41.46% 例例10-6中该地人群中结核菌素试验阳性率中该地人群中结核菌素试验阳性率95%和
21、和 99%的置信区间为:的置信区间为: 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析34 查表法查表法 当当n较小,如较小,如n 50,特别是,特别是p接近于接近于0或或1时,按二项分时,按二项分 布原理估计总体率的可信区间。布原理估计总体率的可信区间。 因其计算比较复杂,统计学家已经编制了总体率可信因其计算比较复杂,统计学家已经编制了总体率可信 区间估计用表,可根据样本含量区间估计用表,可根据样本含量n和阳性数和阳性数x查阅统计查阅统计 学专著中的附表学专著中的附表 。 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析35 u u 检验检验 当样本含量当样本含量n足够
22、大,样本率足够大,样本率p或或1-p均不均不 太小时(如太小时(如np和和n(1-p)均大于均大于5),样本率的),样本率的 分布近似正态分布。样本率和总体率之间、分布近似正态分布。样本率和总体率之间、 两个样本率之间的比较可用两个样本率之间的比较可用u检验检验(u test) 。 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析36 样本率与总体率的比较样本率与总体率的比较 1p pp u n 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析37 例例10-7 10-7 一般情况下,直肠癌围术期并发症发生率一般情况下,直肠癌围术期并发症发生率 为为30%30%,现某医院手
23、术治疗了,现某医院手术治疗了385385例直肠癌患者,围例直肠癌患者,围 术期出现并发症有术期出现并发症有100100例,并发症发生率为例,并发症发生率为26%26%,问,问 该院直肠癌患者围术期并发症发生率与一般情况比该院直肠癌患者围术期并发症发生率与一般情况比 较有无统计学差异。较有无统计学差异。 本例,样本率为本例,样本率为26%,np和和n(1-p)均大于均大于5,可采,可采 用用u检验。检验。 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析38 建立检验假设建立检验假设 H0: = 0,H1: 0, 2. 计算计算u值值 3. 确定确定P值,判断结果值,判断结果 本题本题
24、u u,P P0.05,0.05,按按 的水准不拒绝的水准不拒绝H H0 0,差异没有统计,差异没有统计 学意义,故尚不能认为该院直肠癌患者围术期并发症发学意义,故尚不能认为该院直肠癌患者围术期并发症发 生率与一般情况不同。生率与一般情况不同。 713.1 385 )3.01(3.0 26.03.0 u 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析39 两个样本率的比较两个样本率的比较 12 12 11 (1)() cc pp u pp nn 21 21 nn XX pc 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析40 例例10-8 10-8 为了解某地小学生蛔虫
25、感染率的城乡差异,抽样调查了该地为了解某地小学生蛔虫感染率的城乡差异,抽样调查了该地 小学生小学生2279222792人,其中城镇小学生人,其中城镇小学生82078207人,粪检蛔虫卵阳性数为人,粪检蛔虫卵阳性数为701701人,人, 蛔虫感染率为蛔虫感染率为8.54%8.54%,乡村小学生,乡村小学生1458514585人,粪检蛔虫卵阳性数为人,粪检蛔虫卵阳性数为21672167 人,蛔虫感染率为人,蛔虫感染率为14.86%14.86%,试比较该地小学生蛔虫感染率城乡差异有,试比较该地小学生蛔虫感染率城乡差异有 无统计学意义。无统计学意义。 建立检验假设建立检验假设 H0: 1= 2,H1:
26、 1 2, 2. 计算计算u值值 1258. 0 145858207 2167701 c P 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析41 确定确定P P值和判断结果值和判断结果 本题本题 ,P P0.01,0.01,按按 的水的水 准拒绝准拒绝H H0 0,接受,接受H H1 1,差异有统计学意义。,差异有统计学意义。 3. 确定确定P值,判断结果值,判断结果 0046. 0) 14585 1 8207 1 )(1258. 01 (1258. 0 21 PP S 739.13 0046. 0 1486. 00854. 0 u u 分类变量资料统计分析7版) 第十章 分类变量
27、资料的统计分析42 2检验检验 基本思想基本思想 四格表资料的卡方检验四格表资料的卡方检验 配对设计分类变量资料的卡方检验配对设计分类变量资料的卡方检验 行行列表资料的卡方检验列表资料的卡方检验 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析43 2检验(检验(Chi-square test) t 是现代统计学的创始人之一,英国是现代统计学的创始人之一,英国 统计学家于统计学家于1900年提出的一种具有年提出的一种具有 广泛用途的假设检验方法。常用于分广泛用途的假设检验方法。常用于分 类变量资料的统计推断。类变量资料的统计推断。 分类变量资料统计分析7版) 第十章 分类变量资料的统
28、计分析44 基本思想基本思想 例例10-9 某医生欲比较用甲、乙两种药物治疗动脉硬化某医生欲比较用甲、乙两种药物治疗动脉硬化 的疗效,甲药治疗的疗效,甲药治疗71例,有效例,有效52例,例, 乙药治疗乙药治疗42例,例, 有效有效39例,结果见表例,结果见表10-7。问两种药物的有效率是否有。问两种药物的有效率是否有 差别?差别? 表表10-7 甲、乙两种药物治疗动脉硬化的疗效比较甲、乙两种药物治疗动脉硬化的疗效比较 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析45 2 2 ()AT T 卡方检验的基本公式:卡方检验的基本公式: RC n n T n A:实际频数:实际频数 T:
29、理论频数:理论频数 由上式可以看出,由上式可以看出,x2值反映的是在检验假设值反映的是在检验假设H0 前提下实际频数与理论频数的吻合程度。前提下实际频数与理论频数的吻合程度。 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析46 2 2检验的自由度检验的自由度 指可以自由取值的基本格子数指可以自由取值的基本格子数 自由度一定时,其自由度一定时,其 2 2值的概率分布也就确定。根据自由值的概率分布也就确定。根据自由 度度 和检验水准和检验水准 查表查表10-13 10-13 可得可得 2 2界值,若界值,若 2 2值值 2 2 ( ),),则可按 则可按 的检验水准拒绝的检验水准拒绝H
30、 H0 0;若;若 2 2值值 2 2( ( ),),则还 则还 不能拒绝不能拒绝H H0 0。 ) 1)(1(列数行数 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析47 四格表资料的卡方检验四格表资料的卡方检验 四格表资料四格表资料 处处 理理+-合合 计计 Aaba+b Bcdc+d 合合 计计a+cb+dn(a+b+c+d) 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析48 H0 :两药有效率相同,即:两药有效率相同,即 1 2 H1 :两药有效率不同,即:两药有效率不同,即 1 2 (1) 建立检验假设,确定检验水准建立检验假设,确定检验水准 例例10-9
31、10-9 甲、乙两种药物治疗动脉硬化的疗效比较甲、乙两种药物治疗动脉硬化的疗效比较 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析49 2 2( (1 1), , 2 2( (1 1)。本例 。本例5.025.0240,Tmin5 48. 6 18. 8 18. 83 82.33 82.3339 82.13 82.1319 18.57 18.5752 2222 2 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析50 2 2 () ()()()() adbcn ab cd ac bd 四格表专用公式:四格表专用公式: 本例,本例,48. 6 22914271 113)39
32、19352( 2 2 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析51 校正公式:校正公式: 2 2 (0.5)AT T 2 2 (/2) ()()()() adbcnn ab cd ac bd 四格表资料四格表资料 2 2检验的校正检验的校正 分布是一种连续性分布,而分类变量资料属离散性分分布是一种连续性分布,而分类变量资料属离散性分 布,由此得到的布,由此得到的 统计量也是不连续的。为改善统计量也是不连续的。为改善 2 2统计量分统计量分 布的连续性,英国统计学家布的连续性,英国统计学家Yates F建议将实际频数和理论建议将实际频数和理论 频数之差的绝对值减去以作校正。频数
33、之差的绝对值减去以作校正。 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析52 例例10-10 10-10 某医生研究比较某医生研究比较A A、B B两种药物对急性细菌两种药物对急性细菌 性肺炎的疗效,有关资料见表性肺炎的疗效,有关资料见表10-810-8,问两种药物的疗,问两种药物的疗 效差别有无统计学意义?效差别有无统计学意义? 表表10-8 A、B两药治疗急性细菌性肺炎的疗效比较两药治疗急性细菌性肺炎的疗效比较 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析53 H0: 1= 2 H1: 1 2 T22=22 5 按按 =1=1,查,查 2 2值表,值表, 2 2
34、( (1 1), , 2 2 ,P P0.05, 0.05, 按按 水水 准,拒绝准,拒绝H H0 0,接受,接受H H1 1,认为两药的疗效差别有统计,认为两药的疗效差别有统计 学意义,学意义,A A药疗效要好于药疗效要好于B B药。药。 79. 4 8562242 642/64162640 2 2 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析54 在实际工作中,对于四格表资料,通常规定在实际工作中,对于四格表资料,通常规定 (1 1)T5T5,且,且N40N40时,直接计算值,不用校正;时,直接计算值,不用校正; (2 2)1T5, 1T5, 且且N40N40时,用连续性校正
35、检验;时,用连续性校正检验; (3 3)T1T1或或N40N 2 2( (2 2), PP0.01, 0.01, 按按 的检验水准,拒绝的检验水准,拒绝H H0 0,接受,接受H H1 1,故可认为,故可认为 甲、乙、丙三家医院院内感染率总的来讲有差别。甲、乙、丙三家医院院内感染率总的来讲有差别。 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析63 例例10-13 10-13 某研究者欲了解白内障发病是否与某研究者欲了解白内障发病是否与ABOABO血血 型有关,收集有关资料见表型有关,收集有关资料见表10-1110-11,问白内障组与,问白内障组与 对照组对照组ABOABO血型分布
36、有无差别?血型分布有无差别? 分类变量资料统计分析7版) 第十章 分类变量资料的统计分析64 H0 :白内障组与对照组:白内障组与对照组ABO血型分布相同血型分布相同 H1 :白内障组与对照组白内障组与对照组ABO血型分布不同或不全相同血型分布不同或不全相同 查表得,查表得, 2 2( (3 3), , 2 2 P0.05, 0.05, 按按 的检验水准,的检验水准, 不拒绝检验假设,尚不能认为白内障组与对照组不拒绝检验假设,尚不能认为白内障组与对照组ABOABO血血 型分布不同。型分布不同。 (1) (2) (3) 25. 31 2 2 CRn n A n =(2-1)(4-1)=3 分类变
37、量资料统计分析7版) 第十章 分类变量资料的统计分析65 理论数不宜太小。(不能有理论数不宜太小。(不能有1/51/5以上格子的理论频数小于以上格子的理论频数小于5 5 或者有一个格子的理论频数小于或者有一个格子的理论频数小于1 1)。处理方法)。处理方法 如假设检验的结果是拒绝无效假设,只能认为各总体率或如假设检验的结果是拒绝无效假设,只能认为各总体率或 构成比之间总的来说有差别。若要进一步了解哪两者之间构成比之间总的来说有差别。若要进一步了解哪两者之间 有差别,可用卡方分割法,或者调整检验水准。有差别,可用卡方分割法,或者调整检验水准。 对于单向有序行列表,在比较各处理组的效应有无差别时,对于单向有序行列表,在比较各处理组的效应有无差别时, 应该用秩和检验。应该用秩和检验。 行行列表卡方检验的注意事项:列表卡方检验的注意事项: 分类变量资料统计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2025学年北京版小学六年级上学期期末数学试题及答案指导
- 智能化施工方案全套完整
- 数字经济对城乡融合发展的空间效应分析
- 天然气管线施工安全管理方案
- 幼儿园师德评估与激励方案
- 酒店厨房食品安全保障方案
- 2024店面装饰装修合同协议范本
- 高频电路课程设计题
- 陕西皮影课程设计
- 阿视频课程设计
- GB∕T 33609-2017 软质泡沫聚合材料 滞后损失试验方法
- 【人才评估】如何绘制人才画像
- 中国历史朝代歌(课堂PPT)
- 199管理类联考综合写作答题纸完美版
- 二年级单脚起跳双脚落地
- 三方战略合作框架协议-中英文Co-operation-Agreement
- 志愿者应急事件处理(课堂PPT)
- 三相异步电动机正反转控制线路教学设计
- 旅行社派团单
- 拼音aoe四声(课堂PPT)
- 岭南新天地调研报告
评论
0/150
提交评论