版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、分类变量资料的统计分析统计推断u检验、 检验参数估计假设检验:频数分布集中趋势指标离散趋势指标医学参考值范围估计数值变量资料的统计分析统计描述统计推断u 检验t 检验方差分析统计描述 相对数参数估计假设检验第十六章 分类变量的统计分析第1-3节 统计描述刘颖 预防医学教研室掌握: 常用相对数指标的意义、计算方法和注意事项; 率的标准误和总体率可信区间的估计方法及意义; u 检验和 检验的适用条件和计算方法。熟悉: 率的标准化的意义和计算方法1常用相对数2应用相对数的注意事项3率的标准化第一节 常用相对数绝对数(absolute number)分类变量资料整理后所得到的数据。相对数(relati
2、ve number)分类变量资料的统计描述指标。甲地麻疹发病率 = 240 / 2000 = 12%乙地麻疹发病率 = 200 / 1000 = 20%发病人数易感儿童甲地 240 2000乙地 200 1000例2常用相对数 1. 率(rate)又称频率指标或强度指标; 说明某现象发生的频率或强度; 常以 %、1 / 万、1 / 10万等表示。可能发生某现象的单位总数发生某现象的观察单位数率=比例基数2. 构成比 (constituent ratio) 又称构成指标或结构指标,说明某一事物内部各组成部分的比重或分布,常以百分数表示。某一组成部分的观察单位数同一事物各组成部分的观察单位数构成比
3、=100%表16.1 2000年某医院某病住院与死亡人数病情严重程度 住院人数 病死数 死亡构成(%) 病死率(%) 轻 300 12 26.7 4.0 中 350 18 40.0 5.1 重 150 15 33.3 10.0 合计 800 45 100.0 5.6构成比的特点 各构成部分的构成比总和为100% ; 某一部分所占比重的增减,会相应地影响其他部分,各构成比之间是相互制约的 。 例5 2000 年我国第五次人口普查结果,男 65355 万人,女子 61228 万人,试计算人口男女性别比。6535561228性别比 = = 1.067例6 某市乙型脑炎的发病率 1990 年为 4.4
4、8/10 万,2000 年为 0.88 / 10 万,试计算相对比。 相对比 = 4.48 / 0.88 = 5.1(倍) 相对比 = 0.88 / 4.48100% = 19.64% 计算相对数时分母不宜过小,即观察单位数应足够多。 分析时构成比和率不能混淆(见表16-1)构成比说明事物内部各组成部分的比重或分布; 率说明现象发生的频率或强度。第二节 应用相对数的注意事项表16.1 2000年某医院某病住院与死亡人数病情严重程度 住院人数 病死数 死亡构成(%) 病死率(%) 轻 300 12 26.7 4.0 中 350 18 40.0 5.1 重 150 15 33.3 10.0 合计
5、800 45 100.0 5.6 相对数的比较应注意可比性 观察对象同质、研究方法相同、观察时间相等,以及客观条件一致; 资料内部构成是否相同。 率的标准化 要考虑存在抽样误差 率或构成比的比较应做假设检验第三节 率的标准化法 率的标准化法(standardization)在一个指定的标准构成条件下进行率的对比的方法。 实际工作中,对两个或多个频率指标进行比较时,若各组对象内部构成存在差异,且差异又影响分析结果,应该用率的标准化法进行比较。表16.2 甲、乙两医院的治愈率 科别 住院人数 治愈人数 治愈率(%) 甲医院 乙医院 甲医院 乙医院 甲医院 乙医院 内科 1500 500 975 3
6、15 65.0 63.0 外科 500 1500 470 1365 94.0 91.0传染病科 500 500 475 460 95.0 92.0 合计 2500 2500 1920 2140 76.8 85.6(2)计算甲、乙两医院各型传染病病人的预期治愈人数:各型病人标准人口数分别乘以相应的原治愈率;(3)计算甲、乙两医院传染病的标准化治愈率:各型病人预期治愈人数相加除以标准总人数。表16.3 标准人口数计算甲、乙两医院标准化治愈率(直接法) 科别 标准人 原治愈率(%) 预期治愈人数 口数 甲医院 乙医院 甲医院 乙医院 内科 2000 65.0 63.0 1300 1260 外科 20
7、00 94.0 91.0 1880 1820传染病科 1000 95.0 92.0 950 920合计 5000 76.8 85.6 4130 4000乙医院标化治愈率=乙医院预期治愈人数之和/标准组总人数 =4000/5000*100%=80%表16.4 标准人口构成比计算甲、乙两医院标准化治愈率 科别 标准人口 原治愈率(%) 预期治愈率 构成比 甲医院 乙医院 甲医院 乙医院 内科 0.4 65.0 63.0 26.0 25.2 外科 0.4 94.0 91.0 37.6 36.4传染病科 0.2 95.0 92.0 19.0 18.4合计 1.0 76.8 85.6 82.6 80.0
8、应用标准化法时的注意事项 当各比较组内部构成不同,并足以影响总率的比较时,应对率进行标准化后再作比较; 率的标准化的目的是消除混杂因素影响,使其具可比性; 各年龄组对应的率出现明显交叉时,宜分别比较各年龄组死亡率,而不用标准化进行比较; 如是抽样研究,两样本标准化率的比较应作假设检验。 标准化率已不能反映率的实际水平,它 只能表明相互比较资料间的相对水平; 选定的标准构成不同,所得的标准化率 也不同,仅限于采用共同标准构成的组 间比较。统 计推 断统 计描 述统计分析第十六章 分类变量的统计分析第4-6节 统计推断刘 颖预防医学教研室1率的抽样误差和总体率的估计2率的 u 检验3 检验一、率的
9、抽样误差和标准误 率的抽样误差的大小用率的标准误表示。第四节率的抽样误差和总体率的估计例16.5 欲了解某种新药对慢性乙型肝炎的疗效,对100名患者进行治疗,其中90人有效,试计算其标准误。一、正态近似法适用条件:np 和 n(1-p) 5 时,可根据近似正态分布 的原理估计其可信区间。例16.5 试求该新药有效率的95%可信区间?二、总体率的可信区间估计二、查表法 适用条件:n 50 ,特别是 p 接近 0 或 1 时,此时资料呈二项分布,可按二项分布的原理估计总体率的可信区间。一、样本率与总体率比较的u 检验目的:推断样本率与总体率的差异是否仅由抽样所 致,其差异是否有统计学意义。总体率:
10、一般是理论值、标准值或是经过大量观察 所得的稳定值。第五节率的 u 检验其中: 为样本率 为总体率 n 为样本含量例16.7 某地区一般人群中乙型肝炎的阳性率为15%,现对该地区150名流浪者进行检查,其中阳性30人,问当地流浪者的阳性率是否高于一般人群的阳性率? 本例样本率为50%,np 和 n(1-p) 5 时,可认为呈近似正态分布,故可采用 u 检验。检验假设H0 : ,当地流浪者阳性率与一般人群相同H1: ,当地流浪者阳性率高于一般人群单侧 计算 u 值 确定 P 值 ,下结论 u = 1.715 1.645,P 0.05,按a=0.05的检验水准,拒绝H0,接受H1,认为当地流浪者的
11、阳性率高于一般人群。目的:推断两样本率是否来自同一总体。适用条件:样本率符合近似正态分布的条件(n 较大,且 P 和 1-P 不太小,即 np 和 n(1-p)5时),可用率的 u 检验。二、两样本率比较的 u 检验 式中: 、 为样本率,n1、n2为样本例数, X1、X2为阳性例数, 为两样本合并率。例16.8 欲了解从事工农业生产的50岁以上人群高血压的情况,调查了首钢工人1281人,高血压患者386人,患病率为30.13%;石景山区农民387人,高血压患者65人,患病率为16.80%,试问从事工农业生产的50岁以上人群高血压患病率有无差别? 本例两样本的乙肝携带人数均大于5,故可采用样本
12、率的 u 检验。建立检验假设 H0 : H1:计算 u 值 3. 确定 P 值 ,下结论 u = 5.17 1.96,P 0.05,按 a=0.05 的检验水准,拒绝H0,接受H1,从事工业生产和农业生产的50岁以上人群高血压患病率不同。第六节 检验 检验(chi - square test)适用于: 分类变量资料中两个或多个样本的总体率是否相同,两个或多个样本的构成比是否相同,配对资料两种属性间的阳性率是否相等。(一)四格表的 检验基本思想 可用于两样本率的比较 表16-7 四格表 检验的基本结构一、四格表的 检验 处理 发生数 未发生数 合计 A组 a b a + b B组 c d c +
13、 d 合计 a + c b + d n上表中第 R 行、第 C 列的理论频数为:因此: 如果四格表中实际的发生数用 A 来表示,可通过下式计算 值:基本思想:实际频数与理论频数吻合程度。 在检验假设成立的情况下, A 与 T 之差一般不会很大,此时 值也较小;反之, 值较大。 检验的自由度:v = (行数 - 1)(列数 - 1)例16.9 某医生欲比较A、B两种药物治疗老年期抑郁症的效果,将病情相近的60名患者随机分成两组,分别用两种药物进行治疗,结果见表16-6,问两种药物治疗效果是否有差别?(二)四格表的 检验的基本步骤表16-6 A、B两种药物的疗效比较 分组 有效例数(%) 无效例数
14、(%) 合计 A 19(63.33) 11(36.67) 30 B 15(50.00) 15(50.00) 30 合计 34(56.67) 26(43.33) 60建立检验假设 H0 : H1:计算 统计量 计算各理论频数:3. 确定 P 值 ,下结论 v = (行数 - 1)(列数 - 1)= 1 按 v = 1 ,查 界值表, ,故 P0.05,按 a=0.05 的水准,不拒绝H0,说明两种药物治疗效果差异无统计学意义。 (三)四格表的 检验的专用公式(16-13)(16-15)(四)四格表的 检验的应用条件 P326T5 且 n40 时,非连续性校正1T5 且 n40时,连续性校正 T1
15、 或 n 40时,确切概率法(五)四格表的 检验的连续性校正(16-16)(16-17)例16-93. 确定 P 值 ,下结论 v = (行数 - 1)(列数 - 1)= 1 按 v = 1 ,查 界值表, ,故 P0.05,按 a=0.05 的水准,不拒绝H0,说明两种药物治疗老年期抑郁症差异无统计学意义。 例16.10 脑胶质瘤患者43人,28例采用手术、15例采用放疗方法进行治疗(表16-8),试比较两种治疗方法治疗后出现的脑功能损伤发生率有无差异?表16-8 两种疗法治疗患者脑功能损伤率比较治疗方法 有 无 合计 手术 22 6 28 放疗 7 8 15 合计 29 14 43校正 表
16、 16-9 配对22列联表基本结构二、配对四格表 检验 乙属性 + + a b a + b c d c + d 合计 a + c b + d n甲属性合 计计算公式:b + c 40 时,b + c40 时, 应作连续性校正 检验(16-18)(16-19)例16.11 有50份痰液标本,每份分别接种在甲、乙两种培养基中,观察结核杆菌的生长情况,结果如表16-10,试比较两种培养基的效果? 表 16-10 甲、乙两种培养基培养效果比较 乙培养基 + + 27 12 39 3 8 11 合计 30 20 50甲培养基合 计检验假设 H0 :总体B=C,两种培养基阳性率相同 H1:总体BC,两种培
17、养基阳性率不同计算 统计量 分析:由于 b + c = 12 + 3 = 15 40, 可得 v = (行数 - 1)(列数 - 1)= 13. 确定 P 值 ,下结论 P0.05,按 a = 0.05 的水准,拒绝H0,接受H1,可以认为两种培养基的阳性率不同。 三、行列表 检验 当行和 / 或列大于 2 时, 称为行列表,又称为 RC 表。专用公式:式中: n为总例数, A 为每个格子的实际数, nR 、nC分别为某格子实际数 A 对应的行合计和列合计。例16.12 某预防医学研究人员调查了343例离退休老人的生活满意度和家庭关系,结果如表16-11所示,试分析家庭关系类型与老人生活满意度
18、的关系。(一)多个率比较 表 16-11 离退休老人家庭关系与生活满意度家庭关系 满意 不满意 合计 满意率(%) 和睦 174 60 234 74.36 一般 36 57 93 38.71 差 6 10 16 37.50 合计 216 127 343 62.97检验假设 H0 :三种不同家庭关系的老人生活满意度相等 H1:三种不同家庭关系的老人生活满意度不同 或不全相同计算统计量 n=343,且所有T53. 确定 P 值 ,下结论 v = (R-1)(C-1) = (3-1)(2-1) = 2, 查 界值表, ,P0.05,按 a = 0.05 的水准,拒绝H0,接受H1,三种不同家庭关系类
19、型的老人生活满意度不同,家庭和睦老人生活满意率最高。 例16.13 某研究者欲研究汉族、回族和满族居民职业分布情况,从三个民族居民中抽样,分别调查了145、97和99人,调查结果见表16-12。问三个民族职业构成是否不同?(一)多个构成比比较 表 16-12 三个民族居民的职业分布民族 干部 工人 农民 其他 合计 汉族 20 56 62 7 145回族 14 40 32 11 97满族 18 28 45 8 99合计 52 124 139 26 341检验假设 H0 :三个民族职业构成比分布相同 H1:三个民族职业构成比分布不同或不全相同计算统计量 n=341,且所有T53. 确定 P 值
20、,下结论 v = (R-1)(C-1) = (3-1)(4-1) = 6, 查 界值表, ,P0.05,按 a = 0.05 的水准,不拒绝H0,尚不能认为三个民族居民的职业总体构成不同。 行列表 检验的注意事项 RC 表中不宜有1/5的格子小于5, 或者有一个格子的理论频数小于1。 处理方法:增大样本例数; 删除理论数较小的行和列; 将理论数较小的行或列与性质相近的行或列合并。 对于单向有序序列的行列表, 如比较两种药物治疗某病的疗效, 其结果为痊愈、有效 、无效, 用 检验只能比较两种药物疗效的构成情况, 若比较两种药物的疗效是否相同, 则需要用秩和检验。 多个样本率或构成比的 检验,结果
21、为拒绝 H0 时,只能认为各总体率或各总体构成比之间总的来说有差异,但不能说明他们彼此间都有差异,或某两两间有差别。可采用 分割法。基本概念 总体与样本 变量与变量值 参数与统计量 误差 概率复习统计资料的类型 数值变量资料 分类变量资料 变量间的转化统计工作的基本步骤 统计设计 收集资料 整理资料 分析资料统计分析统计描述统计推断资料类型二分类多分类分类变量数值变量有序分类变量无序分类变量分类变量资料的统计分析统计推断u检验、 检验参数估计假设检验:频数分布集中趋势指标离散趋势指标医学参考值范围估计数值变量资料的统计分析统计描述统计推断u检验t检验方差分析统计描述 相对数参数估计假设检验1.
22、总体是由( )组成。 A.部分个体 B.全部对象 C.全部个体 D.同质个体的所有观察值 E.相同的观察指标2.抽样的目的是( )。 A.研究样本统计量 B.由样本统计量推断总体参数 C.研究典型案例 D.研究总体统计量 E.研究特殊个体的特征3.参数是指( ) 。 A.参与个体数 B.总体中研究对象的总和 C.样本的统计指标 D.样本的总和 E.总体的统计指标巩固题4.反映计量资料平均的指标是( )。 A.频数 B.参数 C.百分位数 D.平均数 E.统计量5.表示总体均数的符号是( ) 。 A. B. C.X D. S E. M6.下列指标中,不属于集中趋势指标的是( )。 A.均数 B.
23、中位数 C.百分位数 D.几何均数 E.众数7.一些以老年人为主的慢性病患者,年龄分布的集中位置偏向于年龄大的一侧,称为( )。 A.正偏态分布 B.负偏态分布 C.对数正态分布 D.正态分布 E.对称分布8.下面的变量中,属于分类变量的是 。 A 脉搏 B 血型 C 肺活量 D 红细胞计数 E 血压9.两组呈正态分布的定量资料,均数相差悬殊,若比较离散趋势,最好选用的指标为 。 A 全距 B 四分位数间距 C 方差 D 标准差 E 变异系数10均数与标准差之间的关系是A标准差越小,均数代表性越大 B标准差越小,均数代表性越小C均数越大,标准差越小 D均数越大,标准差越大E标准差越大,均数代表
24、性越大11.以舒张压12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属()资料。 A、计算 B、计数 C、计量 D、等级 E、都对12.描述计量资料的主要统计指标是 :A.平均数 B.相对数 C.t值 D.标准误 E.概率13.测得10名乳腺癌患者化疗后血液尿氮含量(mmol/L)分别为3.43,2.96,4.43,3.03,4.53,5.25,5.64,3.82,4.28,5.25,试问:(1)该资料是总体资料还是样本资料?(2)其总体的同质基础是什么?(3)要表达资料的平均水平,该选用什么统计指标?1.下列指标,属于绝对数的是: 。 A 甲区的
25、急性传染病人数为乙区的1.25倍 B 甲区某年急性传染病的发病率为382/ 10万 C 甲区占某市急性传染病的比重为18% D 某区某男身高为168厘米 E 以上都不是2.男性人口数/女性人口数,这一指标为:A率 B构成比 C相对比 D动态数列 E不是相对数3.构成比 。 A 反映事物发生的强度 B 反映了某一事物内部各部分与全部构成的比重 C 既反映了A也反映了B D 表示两个同类指标之比 E 以上都不是1均数和标准差可全面描述( )资料的特征 。 A 所有分布形式 负偏态分布 正偏态分布 正态分布和近似正态分布 2血清学滴度资料最常计算( )以表示其平均水平。 A均数 B中位数 C几何均数 D全距 E标准差3比较身高与体重两组数据变异大小宜采用( ) A 变异系数 B 方差 C 标准差 D 四分位间距 4两组呈正态分布的数值变量资料,但均数相差悬殊,若比较离散趋势,最好选用的指标为( ) A全距 B四分位数间距 C方差 D标准差 E变异系数5 应用( )指标描述最小组段无下限或最大组段无上限的频数分布。 A 算术均数 B 中位数 C 几何均数 D 全距 E 标准差6 描述一组偏态分布资料的变异度,以( )指标较好。 A 全距 B 标准差 C 变异系数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《基于翻转课堂健身瑜伽微课设计研究》
- 《我国反垄断法豁免制度研究》
- 2024-2030年中国母线槽市场竞争态势及需求趋势预测报告
- 2024-2030年中国橡胶金属减震器行业需求趋势及投资策略分析报告版
- 2024-2030年中国模块化多路船用灭火报警项目可行性研究报告
- 2024-2030年中国植物奶替代品行业竞争态势与营销前景预测报告
- 《快速力量训练联合有氧运动干预对高尿酸血症患者的效果及氧化应激机制研究》
- 2024-2030年中国核电装备制造行业生产模式及投资规划分析报告版
- 2024-2030年中国树脂乳胶行业销售动态与盈利前景预测报告
- 2024-2030年中国枞酸行业需求趋势与盈利前景预测报告
- Java语言程序设计PPT全套完整教学课件
- 小学英语-Mum bug's bag教学设计学情分析教材分析课后反思
- 复盘养猪分析:探寻背后的成功秘诀
- 艺术设计本科专业人才培养方案
- qdslrdashboard应用软件使用说明
- 海康2023综合安防工程师认证试题答案HCA
- 跌倒坠床PDCA循环管理降低住院患者跌倒坠床发生率
- 档案工作管理情况自查表
- WinCCflexible的传送操作HMI设备设置入门
- 三宝屯污水处理厂三期改扩建工程项目环境影响报告
- 大学生创新创业教育智慧树知到答案章节测试2023年湖南铁路科技职业技术学院
评论
0/150
提交评论