【学习课件】第四讲分类变量的统计描述率的标准误_第1页
【学习课件】第四讲分类变量的统计描述率的标准误_第2页
【学习课件】第四讲分类变量的统计描述率的标准误_第3页
【学习课件】第四讲分类变量的统计描述率的标准误_第4页
【学习课件】第四讲分类变量的统计描述率的标准误_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、7/29/20221第四讲 分类变量的统计描述周 虹 公共卫生学院妇女与儿童青少年卫生学系精选课件7/29/20222基本内容 统计描述统计推断(1)统计推断(2)数值变量 频数分布集中趋势离散趋势统计图表抽样误差标准误均数可信区间t Z F检验秩和检验直线相关与回归偏相关多元线性回归因子分析分类变量相对数(率、比)率的可信区间2检验Logistic回归精选课件主要内容一、分类变量概述二、分类变量的统计描述相对数应用相对数的注意事项动态数列率的标准化三、分类变量的统计推断率的标准误和可信区间2检验精选课件分类变量定义通过确定每个观察单位的某项特征的性质或类别得到的数据。请大家举出研究中熟悉的分

2、类变量的例子:特点变量值是定性的没有度量衡单位第一节、分类变量概述精选课件类型无序分类变量:二项分类变量、多项分类变量有序分类变量统计分析中的处理赋值数据转换SPSS程序:Transform Recode Into different variables1=“男性”,2=“女性”出生体重(数值变量) 低出生体重、正常出生体重、巨大儿 精选课件练习SPSS中变量转换操作:(出生体重-率.sav数据库) 将出生体重从数值变量变成分类变量(低出生体重、正常出生体重、巨大儿) 精选课件7/29/20227第二节分类变量的统计描述一、常用相对数二、应用相对数的注意事项三、动态数列四、率的标准化 精选课件

3、7/29/20228为什么引入相对数?2008年甲县心脑血管疾病死亡人数253人,乙县为132人,能否说甲县心脑血管疾病的威胁比乙县严重?精选课件7/29/202292. 在某遗传病的研究中,研究人员发现该病患者中,有90%是第一个孩子,由此可见该病的遗传与出生顺序有关-更容易遗传给第一个孩子。这个结论是否正确,为什么?精选课件7/29/202210 绝对数:实际观察得到的数据,反映真实情况。 相对数:两个有联系的指标(数值)之比,用于比较。精选课件7/29/202211相对数的种类: 1.率 2.构成比 3.相对比重要区别:分子、分母 一、常用相对数精选课件7/29/2022121. 率概念

4、:是指某种现象在一定条件下,实际发生的观察单位数与可能发生该现象的总观察单位数之比,用以说明某种现象发生的频率大小或强度。计算公式: 如何选K?使算得的率至少保留12位整数 习惯:IMR ,MMR/10万注意:不受其它指标的影响;各率相互独立,求和不一定为1(如是则属巧合)。精选课件7/29/202213常用的频率/类频率指标:精选课件7/29/202214精选课件7/29/202215精选课件7/29/202216病名平均人口数死亡人数死亡率(1/10万)高血压172665 40 23.2冠心病172665 11 6.4脑卒中172665253146.5风心病172665 38 22.0例:

5、某地2007年四种常见心血管病死亡率精选课件7/29/2022172.构成比概念:也叫构成指标,是指一事物内部某一组成部分的观察单位数与该事物各组成部分的观察单位总数之比,用以说明某一事物内部各组成部分所占的比重或分布。计算公式:注意:各组成部分的构成比之和为100%; 某一部分比重增大,则其它部分相应减少。制图:一般用圆图(饼图)或百分条图精选课件7/29/202218人数%甲区20050.0乙区12030.0丙区8020.0合计400100.0人数%甲区30060.0乙区12024.0丙区8016.0合计500100.0例:某市某病患者的地区构成精选课件7/29/202219 2002年全

6、国各地城市农村计划生育手术构成(%) 城市农村27%46%12%13%2%精选课件7/29/202220精选课件练习:放环情况放环人数失败人数失败人数构成比 ( ?)失败率( ?)人工流产后25476月经后8840哺乳期1710合计359126率及构成比的差别?已婚妇女不同情况下放环失败比较精选课件7/29/2022223.相 对 比概念:是指两个有关联的指标之比,是对比的最简单形式。计算公式:A/B(或100%) 表示A是B的若干倍或百分之几。例如:BMI、性别比、CV等。注意:1. A、B可以是性质相同的,也可以是性质不同的 2. A、B可以是绝对数,也可以是相对数或平均数精选课件Coun

7、try (2010 )Sex Ratio Africa: Uganda 96.5 Zimbabwe 95.4North A. USA 95.1South A.: Argentina 95.6Asia: China 106.5 India 107.9Bangladesh 106.1 South Korea 100.7Europe: France 94.8 U.K. 93.9 Sweden 97.6部分国家人口性别比精选课件年代调查活产数出生性别比资料来源70(1972-1979年)33915105.22生育率调查(国家计生委)80(1980-1987年)32114109.92生育率调查(国家计生

8、委)80(1980-1989年)26268110.92001年全国计划生育/生殖健康调查(国家计生委)90(1990-2001年)23103124.12001年全国计划生育/生殖健康调查(国家计生委) 2000(1999.112000.10出生)11752119.4第五次全国人口普查0.95抽样中国历年报告的出生性别比1996-20051272006年全国生殖健康调查精选课件7/29/202225例1.在某遗传病的研究中,研究人员发现该病患者中,有90%是第一个孩子,由此可见该病的遗传与出生顺序有关-更容易遗传给第一个孩子。这个结论是否正确,为什么? 以(构成)比代替率的错误实例分析精选课件7

9、/29/202226例2.某项目县为提高医疗卫生的服务水平,对卫生人员进行培训,但是,经过3年培训,与培训前相比,该县孕产妇的死亡率却上升,如何解释?培训前(2001年):2000名孕产妇死亡2人,100/10万 培训后(2004年):2010名孕产妇死亡3人,149/10万计算率时分母不能太小精选课件7/29/202227例3. 在对肺癌病人的死亡情况进行分析时发现:北医三院肺癌病人的死亡率为65%, 密云县医院为25%,请问哪家医院的治疗水平高?两个资料要有可比性精选课件7/29/202228区名平均人口数新发病例数发病率(%)甲区100000 2000020乙区 80000 120001

10、5丙区 40000650016.25合计22000038500? 例4.某市2007年各区流感的发病率请问:全市流感的发病率?总率的计算不能是各分率的直接相加精选课件7/29/202229二、应用相对数时的注意事项分析时不能以(构成)比代(替)率计算相对数时分母不能太小资料的可比性:两个率要在相同的条件下进行(标准化问题)总率(平均率)的计算:不能直接相加求和样本相对数的比较应做假设检验:样本相对数存在抽样误差,应进行差别的显著性检验.精选课件 按照一定的时间顺序,将一系列描述某事物的统计指标依次排列起来,以便观察和比较该事物在时间上的变化和发展趋势。 这些统计指标可以是绝对数、相对数或平均数

11、等。 动态数列分析是建立在相对比基础上的,采用定基比和环比两种方式。 常用的分析指标有:绝对增长量、发展速度与增长速度、平均发展速度和平均增长速度。三、动态数列精选课件某大学19922002年本科专业招生动态变化年份符号学生人数绝对增长量发展速度()增长速度()累计逐年定基比环比定基比环比(1)(2)(3)(4)(5)(6)(7)(8)(9)1992a04200-100.0100.0-1993a14500 300300107.1107.1 7.17.11994a24800 600300114.3106.714.36.71995a34900 700100116.7102.116.72.11996

12、a45150 950250122.6105.122.65.11997a553201120170126.7103.326.73.31998a655101310190131.2103.631.23.61999a757801580270137.6104.937.64.92000a859501750170141.7102.941.72.92001a960001800 50142.9100.842.90.82002a1062002000200147.6103.347.63.3精选课件绝对增长量 说明事物在一定时期增长的绝对值。累计增长量:报告年的指标与某一固定年(基期水平)指标之差。逐年增长量:报告年的

13、指标与前一年指标之差。精选课件发展速度与增长速度 定基发展速度:报告期指标的水平相当于基期水平的百分比或倍数。 定基增长速度:相对于基期水平,报告期指标净增加的百分比或倍数。精选课件环比发展速度:报告期指标的水平相当于上一期水平的百分比或倍数。 环比增长速度:报告期指标比上一期水平净增加的百分比或倍数。描述时一定要说清楚比较的基数,以区分定基还是环比速度。34精选课件平均发展速度和平均增长速度平均发展速度:某事物在一个较长时期内逐年平均发展变化的速度。 是环比速度的几何平均数。平均增长速度:某事物在一个较长时期内逐年平均增长的速度。 平均增长速度平均发展速度1精选课件率及构成比计算的SPSS程

14、序:相对比计算的SPSS程序:Analyze Descriptive Statistics Frequencies 选分析变量入Variable(s)框 OKTransform Compute Target Variable(新变量名) Numeric Expression(计算方式) OK精选课件SPSS练习(出生体重-率的计算数据库)某年儿童体检指标中,男孩占体检儿童的比例?体检儿童的母亲职业分布情况?体检儿童中,低出生体重的发生率是多少?(出生体重低于2500克为低出生体重)体检儿童中,出生BMI是多少?精选课件7/29/202238四、率的标准化(standardization)条件:

15、内部构成影响总率;要比较的两组的内部构成不相同;比较两组的总率。方法: 直接法(适用于已知两组的内部构成) 间接法(略)精选课件步骤:选定标准构成在比较的资料中任选一组资料的内部构成作为标准构成;两组资料各部分之和组成的构成作为标准构成;选择有代表性的、较固定的、数量较大的人群。2. 计算预期发生数3. 求标准化率精选课件7/29/202240例:甲乙两厂同工种工人某病的患病率见下表。某领导因发现乙厂的总患病率高于甲厂而认为乙厂的患病情况严重,并批评了乙厂,但是乙厂不服气。请你帮助解释说明真实情况。精选课件7/29/202241甲 厂乙 厂工 龄(年)人数患病人数患病率(%)人数患病人数患病率

16、(%) 3400123.010022.031001818.0400 4010.0合计500306.0500428.4甲乙两厂同工种工人某病的患病率精选课件7/29/202242直接法计算甲乙两厂的标准化患病率(%)甲厂标准化患病率 = 105/1000 = 10.5%乙厂标准化患病率 = 60/1000 = 6.0%工 龄(年)标准人口数甲 厂乙 厂原患病率(%)预期患病人数原患病率(%)预期患病人数35003.0152.010350018.09010.050合计1000 6.0 105 8.4 60可见,乙厂的患病率低于甲厂,与分工龄组比较的结论一致,消除了工龄构成不同的影响。精选课件7/2

17、9/202243注意事项:(1)标化率不能反映实际水平,只能用于比较;(2)选用标准不同,标化率会改变,但比较结果只有一个,不能改变;(3)比较两样本的标化率,也要进行假设检验。精选课件7/29/202244基本内容 统计描述统计推断(1)统计推断(2)计量资料 频数分布集中趋势离散趋势统计图表抽样误差标准误均数可信区间t Z F检验秩和检验直线相关与回归偏相关多元线性回归因子分析计数资料相对数(率、比)率的可信区间2检验Logistic回归精选课件7/29/202245第三节分类变量的统计推断一、率的标准误和可信区间 二、 2检验 (一)成组设计四格表资料的2检验 (二)配对设计四格表资料的

18、2检验 (三)行x列表x2检验 (四)趋势x2检验精选课件7/29/202246一、率的标准误和可信区间样本率p,总体率抽样误差产生的原因、概念1、率的标准误精选课件7/29/202247x率的标准误P1P2P3Pip精选课件 =0.5时,不同n值对应的二项分布 =0.3时, 不同n值对应的二项分布在医学领域中,有一些随机事件是只具有两种互斥结果的离散型随机事件,称为二项分类变量 二项分布的图形现状取决于n和的取值。随n增大,图形逐渐对称分布精选课件7/29/202249率的标准误计算公式:与样本量的关系:成反比。精选课件7/29/202250例:某市为了解已婚育龄妇女子宫颈糜烂的患病情况,进行了抽样调查,随机抽取2000人,患者80例。试求此患病率的标准误。精选课件点估计: 不考虑抽样误差的大小,将样本率直接作为总体率的估计值。区间估计2、总体率的区间估计51精选课件总体率的可信区间小样本(n50)时,可直接查“百分率的可信区间表”,即可得到总体率的1-可信区间。样本量不太小,总体率既不太小,也不太大,比如np与n(1-p)均大于5时,样本率p的抽样分布近似正态分布。此时总体率的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论