第四讲分类变量的统计描述率的标准误演示文稿_第1页
第四讲分类变量的统计描述率的标准误演示文稿_第2页
第四讲分类变量的统计描述率的标准误演示文稿_第3页
第四讲分类变量的统计描述率的标准误演示文稿_第4页
第四讲分类变量的统计描述率的标准误演示文稿_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四讲分类变量的统计描述率的标准误演示文稿当前第1页\共有58页\编于星期五\11点(优选)第四讲分类变量的统计描述率的标准误当前第2页\共有58页\编于星期五\11点6/17/20233基本内容

统计描述统计推断(1)统计推断(2)数值变量频数分布集中趋势离散趋势统计图表抽样误差标准误均数可信区间tZF检验秩和检验直线相关与回归偏相关多元线性回归因子分析分类变量相对数(率、比)率的可信区间2检验Logistic回归当前第3页\共有58页\编于星期五\11点主要内容一、分类变量概述二、分类变量的统计描述相对数应用相对数的注意事项动态数列率的标准化三、分类变量的统计推断率的标准误和可信区间2检验当前第4页\共有58页\编于星期五\11点分类变量定义通过确定每个观察单位的某项特征的性质或类别得到的数据。请大家举出研究中熟悉的分类变量的例子:特点变量值是定性的没有度量衡单位第一节、分类变量概述当前第5页\共有58页\编于星期五\11点类型无序分类变量:二项分类变量、多项分类变量有序分类变量统计分析中的处理赋值数据转换SPSS程序:TransformRecodeIntodifferentvariables1=“男性”,2=“女性”出生体重(数值变量)低出生体重、正常出生体重、巨大儿当前第6页\共有58页\编于星期五\11点练习SPSS中变量转换操作:(出生体重-率.sav数据库)将出生体重从数值变量变成分类变量(低出生体重、正常出生体重、巨大儿)当前第7页\共有58页\编于星期五\11点6/17/20238第二节分类变量的统计描述一、常用相对数二、应用相对数的注意事项三、动态数列四、率的标准化

当前第8页\共有58页\编于星期五\11点6/17/20239为什么引入相对数?2008年甲县心脑血管疾病死亡人数253人,乙县为132人,能否说甲县心脑血管疾病的威胁比乙县严重?当前第9页\共有58页\编于星期五\11点6/17/2023102.在某遗传病的研究中,研究人员发现该病患者中,有90%是第一个孩子,由此可见该病的遗传与出生顺序有关---更容易遗传给第一个孩子。这个结论是否正确,为什么?当前第10页\共有58页\编于星期五\11点6/17/202311

绝对数:实际观察得到的数据,反映真实情况。

相对数:两个有联系的指标(数值)之比,用于比较。当前第11页\共有58页\编于星期五\11点6/17/202312相对数的种类:

1.率

2.构成比

3.相对比重要区别:分子、分母

一、常用相对数当前第12页\共有58页\编于星期五\11点6/17/2023131.率概念:是指某种现象在一定条件下,实际发生的观察单位数与可能发生该现象的总观察单位数之比,用以说明某种现象发生的频率大小或强度。计算公式:如何选K?①使算得的率至少保留1~2位整数②习惯:IMR——‰,MMR——/10万注意:不受其它指标的影响;各率相互独立,求和不一定为1(如是则属巧合)。当前第13页\共有58页\编于星期五\11点6/17/202314常用的频率/类频率指标:当前第14页\共有58页\编于星期五\11点6/17/202315当前第15页\共有58页\编于星期五\11点6/17/202316当前第16页\共有58页\编于星期五\11点6/17/202317病名平均人口数死亡人数死亡率(1/10万)高血压1726654023.2冠心病172665116.4脑卒中172665253146.5风心病1726653822.0例:某地2007年四种常见心血管病死亡率当前第17页\共有58页\编于星期五\11点6/17/2023182.构成比概念:也叫构成指标,是指一事物内部某一组成部分的观察单位数与该事物各组成部分的观察单位总数之比,用以说明某一事物内部各组成部分所占的比重或分布。计算公式:注意:各组成部分的构成比之和为100%;

某一部分比重增大,则其它部分相应减少。制图:一般用圆图(饼图)或百分条图当前第18页\共有58页\编于星期五\11点6/17/202319人数%甲区20050.0乙区12030.0丙区8020.0合计400100.0人数%甲区30060.0乙区12024.0丙区8016.0合计500100.0例:某市某病患者的地区构成当前第19页\共有58页\编于星期五\11点6/17/2023202002年全国各地城市农村计划生育手术构成(%)

城市农村27%46%12%13%2%当前第20页\共有58页\编于星期五\11点6/17/202321当前第21页\共有58页\编于星期五\11点练习:放环情况放环人数失败人数失败人数构成比(?)失败率(?)人工流产后25476月经后8840哺乳期1710合计359126率及构成比的差别?已婚妇女不同情况下放环失败比较当前第22页\共有58页\编于星期五\11点6/17/2023233.相对比概念:是指两个有关联的指标之比,是对比的最简单形式。计算公式:A/B(或100%)

表示A是B的若干倍或百分之几。例如:BMI、性别比、CV等。注意:1.A、B可以是性质相同的,也可以是性质不同的

2.A、B可以是绝对数,也可以是相对数或平均数当前第23页\共有58页\编于星期五\11点Country(2010)SexRatioAfrica:Uganda96.5Zimbabwe95.4NorthA.USA95.1SouthA.:Argentina95.6Asia:China106.5India107.9Bangladesh106.1SouthKorea100.7Europe:France94.8U.K.93.9Sweden97.6部分国家人口性别比当前第24页\共有58页\编于星期五\11点年代调查活产数出生性别比资料来源70(1972-1979年)33915105.22‰生育率调查(国家计生委)80(1980-1987年)32114109.92‰生育率调查(国家计生委)80(1980-1989年)26268110.92001年全国计划生育/生殖健康调查(国家计生委)90(1990-2001年)23103124.12001年全国计划生育/生殖健康调查(国家计生委)2000(1999.11-2000.10出生)11752119.4第五次全国人口普查0.95‰抽样中国历年报告的出生性别比1996-20051272006年全国生殖健康调查当前第25页\共有58页\编于星期五\11点6/17/202326例1.在某遗传病的研究中,研究人员发现该病患者中,有90%是第一个孩子,由此可见该病的遗传与出生顺序有关---更容易遗传给第一个孩子。这个结论是否正确,为什么?

以(构成)比代替率的错误实例分析当前第26页\共有58页\编于星期五\11点6/17/202327例2.某项目县为提高医疗卫生的服务水平,对卫生人员进行培训,但是,经过3年培训,与培训前相比,该县孕产妇的死亡率却上升,如何解释?培训前(2001年):2000名孕产妇死亡2人,100/10万培训后(2004年):2010名孕产妇死亡3人,149/10万计算率时分母不能太小当前第27页\共有58页\编于星期五\11点6/17/202328例3.在对肺癌病人的死亡情况进行分析时发现:北医三院肺癌病人的死亡率为65%,密云县医院为25%,请问哪家医院的治疗水平高?两个资料要有可比性当前第28页\共有58页\编于星期五\11点6/17/202329区名平均人口数新发病例数发病率(%)甲区1000002000020乙区800001200015丙区40000650016.25合计22000038500?例4.某市2007年各区流感的发病率

请问:全市流感的发病率?总率的计算不能是各分率的直接相加当前第29页\共有58页\编于星期五\11点6/17/202330二、应用相对数时的注意事项分析时不能以(构成)比代(替)率计算相对数时分母不能太小资料的可比性:两个率要在相同的条件下进行(标准化问题)总率(平均率)的计算:不能直接相加求和样本相对数的比较应做假设检验:样本相对数存在抽样误差,应进行差别的显著性检验.当前第30页\共有58页\编于星期五\11点按照一定的时间顺序,将一系列描述某事物的统计指标依次排列起来,以便观察和比较该事物在时间上的变化和发展趋势。这些统计指标可以是绝对数、相对数或平均数等。动态数列分析是建立在相对比基础上的,采用定基比和环比两种方式。常用的分析指标有:绝对增长量、发展速度与增长速度、平均发展速度和平均增长速度。三、动态数列当前第31页\共有58页\编于星期五\11点某大学1992~2002年本科专业招生动态变化年份符号学生人数绝对增长量发展速度(%)增长速度(%)累计逐年定基比环比定基比环比(1)(2)(3)(4)(5)(6)(7)(8)(9)1992a04200----100.0100.0----1993a14500

300300107.1107.1

7.17.11994a24800

600300114.3106.714.36.71995a34900

700100116.7102.116.72.11996a45150

950250122.6105.122.65.11997a553201120170126.7103.326.73.31998a655101310190131.2103.631.23.61999a757801580270137.6104.937.64.92000a859501750170141.7102.941.72.92001a960001800

50142.9100.842.90.82002a1062002000200147.6103.347.63.3当前第32页\共有58页\编于星期五\11点绝对增长量说明事物在一定时期增长的绝对值。累计增长量:报告年的指标与某一固定年(基期水平)指标之差。逐年增长量:报告年的指标与前一年指标之差。当前第33页\共有58页\编于星期五\11点发展速度与增长速度定基发展速度:报告期指标的水平相当于基期水平的百分比或倍数。定基增长速度:相对于基期水平,报告期指标净增加的百分比或倍数。当前第34页\共有58页\编于星期五\11点35环比发展速度:报告期指标的水平相当于上一期水平的百分比或倍数。环比增长速度:报告期指标比上一期水平净增加的百分比或倍数。描述时一定要说清楚比较的基数,以区分定基还是环比速度。当前第35页\共有58页\编于星期五\11点平均发展速度和平均增长速度平均发展速度:某事物在一个较长时期内逐年平均发展变化的速度。是环比速度的几何平均数。平均增长速度:某事物在一个较长时期内逐年平均增长的速度。平均增长速度=平均发展速度-1当前第36页\共有58页\编于星期五\11点率及构成比计算的SPSS程序:相对比计算的SPSS程序:AnalyzeDescriptiveStatisticsFrequencies选分析变量入Variable(s)框OKTransformComputeTargetVariable(新变量名)

NumericExpression(计算方式)

OK当前第37页\共有58页\编于星期五\11点SPSS练习

(出生体重-率的计算数据库)某年儿童体检指标中,男孩占体检儿童的比例?体检儿童的母亲职业分布情况?体检儿童中,低出生体重的发生率是多少?(出生体重低于2500克为低出生体重)体检儿童中,出生BMI是多少?当前第38页\共有58页\编于星期五\11点6/17/202339四、率的标准化(standardization)条件:内部构成影响总率;要比较的两组的内部构成不相同;比较两组的总率。方法:

直接法(适用于已知两组的内部构成)间接法(略)当前第39页\共有58页\编于星期五\11点步骤:选定标准构成在比较的资料中任选一组资料的内部构成作为标准构成;两组资料各部分之和组成的构成作为标准构成;选择有代表性的、较固定的、数量较大的人群。2.计算预期发生数3.求标准化率当前第40页\共有58页\编于星期五\11点6/17/202341例:甲乙两厂同工种工人某病的患病率见下表。某领导因发现乙厂的总患病率高于甲厂而认为乙厂的患病情况严重,并批评了乙厂,但是乙厂不服气。请你帮助解释说明真实情况。当前第41页\共有58页\编于星期五\11点6/17/202342甲厂乙厂工龄(年)人数患病人数患病率(%)人数患病人数患病率(%)<3400123.010022.0≥31001818.04004010.0合计500306.0500428.4甲乙两厂同工种工人某病的患病率当前第42页\共有58页\编于星期五\11点6/17/202343直接法计算甲乙两厂的标准化患病率(%)甲厂标准化患病率=105/1000=10.5%乙厂标准化患病率=60/1000=6.0%工龄(年)标准人口数甲厂乙厂原患病率(%)预期患病人数原患病率(%)预期患病人数<35003.0152.010≥350018.09010.050合计10006.01058.460可见,乙厂的患病率低于甲厂,与分工龄组比较的结论一致,消除了工龄构成不同的影响。当前第43页\共有58页\编于星期五\11点6/17/202344注意事项:(1)标化率不能反映实际水平,只能用于比较;(2)选用标准不同,标化率会改变,但比较结果只有一个,不能改变;(3)比较两样本的标化率,也要进行假设检验。当前第44页\共有58页\编于星期五\11点6/17/202345基本内容

统计描述统计推断(1)统计推断(2)计量资料频数分布集中趋势离散趋势统计图表抽样误差标准误均数可信区间tZF检验秩和检验直线相关与回归偏相关多元线性回归因子分析计数资料相对数(率、比)率的可信区间2检验Logistic回归当前第45页\共有58页\编于星期五\11点6/17/202346第三节分类变量的统计推断一、率的标准误和可信区间

二、2检验

(一)成组设计四格表资料的χ2检验

(二)配对设计四格表资料的2检验

(三)行x列表x2检验

(四)趋势x2检验当前第46页\共有58页\编于星期五\11点6/17/202347一、率的标准误和可信区间样本率p,总体率抽样误差产生的原因、概念1、率的标准误当前第47页\共有58页\编于星期五\11点6/17/202348x率的标准误P1P2P3…Piσp当前第48页\共有58页\编于星期五\11点

π=0.5时,不同n值对应的二项分布

π=0.3时,不同n值对应的二项分布在医学领域中,有一些随机事件是只具有两种互斥结果的离散型随机事件,称为二项分类变量二项分布的图形现状取决于n和的取值。随n增大,图形逐渐对称分布当前第49页\共有58页\编于星期五\11点6/17/202350率的标准误计算公式:与样本量的关系:成反比。当前第50页\共有58页\编于星期五\11点6/17/202351例:某市为了解已婚育龄妇女子宫颈糜烂的患病情况,进行了抽样调查,随机抽取2000人,患者80例。试求此患病率的标准误。当前第51页\共有58页\编于星期五\11点52点估计:不考虑抽样误差的大小,将样本率直接作为总体率的估计值。区间估

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论