医学统计学的基本内容_第1页
医学统计学的基本内容_第2页
医学统计学的基本内容_第3页
医学统计学的基本内容_第4页
医学统计学的基本内容_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1统计学是一门运用概率论和数理统计的基本原理研究数据收集、整理和分析的方法学,医学统计学方法是统计学在医学领域中的应用。第1页/共56页第一页,共57页。2医学统计学的基本概念统计资料的类型医学统计工作的基本步骤统计表与统计图主要内容第2页/共56页第二页,共57页。3第一节医学统计学的基本概念一、同质和变异二、总体与样本三、参数与统计量四、误差五、概率第3页/共56页第三页,共57页。4同质(homogeneity):是指观察单位或观察指标受共同因素制约的部分。变异(variation):是指在同质的基础上个体间的差异。一、同质和变异第4页/共56页第四页,共57页。例1调查2003年长沙市7岁男童的身高和体重同质:2003年、长沙市、7岁男童变异:身高和体重各不相同例2研究某降压药的疗效同质:高血压患者、用某药治疗变异:疗效各不相同第5页/共56页第五页,共57页。6观察单位(observedunit):亦称个体(individual),是统计研究中最基本的单位,可以是一个人,一个样品等。第6页/共56页第六页,共57页。7总体(population):

是指根据研究目的所确定的同质观察单位的全体,更确切地说,是同质的所有观察单位某项观察值的集合。分为有限总体和无限总体两类。二、总体与样本第7页/共56页第七页,共57页。8样本(sample):是指从总体中随机抽取部分观察单位某项指标实测值的集合。

由于直接研究总体通常是不可能的,故一般采用抽样研究。抽样(sampling):从总体中抽取部分个体的过程称为抽样

第8页/共56页第八页,共57页。随机抽样(randomsampling)为了保证样本的可靠性和代表性,需要采用随机的抽样方法(在总体中每个个体具有相同的机会被抽到)。第9页/共56页第九页,共57页。对样本数据进行观察或计算统计指标,目的是推论总体。第10页/共56页第十页,共57页。11参数(parameter):根据总体中全部个体值计算出来的描述总体特征的指标。参数一般用希腊字母表示,如总体均数μ、总体率π等。(一般是未知的,或假设的)统计量(statistic):根据样本中个体值计算出来的描述样本特征的指标。统计量用拉丁字母表示,如样本均数x、样本率p。三、参数与统计量第11页/共56页第十一页,共57页。12误差(error):泛指观测值与真值之差。随机误差:

在随机误差中,最重要的是抽样误差(samplingerror)。抽样误差是抽样引起的样本统计量与总体参数之间的差异。抽样误差有规律可循,样本越大,抽样误差越小。系统误差过失误差四、误差第12页/共56页第十二页,共57页。13概率(probability):是描述某一随机事件发生可能性大小的指标,常用P表示,取值范围0≤P≤1。小概率事件:统计学上把概率P≤0.05的事件称为小概率事件。五、概率医学上常用统计概率:对某一随机现象进行大量观察后得到的百分数,如高血压患病率,乳腺癌术后五年生存率。第13页/共56页第十三页,共57页。14频率频率(frequency):是通过样本研究计算出的。

某药治愈率=治愈70人/总治疗100例病人=0.70概率是理论参数,频率是概率的估计值。当观察例数越来越多时,频率越来越接近概率。第14页/共56页第十四页,共57页。15

在收集医学研究的资料时,首先要根据研究目的确定观察单位,然后对观察单位的某个特征—变量(variable)进行观察或测定。观察结果或测定值称为变量值。第二节统计资料的类型第15页/共56页第十五页,共57页。16一、数值变量二、分类变量三、变量的转化第二节统计资料的类型第16页/共56页第十六页,共57页。17数值变量(numericalvariable):其变量值是用定量方法测得的,变量值有大小之分,一般有度量衡单位。所得的资料称为计量资料。第17页/共56页第十七页,共57页。18分类变量(categoricalvariable):又称定性变量。其变量值是用定性方法得到的,通常将观察单位按某种属性或类别分组,然后汇总各组个数所得到的数值。第18页/共56页第十八页,共57页。191.无序分类变量①二项分类变量②多项分类变量无序分类变量构成的资料称为计数资料。2.有序分类变量有序分类变量构成的资料称为等级资料。第19页/共56页第十九页,共57页。20统计资料的几种类型第20页/共56页第二十页,共57页。住院号年龄身高体重住院天数文化程度职业分娩方式妊娠结局20256552716571.55中学无顺产足月20256532216074.05小学无助产足月20258302515868.06大学管理员顺产足月20225432316169.05中学无剖宫产足月20224662515962.011中学商业剖宫产足月20245352715768.02小学无顺产早产20258342015866.04中学无助产早产20194642415870.53中学无助产足月20257832915457.07中学干部剖宫产足月观察单位observations个体individuals变量variablesQuantitativedata计量资料Qualitativedata计数资料Units;elements等级资料Rankdata第21页/共56页第二十一页,共57页。22不同类型的变量其统计处理方法不同。在实际工作中,根据统计分析的具体要求和研究目的,各种不同的变量间可以互相转化。变量的转化第22页/共56页第二十二页,共57页。三类资料间关系

例:一组2040岁成年人的血压(舒张压)以12kPa(90mmHg)为界分为正常与异常两组,统计每组例数。

<8低血压8正常血压12轻度高血压15中度高血压17重度高血压计量资料等级资料计数资料第23页/共56页第二十三页,共57页。变量的转换:根据研究的需要,可将变量重新编码.1.定量变量测定数据可转换成有序分类变量的数据,或二分类数据。甚至可变换成无序分类变量的数据。如年龄变量的测定值可等级化为有序分类数据。连续变量:(1,2,3,…,87)岁;年龄范围编码0~未满10岁010~未满20岁120~未满45岁245~未满65岁365岁及以上4年龄范围编码0~未满20岁020~未满65岁165岁及以上2年龄范围编码<65岁065岁及以上1第24页/共56页第二十四页,共57页。有序分类资料的编码临床疗效编码无效0好转1显效2治愈32.有序分类可以用数值表示其等级关系。如:无效=0,好转=1,显效=2,治愈=3:3.多分类变量的重新编码职业:工人,农民,商业,学生,职员:多项分类变量的编码职业编码1:计算机输入用编码2:分析用X1X2X3X4工人11000农民20100商业30010学生40001职员50000第25页/共56页第二十五页,共57页。26第三节医学统计工作的基本步骤一、研究设计(researchdesign)二、收集资料(datacollection)三、整理资料(datasorting)四、分析资料(statisticalanalysis)四个步骤是相互联系、不可分割的。第26页/共56页第二十六页,共57页。27统计学在科研活动各个阶段的作用一、医学研究设计(design)专业设计:包括研究目的、意义、创新性、研究对象(纳入标准和排除标准)、研究内容与方法、观察指标的设立、研究进度及预期结果等。2.统计设计:设计模式,样本含量估计,随机抽样方法,实验组与对照组的分组原则,偏倚的控制、统计分析方法,等方面的考虑。第27页/共56页第二十七页,共57页。研究设计是后三个步骤的依据,因此是统计工作中最关键的一步。

要求:严密、周到。临床试验设计:designofclinicaltrial2.实验室研究的实验设计:designofexperiment3.现场调查研究设计:designofsurvey研究样本对其所属的总体要具有代表性及各组之间的可比性。要考虑混杂因素对结果的干扰作用。第28页/共56页第二十八页,共57页。二、资料收集(datacollection):

通过合理可靠的手段或渠道获得研究所需的原始数据。是统计分析的基础。主要来自三方面:统计报表和报告卡:

例如,疫情报表、医院工作报表等是根据国家规定的报告制度,由医疗卫生机构定期逐级上报的统计报表。传染病和职业病发病报告卡、肿瘤发病及死亡报告卡、出生及死亡报告单等。防止漏报。2.日常医疗卫生工作记录例如,门诊病历、住院病历、健康检查记录、卫生监测记录等。要做到登记完整、准确。3.专题调查或实验研究:一般统计报表和医院病历资料的内容都有局限性,不能完全满足研究的要求。为了进行深入的分析,通常需要采用专题调查或实验研究。第29页/共56页第二十九页,共57页。30基本要求:完整,准确,及时。

质量控制:保证统一性、可重复性第30页/共56页第三十页,共57页。三、整理资料(datasorting):是对收集到的原始资料去伪存真、分类汇总的过程。要求:正确表述事物的客观概貌。1.对原始资料进行检查和核对。2.根据研究目的要求,合理分组。

①质量分组:即将观察单位按其属性或类别(如性别、职业、疾病分类、婚姻状况等)归类分组;②数量分组:即将观察单位按数值大小(如年龄大小、血压高低等)分组。两种分组往往结合使用,质量分组基础上数量分组。3.整理与汇总:按分组要求设计整理表,进行手工汇总(划记法或分卡法)或用计算机汇总列表(整理表)。第31页/共56页第三十一页,共57页。四、分析资料(dataanalysis):按设计的要求,根据研究目的和资料的类型,对整理出的基础数据作进一步的计算和统计学处理,并用适当的统计图表表达出来,最后结合专业做出结论。1.描述性统计,2.统计学推断和对比分析,3.相关分析,4.统计模型配合(多因素分析)。统计分析方法要与研究目的及资料类型匹配。有好的原始资料,才有好的统计分析结果。第32页/共56页第三十二页,共57页。33第四节统计表与统计图一、统计表:是将统计分析结果以表格的形 式列出。二、统计图:是用点、线、面等几何图形来 反映统计结果。第33页/共56页第三十三页,共57页。341.统计表的结构2.统计表的种类3.编制统计表应注意的事项一、统计表第34页/共56页第三十四页,共57页。35标题:位于统计表的上方中央,要表达出统计表的主要内容,必要时应注明时间、地点。标目:标目用简单的文字来说明表格内的项目,要有单位。线条:3~4条横线,禁用竖线、斜线。1.统计表的结构

包括标题、标目、线条、数字、备注第35页/共56页第三十五页,共57页。36●数字:表内的数字必须准确无误,用阿拉伯数字表示。同一指标的小数位数要一致,上下要对齐,表内不留空格,数字暂缺或未记录用“…”表示,无数字用“—”表示,数字若是0,则填写0●备注:表中用“*”标出,再在表的下方用文字加以说明。第36页/共56页第三十六页,共57页。表8-1某地城乡小学生蛔虫感染情况结果组别检测人数阳性数阳性率(%)城镇小学生82077018.84乡村小学86*合计22792286812.58标题纵标目横标目数字底线顶线纵标目线合计线*:两组比较P<0.05第37页/共56页第三十七页,共57页。38简单表组合表统计表2.统计表的种类第38页/共56页第三十八页,共57页。39职业甲社区乙社区人数患者数患病率(%)人数患者数患病率(%)工人242078732.9171541023.9科技人员1564652410763623336.6管理人员115543137.356123241.4商业人员94315716.6566559.7农民973030.9195932916.8家政人员725638.7537346.3合计6904213030.95974129321.6表8-2某市不同职业社区居民慢性病患病率第39页/共56页第三十九页,共57页。403.编制统计表应注意的事项⑴重点突出,简单明了。⑵主谓分明,层次清楚。第40页/共56页第四十页,共57页。41改表举例:第41页/共56页第四十一页,共57页。42修改后的统计表如下:第42页/共56页第四十二页,共57页。431.制图的基本要求2.常用统计图形的种类二、统计图第43页/共56页第四十三页,共57页。441.制图的基本要求(1)图形选择(2)标题(位于图下方)(3)纵、横坐标(注明单位,比例一般5:7,7:5)(4)图例(颜色或线条,右上角或图下方)

第44页/共56页第四十四页,共57页。452.常用统计图统计图条图百分条图圆图线图半对数线图散点图直方图第45页/共56页第四十五页,共57页。46(1)条图(barchart):用等宽直条的长短表示统计指标数值的大小。适用于相互独立、性质相似的各指标间比较。注意:纵坐标从0开始第46页/共56页第四十六页,共57页。47第47页/共56页第四十七页,共57页。48(2)百分条图(percentchart):是以一个直条总长度为100%,将其分割成不同长度的段来表示事物中各部分的比重或构成。第48页/共56页第四十八页,共57页。49(3)圆图(piec

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论