常见的几种统计方法_第1页
常见的几种统计方法_第2页
常见的几种统计方法_第3页
常见的几种统计方法_第4页
常见的几种统计方法_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于常见的几种统计方法第1页,共61页,2023年,2月20日,星期三前言

学习统计学方法,主要目的在于建立统计学观念,提高医学统计学思维,学会运用统计学理论和方法充分挖掘资料中蕴含的信息,恰如其分地进行理性概括,并据此写出严谨的研究报告和学术论文。

第2页,共61页,2023年,2月20日,星期三呋喃硝胺

100人西米替丁

100人疗效85人疗效90人

例如:某医生比较两种疗法对活动期十二指肠球部溃疡的疗效。据此能否立即下结论,呋喃硝胺的疗效高于西米替丁?第3页,共61页,2023年,2月20日,星期三显效有效无效合计单纯西药925640冠心灵1918542冠心灵与单纯西药疗效对比

问题:某医师用“冠心灵”治疗冠心病,其疗效是否优于单纯西药?第4页,共61页,2023年,2月20日,星期三授课提纲医学统计学概述统计工作的基本步骤统计资料的类型医学统计中的基本概念常用的几种统计方法第5页,共61页,2023年,2月20日,星期三一、医学统计学概述

定义

是用统计学原理和方法研究生物医学问题的一门学科。医学统计方法在医学研究中的运用主要有三个方面:第6页,共61页,2023年,2月20日,星期三一、医学统计学概述①以正确的方式收集数据,如实验设计、调查设计等。②描述数据的统计特征,如数据化简、统计指标的选择与计算、统计结果的表达等。③统计分析及得出正确结论,如根据概率分布,对实验和观察结果存在的差异和关联作出统计推断。

第7页,共61页,2023年,2月20日,星期三工作生活中常见的统计学问题如何判断药物的疗效?(假设检验)明天是否下雨?体育彩票能否中奖?(概率论)子女为什么象父母,其强度有多大?(相关与回归)美国的民意测验是如何进行的?(设计,抽样)中国的市场调查的可信性有多大?(现场调查)

统计学是对令人困惑费解的数字问题做出设想的艺术。第8页,共61页,2023年,2月20日,星期三

医学论文中的统计学问题60年代到80年代,国外医学杂志调查结果:有统计错误的论文20%~72%。1996年对4586篇论文统计(中华医学会系列杂志占6.9%),数据分析方法误用达55.7%。第9页,共61页,2023年,2月20日,星期三

60年代到80年代,国外医学杂志调查表明:20%~72%的论文有统计错误。

1984年对《中华医学杂志》、《中华内科杂志》、《中华外科杂志》、《中华妇产科杂志》、《中华儿科杂志》595篇论文的调查结果为:相对数误用占11.2%,抽样方法误用占15.9%,统计图表误用占11.7%1996年对4586篇论文统计(中华医学会系列杂志占6.9%),数据分析方法误用达55.7%。

2001年《中华预防医学杂志》:中华医学会系列杂志误用约54%(1995)。1996年,有机构对申报科技成果的4586篇科研论文分析,统计方法使用率为76%。医学论文中统计运用错误,除了影响论文的科学性,还可能导致严重的伦理学问题。

第10页,共61页,2023年,2月20日,星期三

伪造统计数据违反科学道德1976年NewScience杂志关于科研舞弊行为的调查(1)74%的调查表反映有不正当修改数据的情况(2)17%拼凑实验结果(3)7%凭空捏造数据(4)2%故意曲解结果第11页,共61页,2023年,2月20日,星期三

二、统计工作的基本步骤设计收集资料整理资料分析资料第12页,共61页,2023年,2月20日,星期三1.专业设计:选题、建立假说、确定研究对象和技术方法等→个性

2.统计设计:围绕专业设计确定统计设类型、样本大小、分组方法、统计分析指标及统计分析方法。

(一)设计

第13页,共61页,2023年,2月20日,星期三

(二)收集资料

(一)资料来源第一手资料①

经常性:统计报表(死亡登记、疫情报告等),工作记录(病历、化验);②一时性:专题调查、实验或临床试验。第二手资料:已公布的资料,如全国、全省卫生统计资料。第14页,共61页,2023年,2月20日,星期三(二)收集资料

(二)资料要求

1.完整:观察单位及观察项目完整。

观察单位:最基本的获取数据的单元。可以是一个体,亦可以是一个单位、家庭、地区,一批样品,一个采样点。

2.准确:即真实、可靠。真实是统计学的灵魂。

3.及时:即时限性。如人口普查规定调查开始日期和截止日期。第15页,共61页,2023年,2月20日,星期三(三)整理资料

整理资料即原始数据的条理化、系统化的过程。所采取的手段→合理化分组,目的→实现专业目标。质分组:按事物的属性或性质分组→分类变量;量分组:按数据的大小→数值变量。第16页,共61页,2023年,2月20日,星期三(四)分析资料

1.统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行测定和描述。

2.统计推断:用样本信息推断总体特征:①参数估计。②假设检验。第17页,共61页,2023年,2月20日,星期三

三、统计资料的类型

有三种类型的资料:

计量资料,计数资料,等级资料基本概念:变量及变量值,研究者对每个观察单位的某项特征进行观察和测量,这种特征称为变量,变量的测得值叫变量值(也叫观察值),称为资料。按变量值的性质可将资料分为定量资料和定性资料。第18页,共61页,2023年,2月20日,星期三1.计量资料定义:通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小,得到的一系列数据资料。特点:有度量衡单位多为连续性资料(通过测量得到)如患者的身高(cm)、体重(kg)、血压(mmHg)、脉搏(次/分)、红细胞计数(1012/L)第19页,共61页,2023年,2月20日,星期三定义:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。特点:没有度量衡单位多为间断性资料(通过枚举或记数得来)如肤色(黑、白)、血型(ABO)、职业(工农兵)、性别(男女)

2.计数资料第20页,共61页,2023年,2月20日,星期三

定义:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。特点:每一个观察单位没有确切值各组之间有性质上的差别或程度上的不同。①癌症分期:早、中、晚。②药物疗效:治愈、好转、无效、死亡。③尿蛋白:,,,++,+++及以上3.等级资料第21页,共61页,2023年,2月20日,星期三对观察对象按属性或类型分组计数所得的资料。每个对象之间没有量的差异,只有质的不同。

资料的类型

计量资料(数值变量或定量资料)

计数资料(无序分类变量或定性资料)

等级资料(有序分类变量或半定量资料)

对每一观察对象用定量的方法,测定某项指标所得的资料。一般有度量衡单位,每个对象之间有量的区别。

对观察对象按属性或类型程度的不同分组计数,但各属性或类型之间又有程度的差别。

第22页,共61页,2023年,2月20日,星期三

(1)不同类型的资料采用的统计分析方法不同;(2)三类资料类型可以相互转化。

注意:第23页,共61页,2023年,2月20日,星期三例:某地调查高血压的患病情况。每人的血压:以mmHg计计量资料以舒张压≥90mmHg为高血压,结果在1000人中有10名高血压患者,990名非高血压患者,整理后的资料

计数资料按低血压、正常、高血压分组所得资料。等级资料第24页,共61页,2023年,2月20日,星期三四、统计学中的基本概念(一)总体与样本1、总体(population)

根据研究目的所确定的同质的所有观察单位某项变量值的集合。

有关总体的三个要点:研究目的、同质的、全体第25页,共61页,2023年,2月20日,星期三观察对象:该地2002年全部正常成人同质:

同一地区、同一年份、同为正常成人全体:该地2002年全部正常成人白细胞数目的:了解某地2002年正常成人白细胞数观察单位:每个人

观察值:测得的白细胞数例如:了解某地2002年正常成人白细胞数第26页,共61页,2023年,2月20日,星期三四、统计学中的基本概念(二)变异:同质基础上个体值之间的差异,称为变异。同质:指观察单位或观察指标受共同因素制约的部分。例如,同种族、同年龄、同性别的健康人,在相同的条件下测其脉搏、呼吸、体温等生理指标可以有很大差异。第27页,共61页,2023年,2月20日,星期三四、统计学中的基本概念(三)参数和统计量

1.参数:总体指标。

2.统计量:样本指标。(四)抽样误差

1.定义:在统计学上把由抽样造成的样本统计量和总体参数之间的差异或者是各个样本统计量之间的差异统称为抽样误差。

第28页,共61页,2023年,2月20日,星期三四、统计学中的基本概念(五)概率概率:是描述随机事件发生的可能性大小的数值。(1)必然事件:P(A)=1(2)不可能事件:P(A)=0(3)随机事件(偶然事件):0<P(A)<1(4)小概率事件:P≤0.05或P≤0.01第29页,共61页,2023年,2月20日,星期三t检验不是处理计数资料的万能方法第30页,共61页,2023年,2月20日,星期三双向无序,两个分类变量皆为无序分类变量,一般用卡方检验。单向有序资料,采用秩和检验。双向有序且属性相同,研究目的通常是分析两种检测方法的一致性,此时应用一致性检验。双向有序属性不同,根据具体情况可选择秩和检验,等级相关分析或者线性趋势检验。卡方检验不是处理计数资料的万能方法第31页,共61页,2023年,2月20日,星期三卡方检验第32页,共61页,2023年,2月20日,星期三秩和检验或Ridit分析第33页,共61页,2023年,2月20日,星期三原则:选择最恰当的统计指标准确描述资料的特征。非正态分布计量资料正态分布计数资料

率或比第34页,共61页,2023年,2月20日,星期三

X2检验

X2检验或称卡方检验,是一种用途较广的假设检验方法,常用于检验两个或多个样本率及构成比之间有无差别,还用来检验配对定性资料及两种属性或特征之间是否有关系等。第35页,共61页,2023年,2月20日,星期三2检验的适用资料两组样本率的比较;多组样本率的比较;两组或多组构成比的比较;配对设计下两分类资料检验。第36页,共61页,2023年,2月20日,星期三一、四格表资料的检验四格表资料的检验主要用于两个样本率(或构成比)的假设检验,一般制成表6-2的计算格式(以阳性和阴性为例)。第37页,共61页,2023年,2月20日,星期三表6-2四格表资料检验计算表组别阳性数阴性数合计甲组aba+b乙组cdc+d合计a+cb+da+b+c+d=n第38页,共61页,2023年,2月20日,星期三X2检验的基本公式为理论频数T

条件:n>40,T>=5第39页,共61页,2023年,2月20日,星期三四格表检验专用公式省去计算T值第40页,共61页,2023年,2月20日,星期三例6.7以例6.6资料为例表6-3用药组和对照组流感发病率的比较组别

发病人数

未发病人数合计用药组14(20)86(80)100对照组30(24)90(96)120合计44176220第41页,共61页,2023年,2月20日,星期三两种方法计算结果第42页,共61页,2023年,2月20日,星期三结果判断X2临界值:X20.05,1=3.84,

请记住:X20.01,1=6.63,X2=u2

本例:X2=4.125>X20.05,1=3.84,两组差别有统计学意义。与前面的结论相同。第43页,共61页,2023年,2月20日,星期三四格表值的校正

条件:(1)任一格的1≤T<5,且n≥40时,需计算校正值。(2)任一格的T<1或n≤40时,用确切概率计算法。基本公式专用公式第44页,共61页,2023年,2月20日,星期三例6.8

某医师用甲、乙两疗法治疗小儿单纯性消化不良,治疗结果如表6-4,问两疗法的治愈率是否相等?表6-4甲、乙两疗法治疗小儿单纯性消化不良的治愈率比较组别

发病人数

未发病人数合计用药组26(28.8)7(4.2)33对照组36(33.2)2(4.8)38合计62971第45页,共61页,2023年,2月20日,星期三计算结果及判断本例:X2=2.71<X20.05,1=3.84本例若对X2值不校正,α=4.06,得P<0.05,结论正好相反。第46页,共61页,2023年,2月20日,星期三三、行×列表的检验行×列表(R×C表)的检验主要用于解决多个样本率或多个样本构成比的比较以及有序分类资料的关联性检验。

式中n为总例数,A为每格子的实际频数,nR、nC分别为与某格子实际频数(A)同行、同列的合计数。第47页,共61页,2023年,2月20日,星期三

行×列表资料的检验的注意事项1.理论数不宜太小,一般不宜有1/5以上格子的理论频数小于5,或有一个理论频数小于1。对理论数太小有三种处理方法:①最好增加样本含量以增大理论频数;根本的方法。②删去理论频数太小的行和列;此法不好。③将理论频数较小的行或列与邻行或邻列合并以增大理论频数。但后两法可能会损失信息,第48页,共61页,2023年,2月20日,星期三

行×列表资料的检验的注意事项2.当多个样本率(或构成比)比较的检验,结论为拒绝检验假设,只能认为各总体率(或总体构成比)之间不全相等,但不能认为彼此间都不相等。若要比较彼此间的差别,可用下述的行×列表的分割法。3.对于行×列表单向等级资料(单向有序资料)组间的比较,宜用第八章秩和检验,如作卡方检验法只说明各处理组的效应在构成比上有无差异,而不能说明组间整体效应的差异。第49页,共61页,2023年,2月20日,星期三t检验与u检验的应用条件两组数值变量资料比较;小样本时用t检验,要求资料为随机样本并服从正态分布;大样本时用u检验,仍要求资料为随机样本,但正态性条件可以放宽;在两样本均数比较的t和u检验中,要求两组总体方差相等,即方差齐性;组间要求具有均衡可比性。第50页,共61页,2023年,2月20日,星期三

单样本均数的t检验对于总体标准差未知的小样本数据(n<60),单样本均数的假设检验采用t检验,计算公式为第51页,共61页,2023年,2月20日,星期三

例通过以往大规模调查,已知某地新生儿出生体重均数为3.30kg。从该地难产儿中随机抽取35名新生儿作为研究样本,平均出生体重为3.42k

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论