01医学统计学 绪论_第1页
01医学统计学 绪论_第2页
01医学统计学 绪论_第3页
01医学统计学 绪论_第4页
01医学统计学 绪论_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Nantong Univ.2010绪论 IntroductionMedical statistics医学统计学NTU 20102Outline1234什么是医学统计学?一些重要的基本概念如何学好医学统计学?总结NTU 20103统计学(Statistics)Statistics is the science dealing with the collections, analysis, interpretation and presentation of masses of numerical data. (Webster 国际大词典)Statistics is the science and

2、 art of dealing with variation in data through collection, classification and analysis in such a way as to obtain reliable result. 研究数据数据的收集,整理和分析的一门科学。NTU 20104l统计学是一门以社会现象统计学是一门以社会现象总体数量方面总体数量方面为对象的为对象的方法论科学,是研究如何有效地收集、整理和分方法论科学,是研究如何有效地收集、整理和分析受析受随机影响随机影响的数据,并对所考察的问题作出的数据,并对所考察的问题作出推推断或预测断或预测,直至为

3、采取决策和行动提供依据和建,直至为采取决策和行动提供依据和建议的一门学科。议的一门学科。NTU 20105统计是什么?What is Statistics?l若想了解上帝在想什么,我们就必须学统计,因为统计学就是在量测他的旨意。 Florence Nightingale 1820一1910NTU 20106数据处理的工具和技能数据处理的工具和技能NTU 20107天气预报生活中的统计学投机取巧投机取巧NTU 20108人类学文学经济学史学地理学物理学社会学农学生物学医学药学中医学气象学法学医学统计学 Medical Statistics卫生统计学 Health Statistics生物统计学

4、Biostatistics科研中的统计学NTU 20109医学统计学 医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理和方法,研究医学资料的搜集、整理、分析和推断的一门科学。医学统计学(Medical Statistics)NTU 201010为什么要学医学统计学?1. 采用统计学方法,采用统计学方法,发现不确定现象背发现不确定现象背后隐藏的规律。后隐藏的规律。最大值=6.18, 最小值=3.29, 极差=2.89。 算术均数=4.72,标准差=0.57。变异(变异(variation)是社会和生物)是社会和生物医学中的普遍现象。医学中的普遍现象。 变异使得实验或观察的结果具有变异

5、使得实验或观察的结果具有不确定性。不确定性。NTU 201011l2. 2. 用统计学思维方式考虑有关医学研究中的问题用统计学思维方式考虑有关医学研究中的问题l3. 3. 保证你的研究论文能通过统计学审查保证你的研究论文能通过统计学审查 国际生物医学杂志编辑协会在其国际生物医学杂志编辑协会在其生物医学期刊投稿的统一要求生物医学期刊投稿的统一要求中也包含了统计学要求(中也包含了统计学要求(Uniform Requirements for ManuscriptsUniform Requirements for Manuscripts Submitted to Biomedical Journals

6、 Submitted to Biomedical Journals) http:/ http:/ l4. 4. 获得获得循证医学循证医学证据的主要手段证据的主要手段 “良好愿望的医学良好愿望的医学”(well-meaning medicine)转入)转入“以证据为基础的医学以证据为基础的医学” (evidence-based medicine,EBM)需要有统计学方法的支持。)需要有统计学方法的支持。为什么要学医学统计学?NTU 201012l几十年来不少国内外的有识之士对各种刊物进行过调查,几十年来不少国内外的有识之士对各种

7、刊物进行过调查,评价本期刊或某些期刊在一定时限内有百分之几的论文应评价本期刊或某些期刊在一定时限内有百分之几的论文应用研究设计或统计分析不恰当,甚至没有进行研究设计和用研究设计或统计分析不恰当,甚至没有进行研究设计和统计分析。不合格率大多在统计分析。不合格率大多在30%60%之间。这个数字几之间。这个数字几十年来几乎没有变化!十年来几乎没有变化! l中华心血管病杂志中华心血管病杂志第第37卷第卷第7期(期(2009年年7月)载文对月)载文对本期刊第本期刊第35卷第卷第12期期第第36卷第卷第11期共期共200篇论文作了检查,篇论文作了检查,发现其中应用医学统计方法不当者有发现其中应用医学统计方

8、法不当者有49篇,接近篇,接近1/4,而,而出现各种错误或欠缺者则达出现各种错误或欠缺者则达101篇,占半数。篇,占半数。 NTU 201013医学研究的三个步骤1. 1. 研究设计研究设计3. 3. 结论结论2. 2. 资料分析资料分析统计学推断统计学推断专业推断专业推断结合结合假设假设实验或调查获得数据实验或调查获得数据l运用医学统计学的起点,也是高质量地完成整个研究的重要基础。l在数据分析的基础上,应用统计学处理的结果,进行统计学推断;同时,依据相应的专业知识,作出专业性的结论。l在研究设计基础上,通过实验(试验)或调查,将所得数据进行统计学处理的过程。NTU 201014一些基本概念l

9、同质和异质l变异l总体和个体l参数和统计量l随机l概率和频率l小概率事件和小概率原理l抽样误差l变量的分类NTU 201015基本概念之一:同质和异质l同质(homogeneity): 性质相同l异质(heterogeneity):性质不同同质和异质是相对的概念不同质的个体不能笼统地混在一起分析个体的同质性是构成研究总体的必备条件研究内容(指标/变量)不同,对同质性的要求不同NTU 201016在研究事物的形状时同质和异质示例在研究事物的颜色时NTU 201017基本概念之二:变异 l同质事物之间的差别称为变异(Variation)l变异的两个方面:l不同观察单位(个体)间的差别l同一个体在不

10、同阶段的差别(重复测量)NTU 201018变异示例发热者体温波动正常人体温波动NTU 201019基本概念之二:变异l同质个体间的差异。l结果是随机的,不可预测的。l一种或多种不可控因素(已知的或未知的)作用下的综合表现。l个体变异是普遍存在的。l个体变异是有规律的。l没有个体变异,就没有统计学!NTU 201020基本概念之三:总体、个体和样本 l总体(population): 按研究目的所确定的同质研究对象某项观察指标的全体,即全体观察单位。有限总体(finite)无限总体(infinite)l个体(individual): 是构成总体的最基本观察单位;l样本(random sample

11、): 从研究总体中随机抽取具有代表性的部分观察单位。l代表性,包含了总体的特性 为什么要抽样?NTU 201021基本概念之四:参数和统计量 总体参数(population parameter)l未知的,固有的,不变的,需要研究的!样本统计量(sample statistic)l已知的,变化的,有误差的!样本含量(sample size)NTU 201022总体参数(population parameter)总体的特征值称为参数。l未知的,固有的,不变的l需要研究的NTU 201023样本统计量(sample statistic)在总体被确定之后,总体参数就是一个常数,是不会变化的,不管你是否

12、确切知其大小;而统计量是几乎总是随着样本而变的。由样本所算出的统计指标或特征值称为统计量(statistic) 。l已知的,变化的,有误差的!NTU 201024样本含量(sample size)样本中包含个体的数量。 NTU 201025基本概念之五:随机l随机(random):是指机会均等,无主观影响,目的是保证样本对总体的代表性、可靠性l机会均等,无主观影响l抽样随机(random sampling) 有相同的机会被抽到l分组随机(random allocation) 有相同的机会被分到不同的组中l顺序随机(random order) 有相同的机会先后接受处理NTU 201026基本概念

13、之六:频率和概率l频率 Relative frequency :在n次随机试验中,事件A发生了m次,则比值称为事件A在这n次试验中出现的频率mAfn发发生生的的试试验验次次数数试试验验总总次次数数NTU 201027基本概念之六:频率和概率抛硬币试验在概率的统计学定义上的诠释试验者投掷次数出现“正面”次数频率X X X20120.6000Buffon404020480.5069De Morgan 409220480.5005Fisher1000049790.4979K.Pearson1200060190.5016K.Pearson24000120120.5005NTU 201028基本概念之六

14、:频率和概率l概率的统计学定义: 数理统计学中的大数定理表明:当观察次数n越来越大,频率f 的随机波动幅度越来越小,并最终趋向于一个常数p:随机事件A发生的概率 (Probability)。l概率描述事件发生可能性大小的一个度量 。是一种参数。常用P来表示;0P 1NTU 201029基本概念之六:频率和概率l概率的古典定义:有限个(N)可能结果(A1,A2,A3AN);每个结果出现的机会相同;任一次试验中,至少出现一种可能的结果;任一次试验中,只出现一种可能的结果;则在某次试验中,出现某一个结果的可能性为1/N,出现某M个结果中的一个的概率为M/N NTU 201030基本概念之六:频率和概

15、率抛硬币试验在概率的统计学定义上的诠释每次投掷两枚硬币A和B,出现的四种可能A正B正、A反B正、A正B反、A反B反其概率都是1/4。每次试验肯定会出现上述四种结果中的一个,且仅会出现一个。NTU 201031基本概念之七:小概率事件l小概率事件小概率事件(rare event)(rare event) 当某事件发生的概率很小(可能性很小),统计学上称该事件为小概率事件。 医学上:小于或等于0.05l小概率原理小概率原理 小概率事件并不表示不可能发生,但在某一次试验中,是不会发生的。NTU 201032l抽样误差(sampling error)由抽样引起的样本统计量与总体参数间的差别。原因:个体

16、变异抽样表现:l样本统计量与总体参数间的差别l不同样本统计量间的差别抽样误差是有规律的! 基本概念之八:抽样误差 NTU 201033基本概念之九:变量的分类 观察对象个体的特征或测量的结果。 个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,称为随机变量,简称变量(variable),变量的取值称为变量值或观察值。 NTU 201034第一种分类(三类资料)(1) 定量资料(quantitative data) 以定量值表达每个观察单位的某项观察指标,如血脂、心率等。特点:l 各观察单位间只有量的差别;l 数据间有连续性。 NTU 201035(2) 定性资料(qualitativ

17、e data) 以定性方式表达每个观察单位的某项观察指标,如血型、性别等。特点:l 各观察单位间或者相同,或者存在质的差别;l 有质的差别者之间无连续性。 第一种分类(三类资料)NTU 201036(3) 等级资料(ranked data,ordinal data)以等级表达每个观察单位的某项观察指标,如疗效分级、心功能分级等。特点: 各观察单位间或者相同,或者存在质的差别; 各等级间只有顺序,而无数值大小,故等级之间不可度量。第一种分类(三类资料)NTU 201037资料类型的判断病例号年龄(岁)性别身高(cm)血型心电图尿WBC职业RBC1012/L135女1.65A正常教师4.67244

18、男1.74B正常工人5.21326男1.80O正常职员4.10425女1.61AB正常农民3.92541男1.71A异常+工人3.49645女1.58B正常+工人5.48750女1.60O异常+干部6.78828男1.76AB正常+干部7.10931女1.62O正常军人5.24NTU 201038l按照取值的特性:数值变量 Numerical Variable 定量变量:既有顺序的意义,又有间隔的意义,可以认为是连续的;往往有单位;取值间的差异是可以度量的分类变量 Categorical Variable :取值是是分散、定性的,表现为互不相容的类别和属性l无序分类 Unordered Cat

19、egorical定性变量: 无顺序,无间隔,仅有分类二项分类多项分类l有序分类 Ordered Categorical 等级变量:仅有顺序,无单位;取值间的差异是不可度量的第二种分类(两类资料)NTU 201039 数值变量资料(numerical variable) 分类资料(categorical variable) 二分类(binary( dichotomous) variable) 多分类(polytomous variable )无序多分类(multinomial)有序多分类(ordinal)(等级资料,ranked data)第二种分类(两类资料)NTU 201040资料类型的判断

20、病例号年龄(岁)性别身高(cm)血型心电图尿WBC职业RBC1012/L135女1.65A正常教师4.67244男1.74B正常工人5.21326男1.80O正常职员4.10425女1.61AB正常农民3.92541男1.71A异常+工人3.49645女1.58B正常+工人5.48750女1.60O异常+干部6.78828男1.76AB正常+干部7.10931女1.62O正常军人5.24NTU 201041数学上的分类l连续性资料(continuous data) l离散型资料(discrete data) NTU 201042基本概念之九:变量的分类l不同分类的互相转化 定量资料(数值变量)定性资料(无序分类变量)定量资料(数值变量)等级资料(有序分类变量)等级资料(有序分类变量)定性资料(无序分类变量) 信息量只有减少,不可增加NTU 201043基本概念汇总总体个体、个体变异总体参数未知样本代表性、抽样误差随机抽样样本统计量已知统计推断风 险NTU 201044医学统计学思维l归纳型思维 推理型思维l从样本到总体 l

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论