版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、医 学 统 计 学四川大学华西公共卫生学院卫生统计学教授李晓松第1页,共79页。 第一章 绪 论第2页,共79页。第一节 医学统计学的地位和作用第3页,共79页。第一节 医学统计学的地位和作用当研发了一种治疗高血压病的新药,应该怎样评价该新药的疗效?患者 一组服用对照药一组服用新药观察疗效 然后分析该新药的有效性和安全性 第4页,共79页。 统计学扮演什么角色? 在这个“临床试验”中有诸多问题需要回答:需要多少名患者参加试验?如何将患者分为两个组? 哪些措施可以保证两组患者除了接受不同药物治疗外,其他影响疗效的因素在两组的分布是一致的?如果分布不一致,如何在诸多的影响因素中,分离出药物因素的效
2、应? 第一节 医学统计学的地位和作用第5页,共79页。第一节 医学统计学的地位和作用应采用什么样的指标来反映新药的有效性和安全性?怎样测量这些指标以保证数据的准确性和可靠性?如何控制试验的误差?如果两组疗效存在一定差别,怎样比较两个药物的疗效到底是否存在差别? 统计学将回答上述问题!第6页,共79页。第一节 医学统计学的地位和作用另一种情形: 为了解一个城市居民高血压病的患病现状,通常的做法是在这个城市调查一部分个体,利用这一部分个体的高血压病患病状况来反映整个城市的患病状况。 如何在这个城市选取这一部分个体? 需要选取多少人进行调查? 如何保证收集到的资料是准确和可靠的?如何评价这种准确性和
3、可靠性? 第7页,共79页。第一节 医学统计学的地位和作用如何描述这部分人高血压病的患病状况?如何从这部分人推论到整个城市人群?对于这种推论的正确性抱有多大的信心? 统计学将回答上述问题!第8页,共79页。 每个人的血压都不一样,每个高血压病患者对同一种药物治疗的反应也存在着差别,这就是个体差异和不确定性。第一节 医学统计学的地位和作用第9页,共79页。第一节 医学统计学的地位和作用 变异(variation):由于个体结构和功能千差万别,机体反应受到各种自然和社会环境因素的影响和制约,对内外环境刺激的反应同样千差万别。个体差异是自然界普遍存在的现象。统计学将这种差异称为变异。 变异同样条件下
4、对同一个体进行重复观测结果具有不确定性第10页,共79页。第一节 医学统计学的地位和作用 William Osler爵士曾指出“医学就是关于不确定性的科学和概率的艺术” (Medicine is a science of uncertainty and an art of probability)。 第11页,共79页。第一节 医学统计学的地位和作用医学中充满了个体变异和不确定性。客观事物在数量上所表现出来的现象既受到本质规律的约束,又受到诸多偶然因素的影响。统计学正是分析数据中变异和不确定性的一门科学和艺术,它透过具有偶然性的现象来探测和揭示那些令人困惑的医学问题的特征和规律,对不确定性的数
5、据作出科学推断。因此,统计学是认识客观世界的重要工作工具和手段。第12页,共79页。第一节 医学统计学的地位和作用医学统计学:运用数理统计学的基本原理和方法来研究医学问题的一门学科,它包括了研究设计、数据收集、整理、分析以及分析结果的解释和表达。医学统计学?卫生统计学?生物统计学?第13页,共79页。第一节 医学统计学的地位和作用医学统计学在医学科学研究中的地位和作用举足轻重 由于研究设计、数据收集、统计分析、结果解释及结果报告任何一个环节的缺陷或错误,已经断送了许多先进的甚至非常前沿的医学研究成果,即使已经发表的研究成果也存在着大量的统计学缺陷或错误。 现在,人们已逐步认识到统计学在医学和公
6、共卫生科学研究中的极端重要性。医学统计学正日益彰显其蓬勃的生命力和广阔的应用空间。第14页,共79页。第二节 医学统计学基本内容和统计工作基本步骤第15页,共79页。第二节 医学统计学基本内容和统计工作基本步骤 在统计设计的基础上,对数据进行收集、整理和分析,并对分析结果进行正确解释和表达。 统计设计是医学统计学的重要内容,也是统计工作的第一步和最关键的一步。 第16页,共79页。 一个常见和普遍的误解: “统计”就是分析数据 第二节 医学统计学基本内容和统计工作基本步骤第17页,共79页。第二节 医学统计学基本内容和统计工作基本步骤 “做完实验后才找统计学家无异于请他作尸体解剖,他能做的全部
7、事情就是告诉你这实验死于什么原因”。现代统计学奠基人之一、世界著名统计学家Fisher曾精辟指出第18页,共79页。没有科学严谨的统计设计,数据的收集以及分析常常是没有价值的。对于不准确或不可靠的数据,统计分析所得出的结论常常是站不住脚的,甚至是误导的。 第二节 医学统计学基本内容和统计工作基本步骤第19页,共79页。第二节 医学统计学基本内容和统计工作基本步骤 医学科研的统计设计和统计分析是统计学不可分割的两个重要组成部分。第20页,共79页。第二节 医学统计学基本内容和统计工作基本步骤统计研究设计观察性研究(observational study)实验性研究(experimental st
8、udy)临床试验(clinical trial) 动物实验(animal experiment) 病例对照研究(case-control study)队列研究(cohort study)社区干预试验(community intervention trial)横断面调查(cross-sectional survey)第21页,共79页。第二节 医学统计学基本内容和统计工作基本步骤 不同研究设计所获得的数据,采用统计分析方法常常不同,而且所得研究结论也存在差异。 第22页,共79页。第二节 医学统计学基本内容和统计工作基本步骤 统计分析 统计描述(statistical description)
9、统计推断(statistical inference) 参数估计 假设检验 第23页,共79页。第二节 医学统计学基本内容和统计工作基本步骤统计描述 主要是运用一些统计指标诸如均数、标准差、率以及统计表和统计图等,对数据的数量特征及其分布规律进行客观地描述和表达,不涉及样本推断总体的问题 。统计推断 在一定置信度或概率保证下,根据样本信息去推断总体特征。 第24页,共79页。第二节 医学统计学基本内容和统计工作基本步骤参数估计:指用样本指标推断总体相应的指标 如根据部分城市人群的原发性高血压患病率去估计整个城市的原发性高血压患病率。假设检验:指由样本之间的差异推断总体之间是否可能存在差异 如原
10、发性高血压治疗药物在两组的疗效存在一定差别,假设检验回答这种差别是机会造成的,还是真实存在的。 第25页,共79页。第三节 统计学的若干基本概念第26页,共79页。一总体与样本第三节 统计学的若干基本概念第27页,共79页。总体(population):所有同质观察单位某种观察值(即变量值)的全体。 样本(sample):总体中抽取部分观察单位的观测值的集合。 注意观察单位间的同质性是构成总体的必备条件,也是进行研究的基本前提。第三节 统计学的若干基本概念一总体与样本第28页,共79页。第三节 统计学的若干基本概念一总体无限总体:指总体中的个体是无限的 有限总体:指总体中的个体是有限的总体与样
11、本第29页,共79页。第三节 统计学的若干基本概念注意总体中的“个体”(individual)在多数情形下是人,但也可以是其他个体。注意识别鉴别“个体”即基本单位到底是什么,在统计分析以及结果解释中都至关重要。一总体与样本第30页,共79页。第三节 统计学的若干基本概念 参数(parameter):总体的某些数值特征称为参数。 统计量(statistic):根据样本算得的某些数值特征称为统计量。 一总体与样本第31页,共79页。只有当样本代表了总体时,根据统计量所估计的参数才是准确的。 因此,选择样本的方法至关重要。第三节 统计学的若干基本概念一总体与样本第32页,共79页。第三节 统计学的若
12、干基本概念正确的方法就是采用客观的概率抽样方法选择样本。一总体与样本第33页,共79页。选择偏性将具有某一类特征的个体排除在样本之外所表现出的系统倾向性称为选择偏性。 当存在选择偏性时,抽取一个更大的样本无助于统计推断。相反,它只是在一个更大的规模上去重复错误。 第三节 统计学的若干基本概念一总体与样本第34页,共79页。第三节 统计学的若干基本概念概率抽样: 每一个体都有同样的机会被选入样本,在理论上可计算出总体中任一个体被选入样本的机会大小。样本含量: 样本包含的观察单位数称为样本含量或样本大小(sample size)。抽样误差(sampling error): 即便采用概率抽样方法抽取
13、样本,但毕竟样本只是总体的一部分,这就存在着误差,统计学上将其称为抽样误差。 一总体与样本第35页,共79页。第三节 统计学的若干基本概念对于一次具体的概率抽样,抽样误差可能有多大?它对样本含量的依赖程度怎样?为了将抽样误差置于控制之下,样本含量需取多少?这时用统计量估计总体参数时,会达到怎样的接近程度? 这些都是统计学中至关重要的问题一总体与样本第36页,共79页。第三节 统计学的若干基本概念2二变 量第37页,共79页。第三节 统计学的若干基本概念变量(variable):观测单位的某种特征或属性变量值:变量的观测值就是所谓变量值数据或资料(data) :具有若干变量值的观测单位所组成 2
14、二变 量第38页,共79页。你年龄多大? 年龄什么学历? 学历结婚了吗? 婚姻状况有工作吗? 就业状况家里有多少人? 家庭人口数第39页,共79页。第三节 统计学的若干基本概念定量变量 有些问题的答案如年龄、家庭人口数是具体的数值,所对应的变量是定量的,称为定量变量。定性变量 有些问题的答案如学历、婚姻状况和就业状况是用语言来描述的,对应的变量是定性的,称为定性变量。2二变 量第40页,共79页。第三节 统计学的若干基本概念变量定量变量 定性变量有序分类变量无序分类变量连续变量离散变量2二二项分类变量多项分类变量变 量第41页,共79页。第三节 统计学的若干基本概念定量变量要么是连续的,要么是
15、离散的连续变量 如年龄就是一个连续变量,因为不同人的年龄差异在理论上可以任意地小。一般有度量衡单位。离散变量 如家庭人口数就是一个离散变量,不同家庭的人口数可相差0、1、2等,在这些量之间不可能取其他量。 2二变 量第42页,共79页。第三节 统计学的若干基本概念定性变量往往表现为互不相容的类别和属性有序分类变量:指其取值的各类别之间存在着程度上的差别,给人以“半定量”感觉,也称等级变量,如学历。二项分类变量:取值为相互对立的两类,如性别。多项分类变量:取值为互不相容的多个类别,如血型。2二变 量第43页,共79页。第三节 统计学的若干基本概念变量类型的区分在统计学中至关重要,它不仅决定了统计
16、分析方法的选择,还与识别分析的基本单位有关、与分析结果的解释有关。2二变 量第44页,共79页。第三节 统计学的若干基本概念出于特定研究目的,不同类型变量间可以进行转换。一般从定量到半定量,再到定性(注意信息量将减少)。当然,为了对定性变量进行统计学处理,需要对其进行编码处理。2二变 量第45页,共79页。第三节 统计学的若干基本概念2三误 差第46页,共79页。第三节 统计学的若干基本概念误差(error) 泛指实测值与真实值之差,一般可区分为随机误差和非随机误差两大类。2三误 差第47页,共79页。随机误差是一类不恒定的、随机变化的误差,往往使实测值无方向性地围绕着某一数值左右波动。抽样误
17、差即为随机误差,即由于随机抽样造成的实测值与真实值之差。随机误差在随机抽样和观测中是不可避免的,但一般遵从一定规律,可通过统计学方法进行分析。第三节 统计学的若干基本概念2三误 差第48页,共79页。第三节 统计学的若干基本概念非随机误差最常见的非随机误差即系统误差。还有一些非随机误差是在研究过程中由于研究者的偶然失误造成的,所谓过失误差。 2三误 差第49页,共79页。第三节 统计学的若干基本概念系统误差:是指实测值系统偏离真实值的、具有方向性的误差,因此也常称为偏性或偏倚(bias)。产生的原因往往是可知的或可掌握的,如仪器未校正,操作不规范等。通过完善研究设计、规范操作流程、改进技术手段
18、等方式,可以降低或消除系统误差。 2三误 差第50页,共79页。第三节 统计学的若干基本概念2四概 率第51页,共79页。第三节 统计学的若干基本概念概率(probability) 概率论和数学的其他组成部分一起构成了推理艺术的重要基础,统计分析的重要组成部分 统计推断就建立在此基础上。2四概 率第52页,共79页。机会的含义可用简单的抛硬币游戏加以说明。第三节 统计学的若干基本概念2四概 率第53页,共79页。当某一实验在相同条件下独立地一次又一次重复进行时,某事件发生次数的百分数就是该事件的机会,这就是机会的频数理论。一个事件概率的大小,取决于该事件的可能发生机会数与该事件的可能发生及不发
19、生的所以机会数之比。这个比值就是这一事件发生概率的度量。第三节 统计学的若干基本概念2四概 率第54页,共79页。第三节 统计学的若干基本概念 如一个事件有4次机会发生和6次机会不发生,4/10(0.4)就恰当地表示了这一事件发生的概率,并且可取作该概率的度量值 。2四概 率第55页,共79页。第三节 统计学的若干基本概念医学研究的现象大多为随机现象随机事件(random event):根据某一研究目的,在一定条件下对某一随机现象(不确定现象)进行观测,其结果事先是不确定的,此即随机事件,统计学简称事件。 2四概 率第56页,共79页。第三节 统计学的若干基本概念 概率:度量随机事件发生可能性
20、大小的数值治疗200例患者,120名患者治愈,治愈率为60%,这是一个频率(frequency)。现实中概率是难以获得的,在观测单位足够多或试验次数足够多时,可将其频率作为概率的估计值。但在观测单位较少时,用频率估计概率是不可靠的 。 2四概 率第57页,共79页。第三节 统计学的若干基本概念概率01某事件肯定不发生 某事件肯定发生 概率常用 P 表示 ,取值界于 0 与 1 两个极端值之间 2四概 率第58页,共79页。第三节 统计学的若干基本概念小概率事件(small probability event):当某事件发生的概率小于或等于0.05时,统计学习惯上称该事件为小概率事件。其含义是该
21、事件发生的可能性很小,进而认为它在一次抽样中不可能发生,它是统计推断的重要基础。 2四概 率第59页,共79页。第四节 统计思维的培养及本书内容的安排第60页,共79页。2一统计思维的培养 第61页,共79页。第四节 统计思维的培养和本书内容的安排 医学生学习统计学,并非要成为医学统计学的专业人员,其目的是: 培养正确的统计思维 掌握基本的统计设计方法和如何收集准确可靠的数据 运用基本的统计分析方法正确分析和处理数据 掌握操作统计软件的基本技能 正确解释和表达分析结果2一统计思维的培养 第62页,共79页。所谓统计思维是指统计学独特的逻辑思维,如个体差异的存在、样本推断总体的误差、这种误差的规
22、律性等,这些构成了统计推断的基石。理解了假设检验的推理逻辑,也就理解了统计结论的概率性。因此,学习统计学需要牢固树立起:个体变异和不确定性的观念抽样误差的观念统计推断结论的概率性观念第四节 统计思维的培养和本书内容的安排2一第63页,共79页。弄清楚假设检验和 P 值的真实含义是学习统计学和培养统计思维的核心问题。第64页,共79页。医学统计学数学计算机联系密切第四节 统计思维的培养和本书内容的安排作为一门应用学科,其学习不能脱离医学背景,必须紧密结合医学专业的实际问题。第65页,共79页。第四节 统计思维的培养和本书内容的安排学习医学统计学就是运用统计思维和统计方法去分析和解决医学实际问题。
23、 对于统计公式,不必深究其数学推导,重要的是要了解其意义、用途和应用条件。 2一第66页,共79页。第四节 统计思维的培养和本书内容的安排2一计算机技术的迅速发展 统计计算的简化 统计学的发展 统计方法的误用甚至滥用第67页,共79页。第四节 统计思维的培养和本书内容的安排2二本书内容的安排第68页,共79页。第四节 统计思维的培养和本书内容的安排第一章绪论讲解医学统计学的基本内容及统计学的若干基本概念,它是后面章节的重要基础。第二、三章是医学科学研究的统计设计,包括调查和实验研究设计两个部分。包括两种设计类型的区别与特点、基本内容和原则。2二本书内容的安排第69页,共79页。第四节 统计思维的培养和本书内容的安排第四、五章为统计描述的基本内容,主要涉及描述定量和定性资料的常见统计指标。第六、七章为统计推断的核心知识,包括参数估计和假设检验两个部分:抽样误差的概念与标准误参数均数估计方法假设检验基本思想与基本步骤I型与II型错误2二本书内容的安排第70页,共79页。第八至十二章为基本和常用单变量统计推断方法,针对不同类型的资料和不同类型的设计,分别介绍了常用的各种 t 检验、方差分析、卡
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 吉林艺术学院《西方视觉艺术发展史》2021-2022学年第一学期期末试卷
- 吉林艺术学院《理性色彩训练》2021-2022学年第一学期期末试卷
- 广东汽修厂合作协议书范本
- 吉林师范大学《重唱与表演唱》2021-2022学年第一学期期末试卷
- 2024年大学生团购协议书模板范本
- 吉林师范大学《现代电子信息技术选讲II》2021-2022学年期末试卷
- 万达商家入驻协议书范文
- 2022年山东省公务员录用考试《申论》真题(B类)及答案解析
- 农业合作社稽核管理制度创新
- 吉林师范大学《和声Ⅱ》2021-2022学年第一学期期末试卷
- 广东省2020年中考英语试题【含答案】
- EBO管理体系与案例分享
- 拦砂坝施工设计方案
- GB/T 20934-2016钢拉杆
- 教研课平行四边形和梯形的复习ppt
- S曲线和技术进化法则TRIZ专题培训课件
- 铜矿普查简报铜矿
- 消防设施定期检查、检测、维修保养记录
- 小学数学北师大四年级上册数学好玩 数图形的学问 省一等奖
- 运算放大器知识介绍课件
- 养老型年金险产品理念课件
评论
0/150
提交评论