版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
优选第一章医学统计学方法的基本概念和基本步骤目前一页\总数四十九页\编于二十二点内容:1、医学统计学方法的基本概念和基本步骤2、数值变量的统计描述3、数值变量的统计推断4、分类变量的统计描述5、分类资料的统计推断
6、秩和检验7、直线相关与回归分析8、统计表和统计图目前二页\总数四十九页\编于二十二点本节主要内容第一节统计学的几个基本概念第二节医学统计工作的基本步骤目前三页\总数四十九页\编于二十二点一、什么是医学统计学?例1:比较两种疗法对活动期十二指肠球部溃疡一组:口服呋喃硝铵,有效率90%;另一组:口服西咪替丁,有效率85%问:能否立即下结论,呋喃硝铵疗效高于西咪替丁?目前四页\总数四十九页\编于二十二点医学统计学:应用概率论和数理统计的基本原理和方法,研究医学领域中数据的收集、整理和分析的一门应用性学科。指导人们如何对科研问题进行严密的设计、获取可靠的数据、正确的归纳、分析与推理判断的科学,帮助揭示疾病或现象的发生、发展规律,为预防疾病、促进健康提供客观依据。
目前五页\总数四十九页\编于二十二点二、为什么要学统计学?
1.采用统计学方法,发现不确定现象背后隐藏的规律。
变异(variation):是社会和医学中的普遍现象。变异使得实验或观察的结果具有不确定性,如每个人的身高、体重、血压等各有不同。目前六页\总数四十九页\编于二十二点
2.用统计学思维方式考虑有关医学研究中的问题
“阳性”结果是否是虚假联系?
某感冒药治疗1周后,治愈率为90%,能否说该感冒药十分有效?
“阴性”结果是否是样本含量不足?
有人曾对发表在Lancet,Med,JAMA等著名医学杂志上的71篇阴性结果的论文作过分析,发现其中有62篇(93%)可能是由于样本含量不足造成的假阴性。
目前七页\总数四十九页\编于二十二点3.保证你的研究论文能通过统计学审查
据国外60~80年代对不同医学杂志发表论文的调查结果显示,有统计错误的论文所占比例高达72%,最低也有20%。某研究者1996年对4586篇论文统计(中华医学会系列杂志仅占6.9%),数据分析方法误用55.7%。目前八页\总数四十九页\编于二十二点第一节统计学的几个基本概念目前九页\总数四十九页\编于二十二点同质:是指除了实验因素外,影响被研究指标的非实验因素相同。即研究对象的性质相同。变异:是指在同质的基础上,被观察个体之间观察指标的差异。
同质和变异homogeneityandvariation目前十页\总数四十九页\编于二十二点例1调查2007年上海市7岁男童的身高和体重
同质:2007年、上海市、7岁男童变异:身高和体重各不相同例2研究某降压药的疗效
同质:高血压患者、用某药治疗变异:疗效各不相同一、同质和变异目前十一页\总数四十九页\编于二十二点二、总体和样本
总体:是指根据研究目的确定的性质相同的观察单位的全体。更确切地说,是同质的所有观察单位某项观察值(变量值)的集合。populationandsample
目前十二页\总数四十九页\编于二十二点总体和样本研究目的总体该地2002年全部正常成人的白细胞数
观察单位每个正常成人变量值每人测得的白细胞数
研究某地2002年正常成人白细胞数
同质基础:同一地区、同一年份、同为正常人、
有限总体目前十三页\总数四十九页\编于二十二点例如:研究用珍菊降压片高血压患者治疗后的疗效同质基础:同为高血压患者、同用珍菊降压片治疗总体:包括设想用该药治疗的所有高血压患者的治疗效果这个结果没有时间和空间的限制,观察单位数无限无限总体无限总体目前十四页\总数四十九页\编于二十二点
有限总体:总体中所包含的个体数目是可以掌握的,有空间、时间的限制。
无限总体:没有具体的空间、时间的限制,所包含的个体数目是未知的。(设想的、或抽象的)有限总体和无限总体目前十五页\总数四十九页\编于二十二点调查某地2002年正常成人的白细胞数
——总体从某地2002年正常成人随机抽取150人,分别测其白细胞数,组成样本。——样本总体样本抽取部分观察单位
统计量参数
推断inference目前十六页\总数四十九页\编于二十二点样本:
是从总体中随机抽取的具有代表性的一部分观察单位其某项指标的实测值的集合。抽样(sampling):从总体中抽取部分个体的过程。
如何正确地由样本反映总体呢?抽样时必须遵循随机化原则目前十七页\总数四十九页\编于二十二点随机性:
总体中每个个体都有相同的机会被抽取到样本随机不等于随意随机抽样的实现:随机数字表
目前十八页\总数四十九页\编于二十二点三、参数和统计量
parameterandstatistic参数:根据总体个体值计算出来的描述总体特征的的指标希腊字母表示:如总体均数μ、总体标准差σ、总体率π等。是固定的常数但一般未知。普查统计量:根据样本个体值计算出来描述样本特征的指标拉丁字母表示:如样本均数、样本率p等。在参数附近随机波动。抽样调查目前十九页\总数四十九页\编于二十二点由于抽样所引起的样本统计量与总体参数之间的差异称为抽样误差。产生的原因:
1.个体之间存在变异2.抽样时只能抽取总体中的一部分作为样本
不可避免
但有一定的分布规律,可估计;并在一定范围内控制抽样误差四、抽样误差(randomsamplingerror):目前二十页\总数四十九页\编于二十二点概率(probability):是反映某一随机事件发生的可能性大小的一个量度。记为P,取值[0,1]。必然事件:P=1不可能事件:P=0随机事件:0<P<1五、概率(probability)目前二十一页\总数四十九页\编于二十二点P<0.05或P<0.01的随机事件称为小概率事件
统计学上认为1次抽样中不大可能发生。CertainImpossible0.501目前二十二页\总数四十九页\编于二十二点第二节统计数据的类型实验或调查研究中的观察指标称为随机变量(randomvariable);变量的观测值称为变量值(variablevalue)或观察值(observedvalue)由变量值构成资料(data)目前二十三页\总数四十九页\编于二十二点根据变量值是否定量可分为数值变量(numericalvariable):计量资料分类变量(categoricalvariable):无序分类变量(unorderedcategoricalvariable)
计数资料有序分类变量(ordinalcategoricalvariable)
等级资料目前二十四页\总数四十九页\编于二十二点251.计量资料(measurementdata):定义:用定量方法对观察单位准确测量后所得的资料。
变量值是定量的,表现为数值大小,多有度量衡单位。特点:有度量衡单位多为连续性资料
例如:身高(cm)、体重(kg)血压(mmHg)、脉搏(次/分)红细胞计数(1012/L)目前二十五页\总数四十九页\编于二十二点262.无序分类变量(计数资料)定义:用定性的方法得到的资料。按观察单位某种性质或特征分组后,再分别清点各组观察单位的个数
特点:没有度量衡单位多为间断性资料变量表现为互不相容的类别或属性
例如:肤色(黑、白)——二项分类血型(ABO)——多项分类职业(工农兵)——多项分类性别(男女)——二项分类目前二十六页\总数四十九页\编于二十二点3.等级资料(rankeddata)
定义:将观察单位按某种属性的不同程度分成等级后分组计数所得的资料。是介于计量资料和计数资料之间的一种资料特点:其变量值具有半定量性质
表现为等级大小或属性程度例如:①癌症分期:早、中、晚。
②药物疗效:治愈、好转、无效、死亡。
③尿蛋白:,,,++,+++及以上目前二十七页\总数四十九页\编于二十二点实例数据1目前二十八页\总数四十九页\编于二十二点4.三类资料间关系
例:一组2040岁成年人的血压以12kPa为界分为正常与异常两组,统计每组例数
<8低血压8正常血压12轻度高血压15中度高血压17重度高血压计量资料等级资料计数资料目前二十九页\总数四十九页\编于二十二点目前三十页\总数四十九页\编于二十二点第三节医学统计学的基本步骤1.设计:包括观察性研究设计和实验性研究设计2.收集资料:取得准确可靠的原始资料3.整理资料:对资料进行清理、改错,数量化4.分析资料:统计描述、统计推断目前三十一页\总数四十九页\编于二十二点定义:是在保证科学性、可重复性和高效性的前提下,为验证研究假说而制定周密的医学研究计划。
在广泛的查阅文献、全面了解现状、广泛征询意见的基础上,对将要进行的研究工作所作的全面的设想。1、设计(design)目前三十二页\总数四十九页\编于二十二点1、设计(design)的分类:调查设计(surveydesign):对研究对象不施加任何干预,通常建立随机抽样(randomsampling)方案。搜集资料在整个研究设计中占主要地位.实验设计(experimentdesign):对研究对象施加干预,如动物实验研究、临床试验,通常建立随机分组(randomallocation)方案。目前三十三页\总数四十九页\编于二十二点2、设计(design)的内容(1)明确研究目的和研究假说。(2)确定研究对象与观察单位、样本含量和抽样方法。(3)是否施加干预,如何施加干预?如何设置对照?(4)设置观察指标。(5)需搜集哪些原始资料,用什么方法?(6)如何对取得资料作进一步的整理和汇总,计算统计指标。(7)如何控制误差。(8)预期会得到什么结果。(9)研究进度和经费的安排等。目前三十四页\总数四十九页\编于二十二点Fisher在他的著作中多次强调,统计学家与科学研究者的合作应该在实验设计阶段,而不是在需要数据处理的时候。“试验完成后再找统计学家,无异于请统计学家为试验进行“尸体解剖”。统计学家或许只能告诉你试验失败的原因。”目前三十五页\总数四十九页\编于二十二点2、收集资料(datacollection)资料的来源:1、统计报表:疫情报表、医院工作报表等;2、登记和报告卡(单):传染病和职业病发病报告卡,肿瘤发病及死亡报告卡,出生及死亡报告单等;3、日常医疗卫生工作记录:如门诊病例、住院病例、健康检查记录、卫生监测记录等4、专题调查或实验研究:开展医学科研的主要资料来源前三种都有局限性。目前三十六页\总数四十九页\编于二十二点资料收集计划
①选择搜集资料的地点、人员和时间;②搜集资料人员的培训方案;③预调查或预实验方案拟定;④资料的记录方式;⑤调查表的拟订和印刷;⑥调查或实验仪器、试剂的准备;⑦调查资料的抽样复核比例和方法;⑧搜集资料所需经费的准备等。目前三十七页\总数四十九页\编于二十二点目的是对搜集到的原始资料其系统化和条理化,便于进一步计算统计指标和深入分析。资料整理前要对资料再次检查与核对,发现缺项或错项较多的调查表,须补查或剔除。审查无误后,设计分组。3、整理资料(datasorting)目前三十八页\总数四十九页\编于二十二点资料整理的过程1、对原始数据进行核对和检查。2、设计分组。(1)质量分组:按属性或类别归类分组;(2)数量分组:按数值大小分组。3、按分组要求设计整理表,汇总资料。目前三十九页\总数四十九页\编于二十二点可借助于计算机软件(EpiData,Study-Builder,Excel)来完成。1、编码,将数据输入计算机2、纠错改错、补漏等目前四十页\总数四十九页\编于二十二点运用统计学的基本原理和方法,根据研究设计的目的、要求、资料的类型和分布特征选择正确的统计分析方法,进行一系列的统计描述和统计推断,揭示事物内部的规律。可借助于计算机(常用软件:SPSS、SAS、STATA)完成。4、分析资料(dataanalysis)目前四十一页\总数四十九页\编于二十二点4、分析资料(dataanalysis)统计描述(descriptivestatistics)
是指用统计指标和适宜的统计图、统计表等方法,描述统计资料的分布规律及其数量特征。统计推断(inferentialstatistics)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 污水处理厂污泥湿式焚烧合同
- 企业员工关怀措施
- 智能导航网线铺设协议
- 写字楼玻璃隔断安装协议
- 分时度假租赁合同样本
- 电商促销季临时工合同范本
- 修鞋师傅解除聘用合同模板
- 互联网广告合作协议办法
- 通风工程小青瓦施工合同
- 国际健康中心检查井施工合同
- 2024年保密协议书(信息技术行业)2篇
- 2024-2025学年高一【数学(人教A版)】函数的零点与方程的解-教学设计
- 【课件】程式与意蕴-中国传统绘画+课件-2024-2025学年高中美术人美版(2019)美术鉴赏
- 社会学概论-终结性考核-国开(SC)-参考资料
- 2022年全国应急普法知识竞赛试题库大全-上(单选题库-共4部分-1)
- 大学美育-美育赏湖南智慧树知到期末考试答案章节答案2024年湖南高速铁路职业技术学院
- 国家开放大学电大《11662会计信息系统(本)》期末终考题库及标准参考答案
- DZ/T 0430-2023 固体矿产资源储量核实报告编写规范(正式版)
- 2024年考研管理类联考综合能力真题及答案
- 外事实务知到章节答案智慧树2023年山东外事职业大学
- 有机化学ppt课件(完整版)
评论
0/150
提交评论