版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
生物医学统计学1几个问题?医学和统计学是什么关系?医学统计学由哪几个部分组成?当今医学统计学的应用情况如何?医学统计学学习的难点是什么?2第一章绪论一、什么是生物医学统计学
学习生物医学统计学的重要性二、统计工作的步骤三、统计资料的类型四、统计学的几个基本概念3工作生活中常见的统计学问题中国股民股票投资状况问卷调查与分析中国工业生产发展的预测分析中国城镇居民消费结构分析年龄、文化程度、婚姻状况、职业对人口死亡率的影响财政收入多元线性回归分析区域城市化水平差异的定量分析
统计学就是设法在令人困惑费解的数字中找出规律并提出统计学解决方案4一、什么是生物医学统计学统计学——研究数据及其存在规律的科学生物医学统计学——用统计学原理和方法研究生物医学问题的一门学科医学统计学:20世纪40年代逐渐形成的学科特点:不讨论数学理论,而偏重于统计原理的介绍和具体分析方法的应用对象:人体、健康相关因素、疾病相关因素研究特点:变异性强、影响因素多、必须有一定数量的研究对象5
根据研究领域和研究对象,统计学又分为:数理统计、经济统计、生物统计、医学统计、卫生统计…….
生物医学统计学(biomedicalstatistics):用统计学的原理和方法研究生物医学中的问题。
卫生统计学(healthstatistics):与医学统计学基本相同,但更侧重于社会、人群的卫生问题。6统计学在生物医学中的应用调查10例男性矽肺患者的血红蛋白的均数为12.59(g/dl),标准差为1.63(g/dL),已知男性健康成人的血红蛋白的正常值为14.02(g/dL),问矽肺患者的血红蛋白是否与健康人不同。某医院用某新药与常规药物治疗婴儿贫血,将20名患儿随机分成二组,分别接受两种药物治疗,测得血红蛋白增加量如下,问新药和常规药物疗效有无差别。
增加量(g/L)新药组24362514263423201519常规药组1418201522242125272323.620.971.采用统计学方法,发现不确定现象背后隐藏的规律。变异(variation)是社会和生物医学中的普遍现象。变异使得实验或观察的结果具有不确定性,如每个人的身高、体重、血压等各有不同。为什么要学统计学?82.
用统计学思维方式考虑有关医学研究中的问题
“阳性”结果是否是虚假联系?
某感冒药治疗1周后,治愈率为90%,能否说该感冒药十分有效?
“阴性”结果是否是样本含量不足?
有人曾对发表在Lancet(柳叶刀),NEnglJMed,JAMA等著名医学杂志上的71篇阴性结果的论文作过分析,发现其中有62篇(93%)可能是由于样本含量不足造成的假阴性。
93.
保证你的研究论文能通过统计学审查
据国外60~80年代对不同医学杂志发表论文的调查,有统计错误的论文的百分比最高达72%,最低也有20%。国内八十年代年对《中华医学杂志》、《中华内科杂志》、《中华外科杂志》、《中华妇产科杂志》、《中华儿科杂志》等刊物中的595篇论文的调查结果,相对数误用为11.2%,抽样方法误用15.9%,统计图表误用11.7%。某研究者对某年的4586篇论文统计,医学数据分析方法误用达55.7%。104.
获得循证医学证据的主要手段“良好愿望的医学”(well-meaningmedicine)转入“以证据为基础的医学”(evidence-basedmedicine,EBM)需要有统计学方法的支持。
全世界的医学期刊每年大约刊登600万学术论文,但能作为可靠“证据”的论文并不多。
11医学论文中的统计学错误甲疗法乙疗法病情病人数治愈数治愈率病人数治愈数治愈率轻型80720.960540.9重型120840.740280.7合计2001560.78100820.82效果一样的疗法?12生物医学统计学很重要怎样做?13二、统计工作的步骤研究设计:依据目的制定计划,对整个过程进行安排,是整个工作的关键搜集资料:根据计划取得可靠、完整的资料。收集资料方法有:统计报表、日常性工作、专题调查。注重资料的真实性(基础)整理、分析资料:原始资料的整理、清理、核实、查对,使其条理化、系统化便于计算和分析。可借助于计算机(常用软件:Excel,SPSS,SAS)(环节)解释结果:统计学的目的所在。运用统计学、医学的基本原理和方法,分析计算有关的指标和数据,揭示事物内部的规律。(目的)14研究设计非常重要研究设计:直接影响研究结果设计缺陷:不能事后弥补严格区分:科学研究、日常工作分析方法:设计中必须明确事半功倍事倍功半怎样设计?15统计学的研究设计研究类型(横向、纵向)研究设计的基本内容实验设计的3原则(重复、对照、随机化)常用随机分组的方法16医学论文中的统计学错误“奇妙的”实验设计:为研究A、B两种药物的疗效,设计了下面实验。分4组,每组小白鼠20只,观察定量指标为血小板、白细胞。分组如下:第1组:空白对照;第2组:单用A药;第3组:A、B药联合使用;第4组:第3组的空白对照组。2×2析因对照17
Fisher在著作中多次强调:统计学家与科学研究者的合作应该在实验设计阶段,而不是在需要数据处理的时候。“试验完成后再找统计学家,无异于请统计学家为试验进行“尸体解剖”。统计学家或许只能告诉你试验失败的原因。”
18研究类型纵向研究(longitudinalstudy)
由于是指动态地、持续地提供信息,称横断面研究(cross-sectionstudy)
又称现况研究,提供静态的、瞬时的即某一时点的观察信息。19前瞻性研究(prospectivestudy)又称组群研究(cohortstudy)。把范围明确的人解分为两组,一组暴露于某因素之下,另一组不暴露,用一段时间观察两组的发病(死亡)率,进行比较。即由因寻果。20回顾性研究(retrospectivestudy)又称病例对照研究(case-controlstudy)。要求选好有代表性的病例组,同时设立对照组。两组对象用同样方法回顾有无暴露于某因素及暴露程度,然后统计研究,寻找疾病与原因联系,即由果找因。21举例例:研究孕妇妊娠期服用塞利多米,与婴儿四肢缺失之间是否有关。回顾性研究前瞻性研究a-苯肽茂二酰亚胺,反应停22实验设计三要素实验因素:实验对象:人、动物、细菌、细胞实验效应:23实验设计三原则在“有利条件”下获得实验结果在排除非干预措施因素的影响后,推论干预措施的因果效应Fisher三原则:重复、对照、随机化24实验设计原则:重复样本量:有一定数量的重复观测结果。也叫样本容量、样本含量样本量不能太多,不能太少直接影响结论的可靠性、可行性、控制难度;“够用”的问题:必须考虑,样本量的估计很重要。25原始计量资料26实验设计原则:对照基于未“暴露”因素上的“暴露”因素的效应前后对照;平行对照;除“暴露”因素外,其他非暴露因素应基本相同,使暴露因素具有科学性;随机对照;非随机对照;27对照-常用的干预方式空白对照实验对照:假干预对照安慰剂对照:单盲、双盲、三盲标准对照28实验设计原则:随机化分组时,每个观察对象具有相同的概率被分到实验组/对照组,主要作用:保证各种已知/未知的特征在各组均衡性;避免主观愿望破坏各组均衡性;是所有统计假设检验推论结果的基础29常用随机分组方法完全随机的实验设计:P23,例2-5由随机数据表附15配对实验设计:P19,图2-3、2-4随机区组的实验设计:P167,例11-3拉丁方试验设计:双重局部控制,精确度最高正交试验设计:L4(23)多、快、好、省。ABBA2×2ABCBCACAB3×330三、统计资料的类型
三种基本类型:计量资料、计数资料、等级资料
基本概念:变量、变量值 研究者对每个观察单位的某项特征进行观察和测量,这种特征称为变量,变量的测得值叫变量值(也叫观察值),称为资料。*按变量值性质——定量资料和定性资料。311.计量资料
得到的资料是每一个观察单位的某项研究指标的量的大小。例如:体重、身高、血压等。特点:a.
有度量单位
b.多为连续性数据
c.往往通过测量得到32将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。如患病人数、A型血型的人数等。特点: 无度量衡单位 为间断性资料 通过记数得来
2.计数资料33介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。特点:每一个观察单位没有确切值各组之间有大小、程度上的差别。3.等级资料34(二)三类数据间的关系
例:一组2040岁成年人的血压以12kPa为界分为正常与异常两组,统计每组例数
<8低血压
8
正常血压
12
轻度高血压
15
中度高血压
17
重度高血压定量数据等级数据定性数据(三)三类数据的编码与计算(1)
例:一组2040岁成年人的血压以12kPa为界分为正常(=0)与异常(=1)两组,统计每组例数
<8低血压418
正常血压102
12
轻度高血压13315
中度高血压164
17
重度高血压185定量数据等级数据定性数据医学论文中的统计资料错误令人惊讶的资料表达:在一个96孔板上做实验。板上每行有12个孔。在某个孔中加入某细胞液,再加入一种特定药物,观察其反应。若反应为阳性,记为“1”;若反应为阴性记为“0”。得实验结果如下:(仅给出前3组)第1组:0,0,0,0,0,0,1,0,0,0,0,0第2组:0,0,1,0,0,0,1,0,0,1,0,0第3组:0,1,0,0,1,0,1,0,0,1,0,1
表达结果如下:第1组:0.083±0.289第2组:0.250±0.452第3组:0.417±0.51537四、统计学中的几个基本概念1、同质与变异2、总体与样本3、普查与抽样4、参数与误差5、频率与概率(小概率事件)
381.同质与变异
同质(homogeneity)
指事物某方面的性质、影响条件或背景相同或相近变异(variation)
同质个体间的差异。来源于一些未加控制、或无法控制的、甚至不明原因的因素,是统计学存在的基础从本质上说:统计学就是通过对个体变异的研究,揭示同质事物的本质特征与规律
39总体---参数(parameter)
根据研究目的确定的研究对象的全体,即性质相同的所有观察对象的集合;分为有限总体和无限总体样本---统计量(statistics)
总体中的部分;研究对象总体与样本的关系
统计学解决的问题:正确从样本特征推测总体水平抽样:从总体中选择样本的过程
样本量(samplesize):样本所包含的个体数目2.总体与样本402.总体与样本参数:总体统计学特性的数字,包括总体均数、总体方差、总体标准差;大多数得不到总体数据,参数是未知的估计总体结果是统计学的目的之一413.普查与抽样普查:全面调查,根据研究目的确定总体,如人口普查、肿瘤普查是社会学/卫生防疫的指标确定的依据注意时效性、变化性传染病报告制度,地震伤亡等都属于普查423.普查与抽样选择样本的方法:概率抽样和非概率抽样等概率抽样非等概率抽样单纯随机抽样系统抽样分层抽样整群抽样43概率抽样、非概率抽样概率抽样:每个对象被抽中的概率是已知/可计算的,其样本统计量是参数估计和计算误差的基础;等概率抽样:随机抽样不等概率抽样:多单位被抽取的概率不同,可能会得到更有效的估计量非概率抽样:抽样概率未知/无法计算,按主观、有目的、为方便进行抽样;不能计算抽样误差,或一般按简单随机抽样计算误差。配额抽样、滚雪球/识别抽样44A单纯随机抽样 *将调查总体的全部观察单位编号,*用抽签法或随机数字表法进行抽样。*它是最基本的抽样方法,也是其他抽样方法的基础。45B系统抽样
*按照一定顺序机械地每隔若干个单位抽取一个单位,又称机械抽样、等距抽样。*其抽样间隔=(总体数量/样本含量),一般是随机找一个单位为起点,以后按抽样间隔进行抽样。46C分层抽样 *先将总体中所有观察单位按主要特征(如年龄、性别、病情轻重等)分为若干层次*在各层次中进行随机抽样*要求层内个体差异越小越好,层间差异越大越好
*优点是抽样误差小,不同层可采用不同抽样方法,各层可独立进行分析47D、整群抽样整群抽样不是按个体进行抽样,而是抽取由个体组成的群体的抽样方法。如抽取的是该地区若干个县的全体居民。整群抽样的主要持点是以“群”为基本抽样单位。抽样误差由小到大的依次为:
分层抽样<
系统抽样<
单纯随机抽样<
整群抽样。484.误差误差:统计上泛指测量值与真值之差,样本指标与总体指标之差。主要有二种:系统误差和随机误差(随机测量误差,抽样误差)。(1)系统误差:指数据搜集和测量过程中由于仪器不准确、标准不规范等人为原因,造成观察结果呈倾向性的偏大或偏小。
特点:具有累加性、方向性、可避免性(2).随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。
特点:无方向性、不能避免。49
在消除了系统误差的前提下,由于非人为的偶然因素,对于同一样本多次测定结果不完全一样,结果有时偏大有时偏小,没有倾向性,这种误差叫随机测量误差。
特点:没有倾向性,多次测量计算平均值可以减小甚至消除随机测量误差。A、随机测量误差50
由于抽样原因造成的样本指标与总体指标之间的差别。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度物联网安全托管服务合同
- 2024年度网络游戏运营许可合同标的分析
- 2024年度盐碱化土地改良承包协议
- 04年企业信息化建设项目实施与服务合同
- 《公平正义的关系》课件
- 2024年度版权许可合同:音乐作品版权许可使用2篇
- 2024年度广告发布合同(标的:某品牌全年广告宣传)
- 2024年度甲方委托乙方进行市场调研的咨询服务合同
- 2024年度地暖垫层工程合同管理与协调合同
- 自然人借款合同标准
- 《世界遗产背景下的影响评估指南和工具包》
- 学校开展减盐减油减糖活动方案
- 川2020G145-TY 四川省超限高层建筑抗震设计图示
- 《夏洛的网》之“生命的价值”论文
- 2023年成都铁路局招聘笔试参考题库附带答案详解
- 小学信息技术教案《认识键盘》
- 定单确认表模板
- 房地产企业税金计算表
- 骨科DRG付费方式下编码临床应用培训(骨科)
- 电气改造工程施工方案施工组织设计
- 保理业务流程梳理成熟版
评论
0/150
提交评论