医学统计学总结课件_第1页
医学统计学总结课件_第2页
医学统计学总结课件_第3页
医学统计学总结课件_第4页
医学统计学总结课件_第5页
已阅读5页,还剩93页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 医学统计学总结童新元 中国人民解放军总医院前言归纳方法是由个别到一般的方法。我们学习、工作、生活中的归纳总结法就是统计学的应用。主要的内容统计学总复习医学统计课考试的有关内容 第一部分 医学统计学总复习开设医学统计学课程的目的1 培养统计思维与逻辑思维的能力2 培养讨论交流协作的精神 3 将统计学应用于科研和临床工作现代统计学的新观念统计学是对不确定性问题做决策的科学。从哲学角度看,统计学是从个性中寻找共性,透过偶然现象看事物内部本质规律的一种方法和手段。“统计学既是一门科学也是一门哲学。”现代统计学的基本内容 一、试验设计 二、数据管理 三、统计分析实验设计临床试验设计调查研究设计数据管理

2、质量控制统计描述统计推断1)误差及其来源观察值(实际值)与真实值(理论值)之差称之为误差(error)。误差的来源由于生物个体的变异性等原因使得误差在医学领域中广泛存在,误差有三个来源: 1)过失误差 2)系统误差 3)随机误差不同的误差应采取不同的方法进行处理。2)研究设计的类型在医学研究中,根据观察者是否主动施加干预而分为两类:干预研究设计(实验研究)调查研究设计 (观察研究)干预研究设计的类型实验研究设计临床试验设计3) 试验设计的三要素1)、试验因素2)、试验对象3)、试验效应2、实验对象 实验对象是指接受实验因素作用的对象,亦称实验单位。 3、实验效应 实验效应 指实验因素施加于实验

3、对象后所起的作用大小。效应指标分类按效应指标的表现形式分三类:定量指标是能通过工具测量获得的具体数值的指标。如身高、体重、血压等。定性指标是表现为无不相容的类别或属性的指标。如患者结局有生存或死亡。 等级指标是表现为有顺序等级的类别或属性的指标。如治疗效果全愈、好转、不变、恶化。 4) 实验设计的三原则 随机对照重复1、随机化(randomization)随机化就是在抽样或分组时必须做到使总体中任何一个个体都有一定(相同)的机会被抽取进入样本,以及样本中任何一个个体都有一定(同等)机会被分配到每个组中去。随机化方法怎样进随机化是试验设计的重要内容,常用的方法有两种:用查随机数字表;用计算机随机

4、化程序。注意:随机不是随意对照的方式空白对照安慰剂对照标准对照自身对照相互对照试验对照历史或中外对照*3、重复重复是指具有相同处理的实验对象不止一个。一. 调查方法根据调查的范围和调查对象的选择方式可分为:普查抽样调查 1普查(overall survey)亦称全面调查(complete survey),将组成总体的所有观察单位全部加以调查如我国人口普查等。普查一般都是用于了解总体某一特定“时点”的情况,如年中人口数、时点患病率等。2抽样调查(sampling survey)抽样调查是从总体中随机抽取一定数量的观察对象组成样本,用样本信息推断总体特征。二. 抽样方法简单随机抽样(simple

5、random sampling)系统抽样(systematic sampling)分层抽样(stratified sampling)整群抽样(cluster sampling)简单随机抽样 P10简单随机抽样亦称单纯随机抽样要求每个观察对象有同等概率被选入样本。从有N个观察单位中抽取m个观察单位方法: 先将N个观察单位编号,并且每个赋一个随机数。再将N个随机数排序,前m个随机数对应的观察单位编号即为所抽取。优缺点 简单随机抽样是最基本的抽样方法,优点是均数(或率)及其标准误的计算简便,缺点是当总体例数较多时,实施抽样比较困难。适用于小型调查。系统抽样系统抽样又称等距抽样或机械抽样。方法是按照一

6、定顺序,机械地每隔若干个观察单位抽取一个观察单位组成样本。 例如:要从1000户中抽取100户作样本,可先在门牌号1 10号之间随机抽取一户(假定为第5号住户),其后每间隔10号抽取一户,即抽取5、15、25、35、995,共100户组成样本。抽样间隔=总数/样本含量整群抽样先将总体划分为个群,每个群包括若干个观察单位,再随机抽取t个“群”(kt),并将被抽取t个群的全部观察单位组成样本。例如:要检查某学校学习情况时,随机抽取几个班,对几个班的全部同学进行考查。分层抽样先按影响观察值变异较大的某种特征,将总体分为若干层(strata),再从每层内随机抽取一定数量的观察单位组成样本(样本含量为n

7、)又称分类抽样。优缺点 抽样误差比较小;先要将总体分层,层内个体差异越小越好,层间个体差异越大越好,便于对不同的层采用不同的抽样方法。6) 试验设计个重要问题1)样本含量的估计和检验效能2)随机化分组1、完全随机分组设计如果将受试对象完全随机地分配到每一个组中,各组分别接受不同的处理。这样的设计分组称为完全随机分组设计。2、 配对设计配对设计是将受试对象按某种相近的特征或条件配成对子,从而减少误差,提高效率。配对设计可分为两种:同源配对非同源配对3、 配伍组设计如果实验因素有G个水平组,事先将受试对象按某种重要的非实验因素进行分组,即配伍组或区组(block)设计。每个区组内有G个实验对象,采

8、用完全随机地分配,每个实验对象接受一种不同的处理称为配伍组分组,亦称随机区组设计。 二、数据管理数据管理质量控制数据结构一)原始数据结构CHISS建立的数据库是二维关系数据库,它把各种指标变量和数据描述成一个二维表,在水平方向的每一行为一个记录,在垂直方向的每一列为一个列, 每一列的内容有相同的属性(列名、类型和列长度等),不同的列属性相互独立。学号班级性别统计英语200211男9086200222女9590200232女9894200243男7880200251男10075200263女8080200271男9586 某校学生的成绩资料 二) 分组列数据结构CHISS另一种建立的数据库是分组

9、列数据结构,把每一组示为一列.每一列的内容有两种属性。统计教科书中大多采用列分组数据结构方式。例 用某药治疗糖尿病10病,测得其治疗前和治疗后2个月的空腹血糖值如下: 疗前 疗后 9.1 9.3 10.1 8.5 9.7 9.7 10.3 7.7 11.3 7.8 .例 三批甘蓝叶样本分别在甲、乙、丙、丁四种条件下测量核黄素浓度,试验结果如表。问四种条件下的测量结果的差异是否具有统计学意义? 甘蓝叶核黄素浓度(gg) 测 量 条 件 批次 甲 乙 丙 丁 1 27.2 24.6 39.5 38.6 2 23.2 24.2 43.1 39.5 3 24.8 22.2 45.2 33.0 三)统计

10、量数据结构CHISS另一种建立的数据库是统计量数据格式,教科书常只给出加工整理后的统计量,如例数,平均,标准差,四格表数据等。 三、统计分析统计描述统计推断 通过统计描述不仅可以对数据的概貌、分布、特征及变量间的关系有大致的了解,而且可发现数据中的异常现象。因此,统计描述在数据统计分析中是必不可少的。 1 统计描述 均数、中位数, 标准差 统计量 率、构成比 相关系数,回归系数统计表统计图 条图、直方图、园图、线图等统计描述的方法 均数是将各观察值相加,除以观察例数所得。标准差 为观察值的离均差平方和除以自由度的开平方。变异系数 记为CV。是标准差与均数之比,用百分数表达。 正态分布统计量几何

11、均数 是将各观察值相乘,开例数n次方根. 中位数 n个观察值由小到大排列,居中间位置的观察值就是中位数,记为Md四分位数间距 四分位数间距是上四分位数与下四分位数之差,即QR=QUQL。 偏态分布统计量几何均数适合于等比级数的资料,平均增长速度、传染病发病的平均潜伏期和呈正偏态分布的资料。中位数用于偏态分布的资料和包含信息不全的资料。 实际应用时,非正态的计量资料,常要求用中位数与四分位距共同描述资料的集中和离散程度。 率-用来说明随机事件发生的频率或强度大小.构成比-用来说明某一事物内部构成部分的比重 . 注意率与构成比的区别. 分类指标的统计量 用样本的信息来推断总体的特征叫统计推断. 统

12、计分析的主要目的是由样本推断总体。故统计学的主体是统计推断2 统计推断 参数 点估计 估计 区间估计 统 u检验 计 参数 t检验推 假设 F检验断 检验 直线相关与回归 卡方检验 非参 秩和检验 中位数检验 等级相关参数估计点估计区间估计注意: 95%CI与95%正常值范围区别.95%的正常值范围:95%CI:假设检验假设检验的思想第I类和第II类错误的概率 t 检验的回顾 -t 检验的条件2、什么样的资料进行t 检验?1、 t 检验中考虑了几个因素、几个水平? t 检验的条件1、只有一个试验因素且只有2水平时的试验效应为定量的指标;2、正态性; 不满足正态性 1、 变换 2、非参数检验3、

13、方差齐性; 不满足方差齐性用t 检验t检验t检验亦称studentst检验,应用t检验条件:1)单因素两水平的定量效应指标;2)要求各组正态分布;3)要求方差齐性.如不满足条件,当满足正态性而方差不齐时可进行t检验,否则需采用变换或非参数方法作统计分析。 t检验的类型主要用于下列三种情况:(1) 样本均数与总体均数比较;(2) 配对数值变量资料的比较;(3) 两样本均数的比较。CHISS的实现统计统计推断t检验注意三种不同的数据结构:(1)原始数据的两组的数据结构;(2)分组变量与效应变量的数据结构;(3) 已知均数的数据结构。 F 检验的回顾 -F 检验的条件2、什么样的资料进行F 检验?1

14、、 F 检验中考虑了几个因素、几个水平?F检验F检验亦称方差分析,应用F检验条件:1)单因素或多因素定量效应指标;2)要求各组正态分布;3)要求方差齐性.如不满足条件,需采用变换或非参数方法作统计分析。 F检验的类型(1) 完全随机设计及其方差分析;(2)配伍组设计及其方差分析;(3)拉丁方设计及其方差分析;(4)交叉设计及其方差分析(5)析因设计及其方差分析; 方差分析的思想完全随机分组设计:1)两个重要的等式:SSTSSBSSW dfTdfBdfW2)两个重要的关系 MS=SS/df F=MSB/MSW方差分析的思想随机区组设计:1)两个重要的等式:SS总SS处SS区SS误dfTdf处df

15、区df误2)两个重要的关系 MS=SS/df F=MSB/MSW填表变异SSDFMSFP总AB误差 方差分析表来源 SS DF MS F值 P值 处理组 SS处理 k-1 MS处理 MS处理/MSW区组 SS区组 b-1 MS区组 MS区组 /MSW误差 SS误差 n-k-b+1 MS误差总计 SS总 n-1 CHISS的实现统计统计推断F检验或线性模型注意二种不同的数据结构:(1)分组变量与效应变量的原始数据结构;(2) 已知均数的数据结构。 非参数 检验的回顾 -非参数检验的条件什么样的资料进行非参数检验?非参数检验非参数方法应用的条件:定量效应如不满足正态分布或分布不明确时,等级效应的数

16、据.非参数检验的类型(1)配对设计的wilcoxon符号秩和检验; (2)两样本的wilcoxon秩和检验;(3)多个样本的Kruskal-Wallis秩和检验;CHISS的实现统计统计推断非参数检验 卡方 检验的回顾 -卡方 检验的条件2、什么样的资料进行卡方 检验?1、卡方 检验中考虑了几个因素、几个水平?卡方检验定性无分类效应指标的分析CHISS的实现:统计统计推断双向无序列联表应用条件:研究两个定量变量间的相互关系。 直线相关与回归分析 y 。 。 。 。 。 。 。 。 。 X 散 点 图线性相关 线性相关是用相关系数r来表示两个变量X,Y间的直线关系。 相关系数r的计算公式 相关系数r没有单位, 在-1+1范围内波动, r0,正相关,r85分 208570分 7570分 5统计学与用虽然医学统计的教学结束,但统计的应用即将开始, 在未来的医学科研中,希望同学们多从统计角度考虑问题,.用好统计学最重要。当做论

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论