医学统计学第四章_第1页
医学统计学第四章_第2页
医学统计学第四章_第3页
医学统计学第四章_第4页
医学统计学第四章_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学第四章第一页,共六十五页,2022年,8月28日4.1研究设计的意义医学研究的基本过程合理的研究方案所要求的基本过程大致可分为以下六个阶段

制定研究目的,建立专业假设←┐

↓∣②查阅文献资料向↓更③制定实验设施高↓的④实施实验设计阶↓段统计分析实验结果│

↓∣发表研究成果,评价以上假设-┘

第二页,共六十五页,2022年,8月28日4.1.2研究设计的意义

医学研究设计是根据特定的研究目的,对一项医学科学研究的全过程,包括资料的搜集、整理和分析等,作科学地、有效地和周密地计划和安排,从而保证研究工作顺利地进行。第三页,共六十五页,2022年,8月28日研究设计包括:专业设计:完成课题的专业思路、技术路线与方法的确定

保证研究课题的科学性、先进性和实用性第四页,共六十五页,2022年,8月28日2.统计设计:保证研究课题的经济性和可重复性

统计设计意义:用较少的人力、物力、时间等,得到较为可靠的结果;能合理地控制实验误差并对其进行估计,保证了实验结果的可靠性和可重复性;能使多种实验因素包括在很少的实验之中,提高实验的效率

.第五页,共六十五页,2022年,8月28日4.1.3实验与调查医学科学研究通常按照在研究过程中对研究对象是否进行干预分为两大类:调查研究:不干预实验研究:干预第六页,共六十五页,2022年,8月28日调查调查所观察的个体只受许多环境条件的影响,它们处于没有人为干预的自然状态

如:调查某地7岁男孩的平均身高调查的目的:在于了解某一事物的实际状况全面调查(普查)与抽样调查第七页,共六十五页,2022年,8月28日实验研究实验研究:将一组随机抽取的实验对象随机分配到两种或多种处理组,观察比较处理因素的效应(或结果)

如:要研究某强化食品对7岁男孩身高的影响在实际工作中,习惯上将以人为对象的实验,称为试验,如临床试验、现场试验等

第八页,共六十五页,2022年,8月28日4.2实验研究的特点研究者能人为设置处理因素受试对象接受何种处理因素的水平是经随机分配而定的实验研究能使比较组间具有较好的均衡性实验研究设计能使多种实验因素包括在较少次数的实验中,更有效地控制误差,达到高效的目的第九页,共六十五页,2022年,8月28日4.3实验研究中的基本要素实验研究的基本要素是处理因素、受试对象和实验效应

例如:“补阳还五汤对大白鼠血脑屏障影响的实验研究”课题中,补阳还五汤是处理因素,大白鼠是受试对象,血脑屏障变化是实验效应第十页,共六十五页,2022年,8月28日4.3.1处理因素处理因素:一般是指外加于受试对象,在实验中需要观察并阐明其处理效应的因素若一次实验中只研究一个因素对实验指标的影响,称为单因素试验

若一次实验中要研究两个或多个因素对实验指标的影响,称之为多因素试验第十一页,共六十五页,2022年,8月28日实验设计时应注意:

1)抓住实验中的主要因素

据研究目的确定几个主要的,带有关键性的因素

2)明确处理因素与非处理因素

非处理因素虽然不是研究因素,但由于其中有些会影响实验结果,产生混杂效应,所以非处理因素又称混杂因素(confounding)。

例如:两种降压药治疗高血压病人的试验,非处理因素有年龄、性别等。第十二页,共六十五页,2022年,8月28日3)处理因素应标准化处理因素标准化就是保证处理因素在整个实验过程中始终如一,保持不变

例如:若实验因素是药物,则应当在科研全过程使用同一批药物,以防批间差异干扰实验结果第十三页,共六十五页,2022年,8月28日4.3.2受试对象受试对象:是指被处理因素作用的对象实验研究按受试对象可分为动物实验和人体试验我国首批艾滋病疫苗人体实验志愿者

第十四页,共六十五页,2022年,8月28日1)动物选择

研究课题不同对动物的要求也往往不同第十五页,共六十五页,2022年,8月28日2)病例选择

病例选择最基本的要求是正确诊断、正确分期以及对病情的正确判断。还要求病人知情同意,依从性好。第十六页,共六十五页,2022年,8月28日4.3.3实验效应(effect)实验效应:是指受试对象接受实验处理后所出现的实验结果,通常由人或动物相应的各项指标来反映

第十七页,共六十五页,2022年,8月28日对观察指标的要求为:1)关联性:实验所选用的指标应与研究目的有本质的联系,这种联系即指标的关联性。如不能以心电图作为心脏收缩力的指标;若欲了解心脏泵血功能,应该选择心排血量(L/min)或心脏指数(L/(min.m2))作为指标第十八页,共六十五页,2022年,8月28日2)客观性

指标数据是由仪表指示的叫做客观指标;如心电图,血压,血细胞自动计数等。第十九页,共六十五页,2022年,8月28日指标数据是由观察者或受试对象根据主观感受程度判定的称为主观指标。

例如中医的望、闻、问、切是靠受试者的回答和观察者的感受加以判断第二十页,共六十五页,2022年,8月28日3)灵敏性

指标的灵敏性是增强实验效应的一个重要方面

指标的灵敏性通常是由该指标能正确反映的最小数量级或水平来确定4)精确性指标的精确性是指指标的准确度和精密度第二十一页,共六十五页,2022年,8月28日混杂因素(简称混杂,confounding)

常见的控制方法将混杂因素作为一个实验条件来控制,即把它控制在不起作用的水平上或使各组处于同一水平上平衡法

混杂因素对试验组和对照组的影响是平等的3.转为实验因素

有时将明显的混杂因素就作为一个实验因素来对待

第二十二页,共六十五页,2022年,8月28日4.4实验设计中的基本原则实验设计应遵循的基本原则:对照原则、随机化原则和重复原则这三个原则最早由英国统计学家R.A.Fisher于1935年提出

第二十三页,共六十五页,2022年,8月28日4.4.1对照(control)原则有比较才有鉴别,对照是比较的基础,是基本原则中的首要原则吃黄金搭档一年,小孩长高了5CM,起效了?第二十四页,共六十五页,2022年,8月28日设立对照组是控制各种混杂因素的基本措施,只有设立对照才能将处理因素的效应充分现露出来设计对照组的过程中应考虑以下几方面与处理组之间均衡1)受试对象条件要一致2)实验条件要一致3)研究者或操作者对各组的观察、操作要求应一致,最好是同一人员4)实验的时间和顺序应一致第二十五页,共六十五页,2022年,8月28日合理的对照还要求对照组与实验组的样本含量尽可能相等或接近,这样实验的效率最高第二十六页,共六十五页,2022年,8月28日盲法:(1)单盲(singleblind)法:受试对象不知道自己分到哪一组第二十七页,共六十五页,2022年,8月28日(2)双盲(doubleblind)法:在临床试验中为避免病人心理影响或医生评估处理效应的主观偏性,而采用“双盲法”,即受试对象和结果判定人员(实验执行者)都不知道研究对象属处理组还是对照组。

第二十八页,共六十五页,2022年,8月28日(3)三盲(tripleblind)法受试对象、实验执行者和统计分析人员均不知道受试对象分在哪一组第二十九页,共六十五页,2022年,8月28日对照的种类按时间来分,对照可分为历史对照和同期对照

历史对照:是以本人过去的研究或他人的研究结果作为对照

标准对照:是指以标准值或正常值作对照,而不专门设对照组

第三十页,共六十五页,2022年,8月28日2.按实验对象来分,可分为自身对照和实验对照

自身对照:是指对照和处理在同一对象身上进行

实验对照:是指对照组和处理组的对象在某种有关的实验条件下进行观察

3.按对照组接受的处理不同来分,又可分为空白对照和相互对照

空白对照:是指不施加任何处理的“空白”条件下观察的对照相互对照:则指各实验组间互为对照,即对照组也施加了某种处理第三十一页,共六十五页,2022年,8月28日4.4.2随机化原则什么是随机化?

在抽样研究中是指总体中每个个体都有相等的机会被研究者抽取为样本;在实验研究中是指每种处理都有相等的机会分配给某个实验对象以及各比较组的实验顺序要无人为因素的影响。随机化是保证非处理因素组间均衡一致的另一重要手段

第三十二页,共六十五页,2022年,8月28日实验设计中随机化所起的作用为:避免主观因素的参与;打破原来实验对象排列的系统性,以控制系统误差;对于实验中一些意想不到的因素起平衡作用;它是统计推断的基础随机化的工具与随机化方法,常用的随机化工具有硬币、赌具(如骰子),随机数字表,随机排列表以及计算机(器)伪随机数发生函数等第三十三页,共六十五页,2022年,8月28日4.4.3重复原则重复的两层含义

(1)是指各处理组及对照组的例数(或实验次数)要有一定的数量,即要求有一定的样本含量

(2)实验结果的可靠性应经得起重复实验的考验

因为实验对象之间的变异总是存在的.是不是重复越多越好呢?确定样本含量在事先给出一些参考值下,可通过公式计算或查表法确定第三十四页,共六十五页,2022年,8月28日4.5研究设计的常见类型4.5.1完全随机化设计

基本概念:将实验对象完全用随机的方法分配到各个处理组或对照组中,以进行实验观察;或分别从不同的总体中随机抽样进行对比观察的一种设计方法,称之为完全随机化实验设计

随机化分组的方法:较为常用的是查随机排列表

第三十五页,共六十五页,2022年,8月28日【例4.1】设有小白鼠15只,试用随机排列表将它们分成3组。动物编号123456789101112131415随机数字32611381409115410712归组AABACBCABCBACBC第三十六页,共六十五页,2022年,8月28日完全随机化设计的优缺点优点:本设计方法简单、灵活、易理解,处理数以及重复数都不受限制,这样可以充分利用全部试验单元;统计分析也较简单;样本例数的估计较简单;如果某个实验对象发生意外,信息损失小于其它设计,对数据的处理影响不大缺点:实验误差往往偏高,精确度较低。所以该设计一般只用于实验对象同质性较好的试验。第三十七页,共六十五页,2022年,8月28日4.5.2配对设计概念将那些个体之间的差异较小的研究对象配成若干对子,每对中的两个对象用随机的办法分配给相应的处理组和对照组配对设计保证了非处理因素对处理组和对照组的干扰尽可能相同或相近第三十八页,共六十五页,2022年,8月28日动物实验:常将同种属、同窝别、同性别等组成对子临床试验中,常将性别相同,年龄、职业相近,病情、病型(期)等相同或相近的两个病人配成对子第三十九页,共六十五页,2022年,8月28日2.随机化分组方法【例4.2】若有16只大白兔,已按性别相同,体重相近等要求配成8对,试将这8对兔子随机分至甲乙两组之中。表4.28对大白兔随机分入甲乙两组

兔子编号1.11.22.12.23.13.24.14.25.15.26.16.27.17.28.18.2

随机数字12037456

第四十页,共六十五页,2022年,8月28日3.优缺点降低实验误差,提高实验的精确度外,它还可以扩展到空间、时间诸方面配对条件不能过多、过严配对设计常见的几种类型:(1)异体配对:将条件相同或相近的实验对象配成对子,然后采用随机化方法将对子分配到各组(2)前后配对:同一对象实验前后(或治疗前后)进行比较(3)自身配对:同一样品采用不同的方法处理(4)左右配对:同一个体左右两侧的器官或组织,一侧施加处理因素,一侧给予对照物第四十一页,共六十五页,2022年,8月28日4.5.3随机区组设计

本设计首先是在农业试验中提出来的,认为小麦的产量不仅受其品种(处理)的影响,还受田块(区组)的影响。因此,将每个田块再分成几个单元,每个单元所接受的处理(如不同品种的小麦)是随机的,这样的设计既可分析处理的作用,也可分析田块的影响,提高了试验效率。

第四十二页,共六十五页,2022年,8月28日4个小麦品种(A、B、C、D)比较试验的随机区组设计田间试验排列

第四十三页,共六十五页,2022年,8月28日概念:将相同或相近特征的实验对象按处理数的多少(比如是k个)归为一个区组。至于同一区组内每个实验对象接受何种处理,则是随机的。可见,本设计是配对设计的一种扩展,当k为2时,本设计就是配对设计.第四十四页,共六十五页,2022年,8月28日设计方法:首先设置“区组”,将性质相同或相近的实验对象归为一个区组,每个区组的例数就是处理组数;再将区组随机化,即各区组内的实验对象用随机化的方法,决定它们被分到哪一个处理组中。第四十五页,共六十五页,2022年,8月28日【例4.3】

现假设已按动物的基本特征设置好了6个区组,每个区组各有4个动物,如何进行随机化分组?表4.324头动物区组内随机化分配结果动物编号123456789101112131415161718192021222324

随机数字143212432143324132143214

处理ADCBABDCBADCCBDACBADCBAD第四十六页,共六十五页,2022年,8月28日3.优缺点:误差减低,均衡性好,可以提高效率,统计分析也较简易不能分析交互作用;区组内的观察对象发生意外,整个区组只好放弃或者不得已而采取缺项估计

第四十七页,共六十五页,2022年,8月28日4.6常见的抽样方法抽样调查的四个优点:费用较少;2.速度较快;3.覆盖面较大;4.正确性较高

第四十八页,共六十五页,2022年,8月28日4.6.1单纯随机抽样若总体内每个单元被选为样本的概率相等的抽样称为单纯随机抽样抽样方法

:将总体内的全部观察单位编上号码,再用随机数字表、电子计算器随机数字键等随机化工具选出进入样本的号码,已经入选的号码不能再次列入,直至达到预定的样本例数为止第四十九页,共六十五页,2022年,8月28日【例4.4】欲了解某乡村居民钩虫感染率情况,该村共有居民2000人,试用单纯随机抽样方法抽取样本例数100人作为样本。

(1)编号:1-2000(2)查随机数字表:随意确定一起点和走向,譬如说第6行第一个数字开始,依横向抄录100组随机数字,每组为4个数字,凡后面出现与前面有相同的数字者弃去,它们是1622,7794,3949,…,8845。凡首位数字≥8者减8,≥6而<8者减6,≥4而<6者减4,≥2而<4者减2,<2者不变第五十页,共六十五页,2022年,8月28日2.优缺点:优点:是当总体内观察单位数与样本例数都不大时比较容易实施,均数(或率)及其标准误的计算也较简便。缺点:在总体含量较大时,实际上难以采用;在总体内各单元的变异大而样本又小时,样本的代表性较差3.适用范围:只适用于总体内个体间差异均匀的小型调查和实验室研究第五十一页,共六十五页,2022年,8月28日4.6.2系统抽样(间隔抽样、机械抽样)1)抽样方法:首先必须确定总体的范围和样本例数,将总体内的观察单位依次编号;然后确定抽样比,即确定从每多少个单元(设为k个,k=总体中所有个体数/样本例数)中抽一个单元进入样本。至于究竟抽其中第几个,则必须用随机化的方法决定。具体做法是在1至k个数中,随机选出一个数,把它做为起点,以后依次用相等的间隔,机械地从每k个单元中抽一个观察单位,组成样本第五十二页,共六十五页,2022年,8月28日【例4.5】欲了解某小学学生肠道蛔虫感染情况,要求检查学生大便蛔虫卵试验的阳性率,该样有学生1200人,试按系统抽样法抽取一例数为120人的样本。此例中总体例数为N=1200,样本例数n=120,抽样间隔k=N/n=10,先将该校所有学生依次编号为1到1200,再在1-10之间确定一个随机数,比如为6,于是,以学生编号为6,16,26,…,1196者组成样本。

第五十三页,共六十五页,2022年,8月28日(2)优缺点优点:易于理解,简便易行,容易得到一个按比例分配的样本。其抽样误差一般小于单纯随机抽样。缺点:当总体内观察单位按顺序有周期性或单调递增(或递减)趋势时,系统抽样将产生明显的偏性;目前,尚无可靠的统计方法来估计其抽样误差,在实际工作中,一般可按单纯随机抽样来处理。第五十四页,共六十五页,2022年,8月28日【例】若一个班50人,学号是按照其入学成绩从高到低排列的。为研究入学平均成绩,从中抽取5人。若抽取的是学号为1,11,21,31,41的同学,显然其平均成绩会高于全班平均成绩;若抽取的是学号为9,19,29,39,49的同学,显然其平均成绩会低于全班平均成绩。第五十五页,共六十五页,2022年,8月28日(3)适用范围事先对总体内的个体分布有所了解,并且该分布就是随机的,这样才能最恰当地应用系统抽样;在多阶段抽样(见其他统计专著)中,用于后阶段抽样;在分层抽样中,每层可独立使用系统抽样。第五十六页,共六十五页,2022年,8月28日4.6.3分层抽样抽样方法:在抽样过程中,将总体按某种特征划分为若干个组别、类型或区域等次级总体(统计中称之为“层”),先从每层内独立抽取一个随机样本,再合成为总体的一个样本,这种方法称之为分层随机抽样

每层具体抽样方法可以不同第五十七页,共六十五页,2022年,8月28日【例】研究人群的人均消费。先将人群按收入高低分层,然后分别从各层中独立抽取。中等收入N2n1n2n3高收入N1低收入N3第五十八页,共六十五页,2022年,8月28日3.各层中抽样数的确定(1)各层采用相同的抽样比比例分配:ni=n(Ni/N)(2)各层采用不同的抽样比最优分配一般原则:从内部变异小的层少抽

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论