版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第十三章 医学研究的统计学设计郭 艳中山大学公共卫生学院E-mail: 医学研究医学研究 干预性研究 (Interventional study) 实验研究 (Experiment) 临床试验 (Clinical trial) 观察性研究 (Observational study)2医学研究的设计医学研究的设计专业设计:从专业角度考虑选题、研究对象和技术方法统计学设计: 对象、 因素、 指标、 研究类型、 统计方法、 样本量估算 3第一节 研究设计的基本要素 研究概况 研究对象 研究因素 结局指标 调查表5 5一、研究假说 科学研究的假说:根据已有知识作出假定性的说明和推断,有待研究予以验证。
2、 例如,关于初次分娩的主动管理政策的假说: (1) 可减少剖腹产的比例; (2) 可减少延长分娩时间的比例; (3) 并不影响产妇对分娩过程的满意度。5二、研究对象n “Eligibility criteria”: 年龄、性别、临床诊断、病情n “Exclusion criteria”:常为保障病人安全。 例如,一项有关HIV感染的临床治疗研究。n 纳入标准:符合HIV治疗指导原则; 年满18岁的成年人; 开始治疗时。n 排除标准:怀孕期和哺乳期的妇女。6三、研究因素影响结局的内外因素影响结局的内外因素n 研究因素研究因素: 实验性研究,施加于研究对象的外界干预,也称为处理 (treatmen
3、t)因素; 观察性研究,因素是自然存在的,如暴露 (exposure) 因素、危险 (risk) 因素。n 非研究因素非研究因素:混杂因素或协变量,应予控制。 动物实验:窝别、年龄、体重、营养等; 临床疗效研究:疾病分期、病理类型等。7四、结局指标结局指标结局指标 (outcome, end point)度量研究因素产生的:效应 (effect) 或反应 (response)n 主要指标 (primary outcome)和次要指标 (secondary outcome)n 客观指标和主观指标准确度 (accuracy) 、精密度 (precision)灵敏度 (sensitivity)、特异
4、度 (specificity)8五、调查表调查表调查表(form) 问卷问卷 (questionnaire) 量表量表(scale) 病例报告表(case report form,CRF) 生存质量(quality of life,QOL) 测定量表 一份量表含若干领域(domain) 一个领域含若干方面(facet) 一个方面含若干条目(item)9量表的考评n 效度(validity) 有效性和正确性 量表确实测定了所要测定的特征? 客观真实性的程度?n 信度(reliability) 可靠性 稳定性 一致性n 可接受性(acceptability) 被测定者对量表的接受程度10第二节 统
5、计设计的基本原则 对照(Control) 随机(Randomization) 重复 (Repeat) 样本含量的估算1212一、对照(Control) 医学研究多数是通过比较产生结论,对照是比较的基础 1消除非研究因素的混杂 2鉴别研究因素的效应和自然发展结果 12实验的三要素 (1) 受试对象受试对象 纳入标准和排除标准 (2) 实验因素实验因素 (干预因素) 控制重要的非实验因素 (其他) (3) 实验效应实验效应 但测得的是实验效应与其他效应之和干预因素干预因素对象对象效应效应其他其他其他效应其他效应13例:相互对照 为比较为比较A与与B:其他干预 A对象1干预A效应其他效应其他干预 B
6、对象2干预B效应其他效应14二、随机 (Randomization)n 降低系统误差的影响,贯穿于设计和实施全过程:降低系统误差的影响,贯穿于设计和实施全过程:1.样本代表性 总体中任何一个个体都有同等的机会进入样本;2.组间可比性 样本中任何一个个体都有同等机会被分配到任何一个组;3.排除实验顺序影响 样本中的任何一个个体先后接受处理的机会相同。n 随机化分组:随机化分组:使实验组与对照组在非实验因素的分布方面尽量保持均衡一致。15随机化方法n随机数字表(random number)n计算机伪随机数(pseudo random number)发生器 可重复n为保证实验的可靠性和可重复性,在实
7、验设计中所用的随机化方法、随机数及产生随机数的程序、种子数等均应有记录(备查)16常用随机抽样方法(概率抽样)常用随机抽样方法(概率抽样) 简单随机抽样简单随机抽样 系统抽样系统抽样 整群抽样整群抽样 分层抽样分层抽样1. 1. 单纯随机抽样单纯随机抽样(simple random sampling)优点优点:均数、率及其标准误计算简便。:均数、率及其标准误计算简便。 简便易行,适用小样本。简便易行,适用小样本。缺点缺点:当总体中例数多时,对观察单位进行编号不易操作,:当总体中例数多时,对观察单位进行编号不易操作,在实际工作中有时难以实现。在实际工作中有时难以实现。 方法方法:抽签,用随机数字
8、表和随机排列表,用计算机。:抽签,用随机数字表和随机排列表,用计算机。例例14-5 14-5 抽样参加夏令营活动,某班有学生抽样参加夏令营活动,某班有学生100100人,若抽取为人,若抽取为1010人参加夏令营,试作单纯随机抽样设计。人参加夏令营,试作单纯随机抽样设计。2. 2.系统抽样(系统抽样(systematic sampling) 例例14.6 14.6 欲调查某社区贫血患病情况欲调查某社区贫血患病情况, ,该社区有居民该社区有居民10001000人人, ,试按试按系统抽样方法系统抽样方法, ,抽取例数为抽取例数为100100的样本的样本. . 先将先将10001000名居民按某一特征
9、的顺序编号名居民按某一特征的顺序编号, ,N N为为1000, 1000, n n=100, =100, 抽抽样间隔样间隔1000/100=10, 1000/100=10, 在在110110之间随机确定一个数字之间随机确定一个数字, , 譬如譬如7, 7, 每每间隔间隔1010个观察单位抽取一个个观察单位抽取一个, , 即即7 7、1717、2727、 、997997组成样组成样本。本。系统抽样系统抽样优点优点1 1)易于理解,简便易行;)易于理解,简便易行; 2 2)容易得到一个按比例分配的样)容易得到一个按比例分配的样本;本; 3 3)样本观察单位在总体中分布均匀,其抽样误差一般)样本观察
10、单位在总体中分布均匀,其抽样误差一般小于单纯随机抽机抽样。小于单纯随机抽机抽样。缺点缺点1 1)当总体的观察单位按顺序有周期趋势或单调增(减)趋)当总体的观察单位按顺序有周期趋势或单调增(减)趋势时,容易产生明显的系统误差(偏倚);势时,容易产生明显的系统误差(偏倚);2 2)在实际工作中,一般按单纯随机抽样方法估计其抽样误)在实际工作中,一般按单纯随机抽样方法估计其抽样误差,但系统抽样抽取各个观察单位并不是彼此独立的,因此差,但系统抽样抽取各个观察单位并不是彼此独立的,因此抽样误差的估计只是近似的。抽样误差的估计只是近似的。3. 3.整群抽样整群抽样(cluster sampling) 先将
11、总体按照某种与研究无关的特征划分为先将总体按照某种与研究无关的特征划分为K K个个“群群”组,组,每个群组包括若干观察单位,然后抽取每个群组包括若干观察单位,然后抽取k k个个“群群”,抽取的,抽取的各个群的全部观察单位组成样本。各个群的全部观察单位组成样本。 优点优点: 便于组织、节省经费,容易控制调查质量。便于组织、节省经费,容易控制调查质量。缺点缺点:当样本含量一定时,其抽样误差一般大于单纯随机:当样本含量一定时,其抽样误差一般大于单纯随机抽样,这是因为样本观察单位不是均匀散布在总体中。抽样,这是因为样本观察单位不是均匀散布在总体中。 为降低抽样误差,可采用增加抽取的为降低抽样误差,可采
12、用增加抽取的“群群”数,减少数,减少“群群”内观察单位数的方法进行抽样,即重新划分内观察单位数的方法进行抽样,即重新划分“群群”,使每,使每个个“群群”更小。更小。4.分层抽样(分层抽样(stratified sampling) 先按对观察指标影响较大的某种特征,将总体分为若干先按对观察指标影响较大的某种特征,将总体分为若干类别,再从每一层内随机抽取一定数量的观察单位,合起类别,再从每一层内随机抽取一定数量的观察单位,合起来组成样本。来组成样本。 优点优点A A:抽样误差小于前三种,样本的代表性好:抽样误差小于前三种,样本的代表性好B B:便于对不同层采用不同的抽样方法:便于对不同层采用不同的
13、抽样方法C C:便于对各层独立进行分析:便于对各层独立进行分析 在实际调查研究中常常将两种或几种抽样方法结合起来在实际调查研究中常常将两种或几种抽样方法结合起来使用。使用。 各抽样方法的抽样误差一般是:各抽样方法的抽样误差一般是:整整群抽样群抽样 简简单随机单随机抽样抽样 系系统抽样统抽样 分分层抽样层抽样 (增加学分增加学分) 样本含量的估计的目的是在保证一定精度和检验效能样本含量的估计的目的是在保证一定精度和检验效能的前提下,确定最少的观察单位数。的前提下,确定最少的观察单位数。从抽取样本的方式分从抽取样本的方式分 概率抽样概率抽样 ( (单纯随机抽样、系统抽样、分层抽样、整群抽样单纯随机
14、抽样、系统抽样、分层抽样、整群抽样) ) 非概率抽样非概率抽样 ( (偶遇抽样、判断抽样、定额抽样、雪球抽样偶遇抽样、判断抽样、定额抽样、雪球抽样) )三、重复 (Repeat) 重复实验重复实验、重复取样重复取样、重复测量重复测量n在大量重复实验的条件下,该处理的真实效应才会比较真实地显露出来n实验组和对照组的实验单位应具有一定的数量 样本含量n与重复实验相比,重复取样和重复测量属于第二位25四、样本含量的估算n比较两组测定值的均数n比较两组发生某结局的百分比比较两组测定值的均数比较两组测定值的均数(1)预计欲比较的两总体参数的差值预计欲比较的两总体参数的差值 (2)预计总体标准差预计总体标
15、准差 (3)允许出现假阳性结果的机会允许出现假阳性结果的机会 (4)允许出现假阴性结果的机会允许出现假阴性结果的机会 单组比较:单组比较: 两组比较:两组比较:22/)(ZZN22/)(2ZZN27例:格列美脲、例:格列美脲、 格列苯脲对比研究格列苯脲对比研究(HbA1c)(1)欲检出欲检出HbA1c临床差异临床差异0.65%(2)假定标准差为假定标准差为1.3%(3)双侧检验水平双侧检验水平(4)功效功效80% 退出率退出率20%(文中:文中:152例例) 8 .156%8044.12544.12565. 03 . 1)84. 096. 1 (465. 03 . 1)84. 096. 1 (
16、4)(4 2222/ZZN28比较两组发生某结局的百分比比较两组发生某结局的百分比(1) 预计一个组发生某结局的百分比约为预计一个组发生某结局的百分比约为 1(2) 预计另一组发生某结局的百分比约为预计另一组发生某结局的百分比约为 2(3) 允许犯假阳性错误的机会允许犯假阳性错误的机会 (4) 允许犯假阴性错误的机会允许犯假阴性错误的机会 221c22122112/)1 (2)1 (2)1 (2ZZNcc29例:格列美脲、例:格列美脲、 格列苯脲对比研究(格列苯脲对比研究(HbA1c 达标达标)(1) 预计一个组发生某结局的百分比约为预计一个组发生某结局的百分比约为45%(2) 预计另一组发生
17、某结局的百分比约为预计另一组发生某结局的百分比约为25%(3) 允许犯假阳性错误的机会允许犯假阳性错误的机会 =5%(4) 允许犯假阴性错误的机会允许犯假阴性错误的机会 =20%17620. 07835. 08697. 1 25. 045. 0)45. 01 (45. 02)25. 01 (25. 0284. 0)35. 01 (35. 096. 12 25. 045. 0)45. 01 (45. 02)25. 01 (25. 0284. 0)35. 01 (35. 096. 12 )1 (2)1 (2)1 (222222122112/ZZNcc30第三节 误差控制 误差来源 偏倚的控制323
18、2一、误差来源n抽样误差抽样误差 不可避免,但有一定规律,利用统计学技术,不仅可以控制,还可估计其大小。n非抽样误差非抽样误差 1. 过失误差 2. 系统误差 又称偏倚(bias) (1) 选择偏倚(selection bias) (2) 测量偏倚(measurement bias) (3) 混杂偏倚(confounding bias)32混杂因素(confounder)n混杂因素:若某非研究因素,既与研究因素有关,又与效应有联系;研究因素与效应之间的联系可能被掩盖或歪曲, 造成混杂偏倚。 非研究因素 研究因素 效应n设计:收集混杂变量的数据n分析:采取分层分析和多元分析的技术 33二、偏倚的
19、控制n设计阶段质量控制设计阶段质量控制 1. 围绕研究目的,严密设计总体方案 2. 明确定义研究对象,正确划分观察范围 3. 正确选择观察指标和欲调查问题 4. 选择恰当的观察方式,保证数据质量 5. 预研究,试点,评估方案的可行性,及时修改研究计划 6. 规定一整套标准操作方法 (standard operation procedure, SOP)34二、偏倚的控制n资料收集阶段质量控制资料收集阶段质量控制 1. 研究人员的选择与培训 2. 盲法 (1) 单盲 (2) 双盲 评估盲法的实施 3. 定期检查研究记录 4. 检查研究对象的依从性35二、偏倚的控制n 资料整理与分析阶段质量控制资料
20、整理与分析阶段质量控制 1. 问卷等测量报告的核对 2. 数据录入质量控制 3. 基线分析与校正 4. 分层分析、多因素分析 36第四节 资料统计分析 数据录入与数据库的建立 数据核查与离群数据处理 统计分析方法的选择与前提统计分析计划n 研究设计、资料搜集与整理分析是科学研究的三个紧密联系的阶段。n 在研究设计时要同时制订详尽的统计分析计划, 以规范数据的管理和统计分析方法,使之与设计相匹配。n 事先无计划,或疏虞计划,在获取研究数据以后,多方计算,以求得研究者期待的结论,这样的事后分析(post hoc analysis)往往导致虚假结果。38一、 数据录入与数据库的建立n二维结构数据库二
21、维结构数据库 每一行: 一个观察单位(observational unit, case) 的记录(record) 每一列: 一个变量(variable),调查的项目或观察指标 数据库: 全是数字,没有文字39二、数据核查与离群数据处理1.数据核查 人工检查和计算机检查 2.离群数据(outlier) 处理 3.缺失值(missing value) 处理 n 缺失值的比例不能太大n 完全随机缺失(missing completely at random, MCAR) 可以仅对完整资料的对象分析(complete subject analysis);否则,需利用适宜统计方法“填充”40三、统计分析
22、方法的选择与前提n选择统计分析方法需考虑以下要素: 研究目的 设计类型 变量类型和数目 数据分布特征 样本量n不同设计类型需采用不同的统计分析方法41思考:采用什麽统计方法?(1) 比较平均效应比较平均效应、两独立小样本两独立小样本、单个定量变量单个定量变量、正态分布正态分布 t 检验检验(2) 比较平均效应比较平均效应、配对样本配对样本、单个定量变量单个定量变量、分布特征不详分布特征不详 符号秩检验符号秩检验(3) 比较平均效应比较平均效应、两独立大样本两独立大样本、单个分类变量单个分类变量、二项分布二项分布 (4) 比较平均效应比较平均效应、两独立小样本两独立小样本、单个分类变量单个分类变量、二项分布二项分布 Fisher 精确检验精确检验检验检验2 42
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 住房出租合同模板共享
- 业务协作合同范例
- 乡村空地出租合同范例
- 2024年教育培训项目合作与股权转让合同
- 2024年度智能家居系统解决方案提供合同
- 2024年新型环保材料研发与应用合作协议
- 2024年房产转让协议书(全新)
- 2024年恋爱赠与协议书
- 2024年房屋抵押贷款合同
- 2024年投资借款促成合同
- 2024新外研版初一上英语单词默写表
- 高考化学一轮总复习:环境保护与绿色化学
- 病原微生物实验室生物安全管理培训考核试题
- 当代社会政策分析 课件 第七章 老年社会政策
- 2024年湖北联投集团有限公司校园招聘考试试题各版本
- 《无人机驾驶航空试验基地(试验区)基础设施建设规范(征求意见稿)》
- MOOC 药物代谢动力学-中国药科大学 中国大学慕课答案
- 2.1《迎接蚕宝宝的到来》教学设计(新课标)
- FZT 92082-2017 非织造布喷丝板
- DL-T 5745-2021电力建设工程工程量清单计价规范-PDF解密
- 2024上海市标准房屋租赁合同官方版
评论
0/150
提交评论