




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
临床科研中数据分析的常见注意事项毛广运生物统计中心提纲数据处理的一般原则与基本内容统计方法选择的基本思路具体案例分析几种比较实用的方法附录:常用数据分析的SAS程序第一部分数据处理的一般原则与基本内容数据处理数据处理定义:对数据的采集、存储、检索、加工、变换和传输。基本目的:从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。组成数据管理(约占全部工作量的60%-80%)数据分析(约占全部工作量的20%-40%)数据处理的一般原则与基本内容数据库设计数据录入数据管理数据审核异常(缺失)值的处理统计整理:根据研究目的对原始数据进行科学的分类、汇总和显示;使之系统化、条理化、直观生动和反映总体的数量特征和规律。数据分析统计方法的选择统计描述与统计推断离群数据的处理离群数据严重偏离群体平均水平的数据,多为错误(如DBP=880mmHg),少量为异常的真实值可严重掩盖事实真相或扭曲两者间的关系处理原则手工处理:正态分布:>3×|均数±标准差|偏态分布:>99.5%或<0.5%软件处理箱式图:距箱体底线或顶线距离超过箱体高度1.5~3倍者缺失数据的处理缺失值部分研究指标记录不完整,导致其值缺失后果:导致研究效率的下降数据的常见缺失机制完全随机缺失:缺失资料与完整资料的特征无显著性差异非随机缺失:缺失资料与完整资料的特征存在显著性差异常见处理措施直接剔除:适用于缺失量极少且为完全随机缺失单独列为一类:适用于缺失量较大,且难以合理填补者缺失值填补:均数替代中位数替代最后观察值结转回归算法多重填补法统计方法前提条件的检查与描述统计学最难以掌握之处数据分析人员最应该首先掌握的技能熟悉各种统计方法的前提适用条件合理选择最合适的统计方法第二部分统计方法选择的基本思路统计方法选择的核心要素研究目的组间差异显著性检验?优效性检验?等效性检验?非劣效性检验?相互关系相关与回归、关联性分析(OR、RR、AR)、其它设计类型完全随机设计? 配对设计? 随机区组设计?交叉设计? 析因设计? 其它设计?数据类型计量资料?分类资料?等级资料?分布特征正态分布?对数正态分布?其它偏态分布?统计方法选择总结统计方法选择总结(续)统计方法选择总结(续)常见统计分析的错误普查还是抽样调查?普查无统计推断随机抽样还是非随机抽样?非随机抽样不能使用普通的统计推断方法资料类型误认未能满足所选择统计的前提适用条件单因素ANOVA代替重复测量资料的方差分析常见统计分析的错误未进行数据审核数据中存在逻辑错误数据中存在异常值数据中存在过多的缺失值常见统计分析的错误统计方法选择不当选择t检验时未考虑数据的分布类型将方差分析拆分成多个t检验用单因素方差分析解决重复测量资料使用四格表卡方检验时未考虑N和T的大小使用卡方检验解决等级资料问题使用线性回归解决非线性问题使用Logistic回归解决队列研究的资料使用普通方差分析解决协方差/多元方差分析问题多元统计时未考虑自变量的共线性主成分分析与因子分析误用其它线性回归与非线性回归常见统计分析的错误结果表述不当过于看重P值的大小而忽视Power的影响片面夸大统计学意义的作用错误理解P<0.01与P<0.05的关系显著性检验包打天下优效、等效和非劣效性检验少为人知InterventionControltpexample121.1±2.2(10)22.1±2.3(10)0.99>0.05example221.1±2.2(50)22.1±2.3(50)2.22<0.05example321.1±2.2(120)21.5±2.3(120)1.38>0.05example421.1±2.2(320)21.5±2.3(320)2.25<0.05example521.1±2.2(3200)21.3±2.3(3200)3.55<0.01常见统计分析的错误未考虑多重共线性回归模型中两个或两个以上的自变量彼此相关多重共线性带来的问题有可能会使回归的结果造成混乱,甚至会把分析引入歧途可能对参数估计值的正负号产生影响,特别是各回归系数的正负号有可能同我们预期的正负号相反多重共线性的识别最简单的方法计算模型中各对自变量间的相关系数,并进行显著性检验,若有一个或多个相关系数显著,就表示模型中所用的自变量之间相关,存在着多重共线性如果出现下列情况,暗示存在多重共线性模型中各对自变量之间显著相关。当模型的线性关系检验(F检验)显著时,几乎所有回归系数的t检验却不显著回归系数的正负号同预期的符号相反。第三部分具体案例讨论案例1ABC三组不同时点某指标的变化情况应该选用何种统计学方法?如果重复测量方差分析得出结论为差异有统计学意义,如何判断具体哪两个或多个时点间比较有统计学意义?如何判断A、B、C三组各时点(T0、T1、T2、T3)间不同组别的变化情况?(如判断T2时点,A、B、C三组某指标的情况)如何两两比较?若为随机区组资料,如何进行上述问题的统计?组别T0T1T2T3A100±2095±1660±1093±18B98±1894±1785±1595±17C99±2195±1495±1797±19重复测量设计定义将一组或多组受试者先后重复地施加不同的处理措施,或在不同场合和时间点进行多次测量(至少两次)的研究设计配对设计是最简单的重复测量设计重复测量设计为特殊的两因素设计其中的一个因素固定为时间因素分类对每个对象在同一时间不同因子组合间测量较为少见,如裂区设计对每个对象在不同时间点上重复测量临床研究中极为常用重复测量设计的方差分析重复测量设计在临床研究中极为常见(方法详见程序)可用普通线图描述不同组别某指标随时间变化的趋势重复测量设计优点每一个体作为自身的对照,克服了个体间的变异,减少了一个差异来源。分析时可更好地集中于处理效应;每一个体作为自身的对照,所需样本量相对较小,更加经济.缺点滞留效应(Carry-overeffect)前面的处理效应有可能滞留到下一次的处理潜隐效应(Latenteffect)前面的处理效应有可能激活原本以前不活跃的效应学习效应(Learningeffect)由于逐步熟悉实验,研究对象的反应能力有可能逐步得到了提高重复测量设计重复测量设计方差分析的统计前提每个处理条件内的观察都是独立的;每个处理条件内的总体分布是正态分布或多元正态分布;每个处理条件内方差齐;每个被试者的多元观测值之间存在相关(不能用单因素方差分析代替).重复测量设计为何要把测自不同时间点上的数据看成是多元的呢?因为同1个体的数据重复测自同1个受试对象,它们之间往往有较高的相关性。这种相关性通常会减少误差项变异,从而使得F测验的分母变小,其后果是F检验更易于到达显著即使无效假设是正确的.换句话说,犯一类错误的概率加大了重复测量设计样本必须为进行多次重复测量的数据。可以是对同一条件下同一因变量的重复测量目的在于研究各种处理间差异是否有统计学意义的同时,研究受试着间的差异;也可以是不同条件下同一因变量的重复测量目的在于研究各处理间差异是否有统计学意义的同时,研究形成重复测量条件间的差异以及这些条件与处理间的交互效应。GLM:重复测量资料方差分析的主要手段数据结构:若干次重复测量结果作为不同因变量出现在数据文件中。重复测量设计重复测量设计与随机区组设计(时间为区组因素)相同点数据结构极为相似,甚至完全一样不同点重复测量设计:的处理因素在区组(受试者)间是随机分配的,区组内的各时间点是固定的,不能随机分配;区组内的数据来自于同一受试者;随机区组设计:区组内的受试者彼此独立,处理只能在区组内随机分配,每个受试者接受不同的处理,即区组内的数据来自于不同的受试者。使用随机区组设计方差分析处理重复测量设计资料,会增大犯Ⅰ类错误的风险。重复测量资料的方差分析将不同时点的测量值作为不同的变量dataex12_3;inputt0-t4g@@;cards;120108112120117111810911512612311191121191241181121112119126120112712112713312611211201181311372122121119129133212812912613514221171151111231312118114116123133213111911813512931291281211481323123123120143136312312111614512631251241181421303;procglm;classg;modelt0-t4=g;repeatedtime5contrast(1);run;SAS分析结果重复测量资料统计分析常见错误重复进行各时间点不同组别间的t(或F)检验忽略个体曲线变化特征重复测量数据不满足常规曲线拟合方法所要求的独立性假设差值比较缺乏信度用差值做组间比较须慎重须与协方差分析区别开来案例2不同处理措施和时间对某一指标的影响试验对象:大鼠(每个时点宰杀一批)问题A、B处理效果间有无差异?AT2、BT2间有无差异?处理T1T2T3T4Axa11,xa12,xa13,…,xa1ixa21,xa12,xa23,…,xa2ixa31,xa32,xa33,…,xa3ixa41,xa42,xa43,…,xa4iBxb11,xb12,xb13,…,xb1ixb21,xb12,xb23,…
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030海上护舷系统行业市场现状供需分析及重点企业投资评估规划分析研究报告
- 2025-2030流体管理系统和附件行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030汽车电子检测产业行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030汽车安全气囊行业市场深度调研及供需格局与投资前景研究报告
- 2025-2030气体泄漏检测仪产业行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030棉签行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030果树行业市场风险投资业发展分析及运作模式与投资融资策略研究报告
- 2025-2030未增塑聚氯乙烯行业市场现状供需分析及重点企业投资评估规划分析研究报告
- 2025-2030有氧臭氧发生器行业市场现状供需分析及重点企业投资评估规划分析研究报告
- 漆器制作中的物理学原理考核试卷
- 2024年外聘电工安全协议书
- 2023年上海中考数学一轮复习:圆压轴题(原卷版+解析)
- DB11∕T 1882-2021 城市轨道交通车站工程施工质量验收标准
- 2024年甘肃省中考地理试卷四套合卷 附答案
- 毕业研究生登记表(适用于江苏省)
- 河北省高中英语12月学业水平合格性考试试题(含解析)
- 《CSCO肿瘤相关性贫血临床实践指南(2024)》解读
- 24.1.4-圆周角-第1课时说课课件-
- 早产临床防治指南(2024版)解读
- 买车挂别人名下协议书范本
- A型肉毒素注射美容记录
评论
0/150
提交评论