




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
缺失值多重插补原理及软件实现缺失值多重插补原理及软件实现101缺失值多重插补的基础知识02缺失值多重插补的软件操作目录CONTENTS04缺失值多重插补的SCI论文写作要点03缺失值多重插补的注意事项01缺失值多重插补的基础知识02缺失值多重插补的软件操作目2缺失值多重插补的基础知识PART01缺失值多重插补的基础知识PART013前言临床研究面临的情况非常复杂,资料收集困难重重。在临床研究中,即使质量控制很好,也会出现或多或少的资料记录不完整,即数据缺失。在人口学资料、暴露或干预测量指标、结局指标等各方面的数据中,都会遇到缺失数据,有些关键数据的缺失会导致整条病例资料不可使用。前言临床研究面临的情况非常复杂,资料收集困难重重。在临数据缺失的类型缺失数据类型MCAR项目一完全随机缺失(MCAR):是指数据是否缺失与存在缺失的变量无关,与其他变量也无关,就是一个偶然发生的随机事件。随机缺失(MAR):是相对更为常见的一类缺失形式,此时缺失数据可能和其他变量相关,但与存在缺失的变量本身无关。非随机缺失(MNAR):是指数据的缺失与否只与存在缺失的变量本身有关。MARMANR数据缺失的类型缺失数据类型MCAR项目一完全随机缺失(MCA缺失数据处理的几种不靠谱方法删除数据学术造假闭口不提缺失数据处理的几种不靠谱方法删除数据学术造假闭口不提缺失数据处理的神技:多重插补学术造假闭口不提
多重插补法由Rubin在1978年提出的一种缺失数据估算方法,它能够减少由缺失数据带来的不确定性,增加了估计的效率。多重填充法适用于MCAR和MAR数据缺失的机制,并且要求数据满足多元正态分布。缺失数据处理的神技:多重插补学术造假闭口不提多重插缺失数据处理的神技:多重插补删除数据学术造假闭口不提多重插补的思路把来自于各个数据集的统计结果进行综合,得到总体参数的估计值。用标准的统计分析过程对多次替换后产生的若干个数据集进行分析。多重插补技术用一系列可能的值来替换每一个缺失值,以反映被替换的缺失数据的不确定性。缺失数据处理的神技:多重插补删除数据学术造假闭口不提多重插补多重插补SCI论文发表情况删除数据学术造假闭口不提
多重插补,是缺失值处理中应用最为普遍和成熟的方法之一,已经在众多的SCI文章中使用,以“multipleimputation”[Title/Abstract]为检索式在pumbed数据库的标题和摘要字段进行检索后发现:截止到2017年6月15日,有1842篇文章中用到此方法。多重插补SCI论文发表情况删除数据学术造假闭口不提多重插多重插补SCI论文发表情况删除数据学术造假闭口不提各年发表的多重插补相关论文分布情况如下图所示:多重插补SCI论文发表情况删除数据学术造假闭口不提各年发表的缺失值多重插补的软件操作PART02缺失值多重插补的软件操作PART0211实例介绍前列腺癌细胞是否扩散到邻近的淋巴结,是选择治疗方案的重要依据。为了了解淋巴组织中有无癌转移,通常的做法是对病人实施腹术探查,并在显微镜下检查淋巴组织。为了不手术而又能弄清淋巴结的转移情况,Brown教授在术前检查了53例前列腺癌的患者,分别记录了年龄(AGE)、酸性磷酸酯酶(ACID),X射线(X_RAY)、术前探针活检病理分级(GRADE)、直肠指检肿瘤位置(STAGE),以及手术探查结果变量(NODES)。
XYX射线淋巴结转移实例介绍前列腺癌细胞是否扩散到邻近的淋巴结,是选择治疗方实例介绍
年龄(AGE)、酸性磷酸酯酶(ACID)为连续性变量,X射线(X_RAY)、术前探针活检病理分级(GRADE)、直肠指检肿瘤位置(STAGE)为分类变量。按0,1赋值,其值1表示阳性或较严重情况,0表示阴性或较轻情况,还有手术探查结果变量NODES,1表示有淋巴结转移,0表示无淋巴结转移。实例介绍年龄(AGE)、酸性磷酸酯酶(ACID)为连续性变实例介绍
原始研究的EXCEL表格中没有缺失值的完整数据,将其另存为“文本文件(制表符分隔)”并命名为:PA,放在一个同样名为PA的新建文件夹中。实例介绍原始研究的EXCEL表格中没有缺失值的完整数据,实例介绍
将原始的完整EXCEL表格文件,随便删除一些变量数据(研究编号(No)、X射线(X_RAY)、手术探查结果变量NODES不删除)。实例介绍将原始的完整EXCEL表格文件,随便删除一些变量实例介绍
将其另存为“文本文件(制表符分隔)”并命名为:PAqueshi,放在一个同样名为PAqueshi的新建文件夹中。实例介绍将其另存为“文本文件(制表符分隔)”并命名为:P软件准备
采用的软件是易侕统计软件,该软件由美国X&Ysolutions公司研究的一套全新设计的数据分析软件。该软件后台程序以R软件为平台,受国际认可。于2013年底面向中国科研人员开发了中文版本。软件准备采用的软件是易侕统计软件,该软件由美国软件准备下面介绍软件的下载、安装和登陆方法。①百度“易侕统计”进入第一条网页软件准备下面介绍软件的下载、安装和登陆方法。①百度“易侕统计软件准备②登陆网站下载“易侕统计”到电脑上并安装软件准备②登陆网站下载“易侕统计”到电脑上并安装软件准备③进入软件登陆界面,点击右上角“注册新账号”,只要填写一个电子邮箱即可免费使用本软件一个月软件准备③进入软件登陆界面,点击右上角“注册新账号”,只要填软件准备
该软件不同到传统的SPSS软件、SAS软件,可以在网上找到所谓的破解版,而是采用于在线登陆方式访问,下载并安装软件后,每次登陆时都需要在联网的情况下输入用户名和密码才能访问。软件准备该软件不同到传统的SPSS软件、SAS软件,可软件操作步骤研究方法导入原始数据统计缺失情况估算缺失数据检查插补效果合并多套结果多重插补的软件操作:仅需五个步骤软件操作步骤研究导入原始数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果首先导入数据。打开“易侕软件”,点击菜单“分析项目”>“创建新项目”,读入刚刚保存的文本文件(制表符分隔)Paqueshi.txt,再点击下方“读取数据文件”。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果数据导入成功研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果接下来,统计一下数据集中的变量缺失情况。点击菜单“数据操作”>“变量取值(缺失)组合”
。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果
进入“变量取值(缺失)组合”界面后,在将缺失变量(下图右方蓝色部分)用鼠标拖入“选择变量”框中,其他设置不变,再点击下方的“查看结果”。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果软件显示出该数据集的数据缺失情况:①每个变量缺失的情况;②多个变量缺失组合情况。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果接下来,我们来使用“多重插补”补全缺失数据。点击菜单“数据操作”>“多重插补缺失生成新数据”
。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果
进入“多重插补缺失生成新数据”界面后,在将缺失变量(下图右方蓝色部分)用鼠标拖入“选择变量”框中,填写生成两组新数据,同时勾选输出数据包括原始数据,再点击保存和查看结果。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果软件自动运行大约一段时间后(视数据的多少而定)。将显示结果研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果
在软件左侧“多重插补缺失生成新数据”分支树里的Paqueshi_2_tbl1.txt处单击右键,选择图中第一个Paqueshi_2_tbl1.mi.xls”中表格再单击,在弹出的对话框中选择“是”,软件将会自动打开EXCEL表格。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果打开EXCEL表格后,软件生成的3套数据,第一套是原始缺失数据,第二套和第三套是插补的新数据,并新生成了一个变量”mi.iter”研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果接下来,我们来看一下多重插补的效果如何,点击菜单“数据操作”>“更新源数据文件”
。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果接照下图的顺序导入新生成的缺失数据集研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果相比之前的数据集,多了”MI.ITER”变量,为数据的分组变量研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果在软件的“数据分析”菜单下选择“研究人群描述”模块。
研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果接照下图的顺序进行设置。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果下图展示的是三套数据的单因素分析表,三组数据各缺失变量比较无统计学差异,表明插补后的数据和原始缺失数据基本一致。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果接下来进入最后一步,合并这两套数据分析的结果。点击菜单“数据操作”>“全自动流行病学分析”
。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果按左侧的提示进行设置研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果将数据集变量“MI.ITER”的取值范围设置为==0,表示当前分析只限定在原始缺失数据中进行,如果是==1,则限定为第一套新数据,如果是==2则限定为第2套新数据。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果又回到了“全自动流行病学分析”模块,点击“查看结果”。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果全自动流行病学分析展示的是SCI论文中要呈现的四个表:①研究人群特征表;②单因素分析表;③分层分析表;④多元回归分析表。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果下图的多元回归分析结果是SCI论文的核心结果,通过对原始缺失数据的分析显示:所有调整与不调整协变量的回归分析结果,均显示X射线是淋巴结转移的危险因素,但只有不调整协变量的回归分析结果的P值小于0.05,其他两个结果P值均在临界值附近。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果
接下来我们来分析第一套新数据的结果,点击左侧“全自动流行病学分析”进行适当修改后,点“查看结果”在弹出的“保存为一个新的图表”对话框中选择“是”。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果对第一套新数据的分析结果显示:所有调整与不调整协变量的回归分析结果,均显示X射线是淋巴结转移的危险因素,而且P值均小于0.05。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果
接下来我们来分析第二套新数据的结果,点击左侧“全自动流行病学分析”进行适当修改后,点“查看结果”在弹出的“保存为一个新的图表”对话框中选择“是”。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果对第二套新数据的分析结果显示:所有调整与不调整协变量的回归分析结果,均显示X射线是淋巴结转移的危险因素,而且P值均小于0.05。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果
接下来,我们开展合并,第一套和第二套新数据的回归分析结果:点击菜单“工具”>“统计工具”>“合并多套数据的回归系数”
。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果将2套多元回归分析的结果,填到右边的表格中,再点击开始计算。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果合并2套新数据的回归分析结果的OR及95%CI为:7.3568(1.4939~36.2284),P值为0.014研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果最后,我们再看一看没有任何数据缺失的原始完整数据集”PA”的多元回归分析OR及95%CI为:7.52(1.49~37.98),P值为0.0113。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补缺失值多重插补的注意事项PART03缺失值多重插补的注意事项PART0355多重插补的禁忌与注意事项
多重插补其核心还是在于一个“补”字,通过多重插补,研究者可以在一定程度上满足自己的研究需要。但需要注意的是,一定不能将“多重插补”这个神技滥用。多重插补的禁忌与注意事项多重插补其核心还是在于一个“补”多重插补的禁忌与注意事项
首先一点:不建议插补缺失较多的数据,当数据缺失在15%~60%时,可以使用不同的方法进行插补,当数据缺失超过60%时,如果通过多重插补想要获得新数据,其实质上已经是两套完全不同的数据了,因此会导致数据失真,这样的数据取得的分析结果自然也是伪科学的。多重插补的禁忌与注意事项首先一点:不建议插补缺失较多的数多重插补的禁忌与注意事项
其二:不建议用插补生成额外数据,本来只有50个样本,想通过插补扩大样本量是不行的。道理很简单,额外的数据换句话讲就是无中生有咯,其本质等同于捏造数据,这是坚决禁止的学术造假行为。多重插补的禁忌与注意事项其二:不建议用插补生成额外数据,多重插补的禁忌与注意事项多重插补的禁忌与注意事项缺失值多重插补的SCI论文写作要点PART04缺失值多重插补的SCI论文写作要点PART0460缺失值多重插补SCI论文写作要点接下来,我们以一篇发表在柳叶刀子刊:柳叶刀糖尿病内分泌杂志(IF=19.74)的文章为例,讲解缺失值多重插补的论文报告要点。缺失值多重插补SCI论文写作要点接下来,我们以一篇发表在关于材料和方法部分的写作在写missingdata处理的方法时,几个关键词要写:①用的是多重插补法(multipleimputation)②原理是链式方程(chainedequation)③计算是由MICElibrarywithintheS-Plus2000GuidetoStatisticsVolumes1and2(MathSoft,Seattle,WA,USA)或者易侕软件。关于材料和方法部分的写作在写missingdata处理的方关于结果部分的写作1、在写文章的时候,应该报道每个变量中,有多少数据缺失。如果可能,还要讲出这些数据缺失的理由。关于结果部分的写作1、在写文章的时候,应该报道每个变量中,有关于结果部分的写作在这个研究里,9509个病人中,只有5056个病人的数据是全的。缺了4000多个数据,占总样本量的47%。如果说我们按照complete-case来做,把缺失的数据全部删掉,那么这篇文章只有5056个病人,虽然样本量依然很大,但是比起原计划的9000多个还是损失了很多。关于结果部分的写作在这个研究里,9509个病人中,只有505参考文献1.易侕统计:零成本突破SCI2.FarrarD,FairleyL,SantorelliG,etal.AssociationbetweenhyperglycaemiaandadverseperinataloutcomesinsouthAsianandwhiteBritishwomen:analysisofdatafromtheBorninBradfordcohort[J].LancetDiabetes&Endocrinology,2015,3(10):795.3.宇传华.SPSS与统计分析[M].电子工业出版社,2014.参考文献1.易侕统计:零成本突破SCI65THANKSTHANKS66
缺失值多重插补原理及软件实现缺失值多重插补原理及软件实现6701缺失值多重插补的基础知识02缺失值多重插补的软件操作目录CONTENTS04缺失值多重插补的SCI论文写作要点03缺失值多重插补的注意事项01缺失值多重插补的基础知识02缺失值多重插补的软件操作目68缺失值多重插补的基础知识PART01缺失值多重插补的基础知识PART0169前言临床研究面临的情况非常复杂,资料收集困难重重。在临床研究中,即使质量控制很好,也会出现或多或少的资料记录不完整,即数据缺失。在人口学资料、暴露或干预测量指标、结局指标等各方面的数据中,都会遇到缺失数据,有些关键数据的缺失会导致整条病例资料不可使用。前言临床研究面临的情况非常复杂,资料收集困难重重。在临数据缺失的类型缺失数据类型MCAR项目一完全随机缺失(MCAR):是指数据是否缺失与存在缺失的变量无关,与其他变量也无关,就是一个偶然发生的随机事件。随机缺失(MAR):是相对更为常见的一类缺失形式,此时缺失数据可能和其他变量相关,但与存在缺失的变量本身无关。非随机缺失(MNAR):是指数据的缺失与否只与存在缺失的变量本身有关。MARMANR数据缺失的类型缺失数据类型MCAR项目一完全随机缺失(MCA缺失数据处理的几种不靠谱方法删除数据学术造假闭口不提缺失数据处理的几种不靠谱方法删除数据学术造假闭口不提缺失数据处理的神技:多重插补学术造假闭口不提
多重插补法由Rubin在1978年提出的一种缺失数据估算方法,它能够减少由缺失数据带来的不确定性,增加了估计的效率。多重填充法适用于MCAR和MAR数据缺失的机制,并且要求数据满足多元正态分布。缺失数据处理的神技:多重插补学术造假闭口不提多重插缺失数据处理的神技:多重插补删除数据学术造假闭口不提多重插补的思路把来自于各个数据集的统计结果进行综合,得到总体参数的估计值。用标准的统计分析过程对多次替换后产生的若干个数据集进行分析。多重插补技术用一系列可能的值来替换每一个缺失值,以反映被替换的缺失数据的不确定性。缺失数据处理的神技:多重插补删除数据学术造假闭口不提多重插补多重插补SCI论文发表情况删除数据学术造假闭口不提
多重插补,是缺失值处理中应用最为普遍和成熟的方法之一,已经在众多的SCI文章中使用,以“multipleimputation”[Title/Abstract]为检索式在pumbed数据库的标题和摘要字段进行检索后发现:截止到2017年6月15日,有1842篇文章中用到此方法。多重插补SCI论文发表情况删除数据学术造假闭口不提多重插多重插补SCI论文发表情况删除数据学术造假闭口不提各年发表的多重插补相关论文分布情况如下图所示:多重插补SCI论文发表情况删除数据学术造假闭口不提各年发表的缺失值多重插补的软件操作PART02缺失值多重插补的软件操作PART0277实例介绍前列腺癌细胞是否扩散到邻近的淋巴结,是选择治疗方案的重要依据。为了了解淋巴组织中有无癌转移,通常的做法是对病人实施腹术探查,并在显微镜下检查淋巴组织。为了不手术而又能弄清淋巴结的转移情况,Brown教授在术前检查了53例前列腺癌的患者,分别记录了年龄(AGE)、酸性磷酸酯酶(ACID),X射线(X_RAY)、术前探针活检病理分级(GRADE)、直肠指检肿瘤位置(STAGE),以及手术探查结果变量(NODES)。
XYX射线淋巴结转移实例介绍前列腺癌细胞是否扩散到邻近的淋巴结,是选择治疗方实例介绍
年龄(AGE)、酸性磷酸酯酶(ACID)为连续性变量,X射线(X_RAY)、术前探针活检病理分级(GRADE)、直肠指检肿瘤位置(STAGE)为分类变量。按0,1赋值,其值1表示阳性或较严重情况,0表示阴性或较轻情况,还有手术探查结果变量NODES,1表示有淋巴结转移,0表示无淋巴结转移。实例介绍年龄(AGE)、酸性磷酸酯酶(ACID)为连续性变实例介绍
原始研究的EXCEL表格中没有缺失值的完整数据,将其另存为“文本文件(制表符分隔)”并命名为:PA,放在一个同样名为PA的新建文件夹中。实例介绍原始研究的EXCEL表格中没有缺失值的完整数据,实例介绍
将原始的完整EXCEL表格文件,随便删除一些变量数据(研究编号(No)、X射线(X_RAY)、手术探查结果变量NODES不删除)。实例介绍将原始的完整EXCEL表格文件,随便删除一些变量实例介绍
将其另存为“文本文件(制表符分隔)”并命名为:PAqueshi,放在一个同样名为PAqueshi的新建文件夹中。实例介绍将其另存为“文本文件(制表符分隔)”并命名为:P软件准备
采用的软件是易侕统计软件,该软件由美国X&Ysolutions公司研究的一套全新设计的数据分析软件。该软件后台程序以R软件为平台,受国际认可。于2013年底面向中国科研人员开发了中文版本。软件准备采用的软件是易侕统计软件,该软件由美国软件准备下面介绍软件的下载、安装和登陆方法。①百度“易侕统计”进入第一条网页软件准备下面介绍软件的下载、安装和登陆方法。①百度“易侕统计软件准备②登陆网站下载“易侕统计”到电脑上并安装软件准备②登陆网站下载“易侕统计”到电脑上并安装软件准备③进入软件登陆界面,点击右上角“注册新账号”,只要填写一个电子邮箱即可免费使用本软件一个月软件准备③进入软件登陆界面,点击右上角“注册新账号”,只要填软件准备
该软件不同到传统的SPSS软件、SAS软件,可以在网上找到所谓的破解版,而是采用于在线登陆方式访问,下载并安装软件后,每次登陆时都需要在联网的情况下输入用户名和密码才能访问。软件准备该软件不同到传统的SPSS软件、SAS软件,可软件操作步骤研究方法导入原始数据统计缺失情况估算缺失数据检查插补效果合并多套结果多重插补的软件操作:仅需五个步骤软件操作步骤研究导入原始数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果首先导入数据。打开“易侕软件”,点击菜单“分析项目”>“创建新项目”,读入刚刚保存的文本文件(制表符分隔)Paqueshi.txt,再点击下方“读取数据文件”。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果数据导入成功研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果接下来,统计一下数据集中的变量缺失情况。点击菜单“数据操作”>“变量取值(缺失)组合”
。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果
进入“变量取值(缺失)组合”界面后,在将缺失变量(下图右方蓝色部分)用鼠标拖入“选择变量”框中,其他设置不变,再点击下方的“查看结果”。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果软件显示出该数据集的数据缺失情况:①每个变量缺失的情况;②多个变量缺失组合情况。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果接下来,我们来使用“多重插补”补全缺失数据。点击菜单“数据操作”>“多重插补缺失生成新数据”
。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果
进入“多重插补缺失生成新数据”界面后,在将缺失变量(下图右方蓝色部分)用鼠标拖入“选择变量”框中,填写生成两组新数据,同时勾选输出数据包括原始数据,再点击保存和查看结果。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果软件自动运行大约一段时间后(视数据的多少而定)。将显示结果研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果
在软件左侧“多重插补缺失生成新数据”分支树里的Paqueshi_2_tbl1.txt处单击右键,选择图中第一个Paqueshi_2_tbl1.mi.xls”中表格再单击,在弹出的对话框中选择“是”,软件将会自动打开EXCEL表格。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果打开EXCEL表格后,软件生成的3套数据,第一套是原始缺失数据,第二套和第三套是插补的新数据,并新生成了一个变量”mi.iter”研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果接下来,我们来看一下多重插补的效果如何,点击菜单“数据操作”>“更新源数据文件”
。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果接照下图的顺序导入新生成的缺失数据集研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果相比之前的数据集,多了”MI.ITER”变量,为数据的分组变量研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果在软件的“数据分析”菜单下选择“研究人群描述”模块。
研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果接照下图的顺序进行设置。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果下图展示的是三套数据的单因素分析表,三组数据各缺失变量比较无统计学差异,表明插补后的数据和原始缺失数据基本一致。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果接下来进入最后一步,合并这两套数据分析的结果。点击菜单“数据操作”>“全自动流行病学分析”
。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果按左侧的提示进行设置研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果将数据集变量“MI.ITER”的取值范围设置为==0,表示当前分析只限定在原始缺失数据中进行,如果是==1,则限定为第一套新数据,如果是==2则限定为第2套新数据。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果又回到了“全自动流行病学分析”模块,点击“查看结果”。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果全自动流行病学分析展示的是SCI论文中要呈现的四个表:①研究人群特征表;②单因素分析表;③分层分析表;④多元回归分析表。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果下图的多元回归分析结果是SCI论文的核心结果,通过对原始缺失数据的分析显示:所有调整与不调整协变量的回归分析结果,均显示X射线是淋巴结转移的危险因素,但只有不调整协变量的回归分析结果的P值小于0.05,其他两个结果P值均在临界值附近。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果
接下来我们来分析第一套新数据的结果,点击左侧“全自动流行病学分析”进行适当修改后,点“查看结果”在弹出的“保存为一个新的图表”对话框中选择“是”。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果对第一套新数据的分析结果显示:所有调整与不调整协变量的回归分析结果,均显示X射线是淋巴结转移的危险因素,而且P值均小于0.05。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果
接下来我们来分析第二套新数据的结果,点击左侧“全自动流行病学分析”进行适当修改后,点“查看结果”在弹出的“保存为一个新的图表”对话框中选择“是”。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果对第二套新数据的分析结果显示:所有调整与不调整协变量的回归分析结果,均显示X射线是淋巴结转移的危险因素,而且P值均小于0.05。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果
接下来,我们开展合并,第一套和第二套新数据的回归分析结果:点击菜单“工具”>“统计工具”>“合并多套数据的回归系数”
。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果将2套多元回归分析的结果,填到右边的表格中,再点击开始计算。研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果合并2套新数据的回归分析结果的OR及95%CI为:7.3568(1.4939~36.2284),P值为0.014研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补研究方法合并多套结果导入数据统计缺失情况估算缺失数据检查插补效果最后,我们再看一看没有任何数据缺失的原始完整数据集”PA”的多元回归分析OR及95%CI为:7.52(1.49~37.98),P值为0.0113。研究方法合并多套结果
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 嵌入式开发中的项目预算管理试题及答案
- 网络管理员考试重要提纲试题及答案
- 财务管理中的逻辑结构与模式试题及答案
- 掌握Access创建邮件报表的试题及答案
- 计算机一级Photoshop设计美学探讨试题及答案
- C语言学习瓶颈2025年考试试题及答案
- 设备吊装合同协议书范本
- 2025年嵌入式发展分析试题及答案
- C语言考试模拟实战体验试题及答案
- 计算机二级VFP考试重要知识点试题及答案
- GB/T 39204-2022信息安全技术关键信息基础设施安全保护要求
- 巴西地理课件
- GB/T 37988-2019信息安全技术数据安全能力成熟度模型
- GB/T 17737.5-2013同轴通信电缆第5部分:CATV用干线和配线电缆分规范
- 网口变压器简介课件
- 财产份额转让协议书2
- 工艺安全信息管理培训课件
- 产前筛查-课件
- 装配式建筑叠合板安装技术交底
- 安全管理人员安全生产责任制考核表
- 六年级说明文阅读复习公开课课件
评论
0/150
提交评论