版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医学科研数据整顿与分析DataSortingandAnalysisinMedicalResearch李志春新乡医学院公共卫生学院1/77医学科研数据整顿与分析2/77医学科研数据整顿与分析第一节科研数据检查与整顿第二节科研数据描述第三节统计分析办法选择第四节科研数据综合分析第五节统计分析成果解释与体现3/77一、对象检查二、缺项与差错三、资料整顿第一节科研数据检查与整顿4/77一、对象检查首先要鉴别所调查或研究个体是否属于所要求调查对象或研究对象。在进行临床研究时,要尤其注意疾病诊断、分类正确性,这对于确保研究成果正确性是十分必要。5/77由于多种原因在某些调查表中经常能够见到缺项存在,缺项存在严重地影响到资料完整性。通过检查发觉研究资料中差错也是十分必要,应对研究数据作认真检查。二、缺项与差错检查6/77专业检查统计检查二、缺项与差错检查7/77人工检查计算机检查二、缺项与差错检查8/77在周密试验设计指导下取得试验数据,不应随意舍弃,不然试验成果真实性与完整性就会受到破坏。可疑数据处理9/7710/77在该数据指标服从正态分布前提下,可用统计办法检查个别“可疑值”是否应当舍弃。当n>10时,能够用“”作为舍弃可疑值准则。当n≤10时,能够采取Q检查法、Dixon检查法或Grubbs检查法,进行测量值一致性检查,从而判断是否剔除可疑值。可疑数据处理11/7712/77在对资料做好检查、查对后,就需要把杂乱无章资料条理化,方便于进行统计计算与分析,即整顿资料。三、资料整顿13/77数据计算机管理数据库选择数据录入数据核查与清理数据加工(如编码、标准化、根据原始统计产生新研究变量等)数据最后锁定并进入分析14/7715/77医学科研数据整顿与分析第一节科研数据检查与整顿第二节科研数据描述第三节统计分析办法选择第四节科研数据综合分析第五节统计分析成果解释与体现16/77一、统计指标二、统计表三、统计图第二节科研数据描述体现17/77(一)总量指标与相对数指标(二)平均数指标(三)变异指标一、统计指标18/77统计表是用表格方式体现统计资料和指标。在编制统计表时,应当遵循下列标准:1.重点突出,简单明了。即一张表只包括一种中心内容,使人一目了然,不要包罗万象。2.主谓分明,层次清楚。二、统计表19/77一、统计指标二、统计表三、统计图第二节科研数据描述体现20/7721/7722/77医学科研数据整顿与分析第一节科研数据检查与整顿第二节科研数据描述第三节统计分析办法选择第四节科研数据综合分析第五节统计分析成果解释与体现23/77(一)假设检查(二)区间估计(三)变量间关系研究(四)鉴别分析一、统计分析办法概述24/77包括有计量资料分布类型假设检查、计量资料方差假设检查、计量资料均数假设检查、等级资料分布或位置假设检查、两种属性间独立性检查以及两种办法判断成果一致性检查等。(一)假设检查25/77(二)区间估计▲概念:根据样本均数,按一定可信度计算出总体均数很也许在一种数值范围,这个范围称为总体均数可信区间。▲办法:(1)u分布法(2)t分布法26/77总体均数(μ)100(1-α)%置信区间(CI):(1)已知总体标准差σ,按正态分布原理,计算公式为:(2)σ未知,n较小,按t分布原理计算:(3)σ未知,n足够大(如n>100),按正态分布原理计算:(二)区间估计27/77总体率置信区间估计查表法当n≤50时正态近似法当样本含量足够大,且样本率p和(1-p)均不太小。一般以为np和n(1-p)≥5。p±uαsp
28/77(一)假设检查(二)区间估计(三)变量间关系研究(四)鉴别分析一、统计分析办法概述29/771.各指标之间无自变量与因变量之分(1) 研究变量之间互相关系有直线有关分析、典型有关分析等。(2) 研究多种变量内部从属关系,并寻找综合指标,减少变量维数,其常用办法主要有主成份分析、因子分析和对应分析。(3) 研究多种变量内部或多种样品之间亲疏关系有聚类分析。(4) 研究多种变量内部多种复杂关系有线性构造方程协方差分析。(三)变量间关系研究30/772.各指标之间有自变量与因变量之分研究变量之间依存关系有直线回归分析、曲线回归分析、多项式回归分析、多元线性回归分析、概率模型回归分析、生存资料参数模型回归分析、COX模型回归分析和对数线性模型分析。(三)变量间关系研究31/77(一)假设检查(二)区间估计(三)变量间关系研究(四)鉴别分析根据某些明确分类总体所提供信息,对未知个体归属进行分类鉴别分析。一、统计分析办法概述32/77分析目资料类型设计方案数理统计条件选择统计分析办法需考虑原因33/77二、计量资料假设检查办法选择例:欲理解某地城镇婴儿营养情况有没有差异,测量了其血红蛋白含量,见下表。34/77首先要明确每次拟分析定性变量个数是多少?其次要弄清定性变量属性、列联表中频数多少以及资料搜集方式。三、计数资料假设检查办法选择35/7736/77每次只分析两个变量时,可将资料整顿为2×2表、2×k表和R×C表形式。常用统计分析办法有Pearsonχ2检查、校正χ2检查、配对计数资料McNemarχ2检查、Fisher精确概率法检查、秩和检查、Ridit分析、等级有关分析、典型有关分析、一般趋势和线性趋势检查、Kappa检查等;假如需要同步分析研究定性变量个数≥3时,常用统计分析办法有加权χ2检查、Mantel-haenszelχ2检查、logistic回归模型和对数线性模型等。37/77在计数资料分析过程中,对于R×C表形式资料分析是一种难点,存在问题比较多。根据二维列联表中两个分组变量类型以及分析目标,对R×C表资料进行分类,由于不一样类型R×C表资料和不一样分析目标,就有不一样分析办法。R×C表检查办法选择38/77双向无序R×C表资料及其统计分析办法选择单向有序R×C表资料及其统计分析办法选择双向有序且属性不一样R×C表资料及其统计分析办法选择双向有序且属性相同R×C表资料及其统计分析办法选择R×C表检查办法选择39/7740/7741/77对单向有序R×C表两个分组变量,其中一种是无序(试验分组变量——不一样药品);另一种却是有序(指标分组变量——处理效果)。此时不适合选用χ2检查分析资料,由于χ2检查与“疗效”有序性之间没有任何联系,故应采取与“有序性”有联系秩和检查或Ridit分析。R×C表检查办法选择42/7743/77对双向有序且属性不一样R×C表两个分组变量,如年纪组别与某种疾病发生程度都是有序,但属性不一样,此时,也不适合选用χ2检查分析资料,由于χ2检查与两个变量有序性之间没有任何联系,应改用与两个变量“有序性”有联系等级有关分析、典型有关分析或线性趋势检查。R×C表检查办法选择44/7745/77对双向有序且属性相同R×C表两个分组变量,如两种办法对某种疾病发病程度诊断成果,它们都是有序,且属性也相同。此时,研究目标是要考查两种测定办法测定成果之间是否具有一致性,故仍不适合选用一般χ2检查分析资料,应采取与两个变量有序性有联系一致性检查或称Kappa检查,还能够用特殊模型分析办法。R×C表检查办法选择46/77医学科研数据整顿与分析第一节科研数据检查与整顿第二节科研数据描述第三节统计分析办法选择第四节科研数据综合分析第五节统计分析成果解释与体现47/77对于同一份统计资料,由于研究目标不一样,处理办法不一样,能够从多种方面进行分析,此即“综合分析”。通过对数据资料综合分析,能够充足利用、挖掘资料所内涵信息。第四节科研数据综合分析48/77【实例】某医师将20名失眠患者随机等分为两组,一组服用安眠药,另一组服用抚慰剂,研究者要评价某安眠药催眠效果,治疗失眠前后睡眠时间及其差值成果见表,试作统计分析。49/7750/77平行组对照设计分析思绪试验组:疗前疗后=>差值同质性比较组间比较
对照组:疗前疗后=>差值51/77疗前是否均衡可比?
–两组疗前比较每种药品是否有疗效?
–各组疗效组内比较疗效间有没有差异?
–疗效差异比较本例分析中三个步骤是环环相扣。52/77平行组对照设计分析思绪试验组:疗前疗后=>差值
同质性比较组间比较
对照组:疗前疗后=>差值53/77【实例】对一组胃癌病人先后用两种泌酸刺激剂,然后分别测定其最大酸排量(mEq/h),以分析两药效果,见表。54/7755/77配对资料t检查分析。按α=0.05水准回绝H0,接收H1,差异有统计学意义,胃癌病人用加大组织胺后最大酸排量与用五肽胃泌素后最大酸排量间差异有统计学意义。56/77五肽胃泌素引发最大酸排量是加大组织胺百分之多少?57/77•胃癌病人用加大组织胺后最大酸排量比用五肽胃泌素者平均多1.30(95%CI:1.02~1.57)mEq/h。而两次测定值之间回归分析显示:若加大组织胺引发最大酸排量升高1mEq/h,则五肽胃泌素引发者将平均递升0.90(95%CI:0.88~0.92)mEq/h,即五肽胃泌素引发最大酸排量只是加大组织胺90%。综合分析结论58/77针对差值分析配对t检查与说明变量线性依存关系回归分析相结合,假设检查与区间估计互补,使所得结论愈加丰富、愈加详细。59/77例研究放射线对嗜酸粒细胞影响。对一批同一种系体重接近小白鼠,以完全随机抽样方法抽取了11只小白鼠,在注射肾上腺素前、后二次测定其嗜酸粒细胞数,然后用一定剂量放射线照射,通过二十四小时,再反复上述试验,每一只小白鼠都有4个测定值。二、进行综合分析办法60/7761/771.单纯肾上腺素作用
放射线照射之前,测定嗜酸粒细胞数(×106个/L),然后注射一定剂量肾上腺素,再测其嗜酸性粒细胞,将⑵、⑶按本身对照设计作t检查(t=3.767,P<0.01)。2.照射放射线后肾上腺素作用在照射一定剂量放射线后,反复上述试验,将⑷、⑸按本身对照设计作t检查(t=6.921,P<0.001)。综合分析62/773.单纯照射放射线作用将尚未注射肾上腺素时,照射放射线前、后测定值,即⑵、⑷按本身对照设计作t检查(t=4.219,P<0.01)。4.照射放射线是否变化肾上腺素作用
将放射线照射前差值[⑶―⑵]与放射线照射后差值[⑸―⑷],按本身对照设计作t检查(t=0.849,P>0.40)。
综合分析63/771.小白鼠受到放射线照射后,血液中嗜酸性粒细胞减少;2.小白鼠注射肾上腺素后,血液中嗜酸性粒细胞减少;3.小白鼠受放射线照射二十四小时内,并未变化肾上腺素减少嗜酸性粒细胞数作用和程度。结论64/77例7.2下面就是该科研资料较为完整背景介绍:某研究者搜集到103例冠心病患者和100例正常对照者多项指标,其中有组别(G)、性别(X1)、年纪(X2)、高血压史(X3)、吸烟史(X4)、胆固醇含量(X5)、甘油三酯含量(X6)、低密度脂蛋白含量(X7)、密度脂蛋白含量(X8)、脂蛋白(X9)、载脂蛋白A1含量(X10)、载脂蛋白B含量(X11)、基因型Xbal(X12)、基因型EcoRl(X13)、用药情况(X14),资料格式见表7.5所示。65/7766/77(1)对冠心病人而言,直接分析某种基因型(X12或X13)取不一样水平时7项血脂指标均值和均值向量之间差异有没有显著性意义?(2)对冠心病人而言,同步分析“性别、吸烟史、高血压史、某种基因型(X12或X13)”对7项血脂指标均值和均值向量影响有没有显著性意义?(3)对冠心病人而言,在设法排除“年纪、性别、吸烟史、高血压史和用药情况”等原因影响前提下,分析某种基因型(X12或X13)取不一样水平时7项血脂指标均值之间差异有没有显著性意义?67/7768/77(4)对冠心病人而言,试对7项血脂指标间内部从属性做客观评价。(5)对冠心病人而言,试对7项血脂指标间亲疏关系做客观评价。(6)对冠心病人而言,假定病情轻重可通过7项血脂指标较好地反应出来,试根据7项
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度招投标合同管理的研究与实践3篇
- 幼儿园生态课程设计
- 虚拟现实旅游导览系统开发合同
- 二零二四年知识产权侵权纠纷处理合同
- 二零二四年度环保设施建设与运营合同(污水处理)
- 二零二四年度租赁合同协议书
- 个人消费购销贷款合同样本
- 2022-2023学年山西省名校联考高二(上)期末语文试卷
- 2022-2023学年山东省青岛市莱西一中高一(上)月考语文试卷(12月份)
- 2024-2025学年年七年级数学人教版下册专题整合复习卷专题:一元二次方程根的判别式(含答案)-
- 上消化道出血(PPT课件)
- 2014年吉林省长春市中考模拟数学
- 上汽-最详细的整车开发流程(CPMP)
- 论文岩棉用酚醛树脂体系
- 设计开发记录总表
- 通风填写范例
- 盲人无障碍出行调查问卷分析报告(20220215150515)
- 财务审批权限管理办法
- 许昌特产介绍
- 欧姆龙AD081、DA08C输入输出模块的使用手册
- 一千个伤心的理由(张学友)原版五线谱钢琴谱正谱乐谱.docx
评论
0/150
提交评论