科研数据的分析与处理课件_第1页
科研数据的分析与处理课件_第2页
科研数据的分析与处理课件_第3页
科研数据的分析与处理课件_第4页
科研数据的分析与处理课件_第5页
已阅读5页,还剩149页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学科研数据的整理与分析DataSortingandAnalysisinMedicalResearch李志春新乡医学院公共卫生学院医学科研数据的整理与分析李志春1医学科研数据的整理与分析医学科研数据的整理与分析2医学科研数据的整理与分析第一节科研数据的检查与整理第二节科研数据的描述第三节统计分析方法的选择第四节科研数据的综合分析第五节统计分析结果的解释与表达医学科研数据的整理与分析第一节科研数据的检查与整理3一、对象的检查二、缺项与差错三、资料的整理第一节科研数据的检查与整理一、对象的检查第一节科研数据的检查与整理4一、对象的检查首先要鉴别所调查或研究的个体是否属于所规定的调查对象或研究对象。在进行临床研究时,要特别注意疾病诊断、分类的正确性,这对于保证研究结果的正确性是十分必要的。一、对象的检查首先要鉴别所调查或研究的个体是否属于所5由于多种原因在一些调查表中经常可以见到缺项的存在,缺项的存在严重地影响到资料的完整性。通过检查发现研究资料中的差错也是十分必要的,应对研究数据作认真的检查。二、缺项与差错检查由于多种原因在一些调查表中经常可以见到缺项的存在,缺6专业检查统计检查二、缺项与差错检查专业检查二、缺项与差错检查7人工检查计算机检查二、缺项与差错检查人工检查二、缺项与差错检查8在周密实验设计指导下获得的实验数据,不应随意舍弃,否则实验结果的真实性与完整性就会受到破坏。可疑数据的处理在周密实验设计指导下获得的实验数据,不应随意舍弃,否则实验结9科研数据的分析与处理课件10在该数据指标服从正态分布的前提下,可用统计方法检查个别“可疑值”是否应当舍弃。当n>10时,可以用“”作为舍弃可疑值的准则。当n≤10时,可以采用Q检验法、Dixon检验法或Grubbs检验法,进行测量值的一致性检验,从而判断是否剔除可疑值。可疑数据的处理在该数据指标服从正态分布的前提下,可用统计方法检查个别“可疑11科研数据的分析与处理课件12在对资料做好检查、核对后,就需要把杂乱无章的资料条理化,以便于进行统计计算与分析,即整理资料。三、资料的整理在对资料做好检查、核对后,就需要把杂乱无章的资料条理化,以便13数据的计算机管理数据库的选择数据录入数据核查与清理数据加工(如编码、标准化、根据原始记录产生新的研究变量等)数据最终锁定并进入分析数据的计算机管理数据库的选择14科研数据的分析与处理课件15医学科研数据的整理与分析第一节科研数据的检查与整理第二节科研数据的描述第三节统计分析方法的选择第四节科研数据的综合分析第五节统计分析结果的解释与表达医学科研数据的整理与分析第一节科研数据的检查与整理16一、统计指标二、统计表三、统计图第二节科研数据的描述表达一、统计指标第二节科研数据的描述表达17(一)总量指标与相对数指标(二)平均数指标(三)变异指标一、统计指标(一)总量指标与相对数指标一、统计指标18统计表是用表格的方式表达统计资料和指标。在编制统计表时,应该遵循以下原则:1.重点突出,简单明了。即一张表只包含一个中心内容,使人一目了然,不要包罗万象。2.主谓分明,层次清楚。二、统计表统计表是用表格的方式表达统计资料和指标。在编制统计表19一、统计指标二、统计表三、统计图第二节科研数据的描述表达一、统计指标第二节科研数据的描述表达20科研数据的分析与处理课件21科研数据的分析与处理课件22医学科研数据的整理与分析第一节科研数据的检查与整理第二节科研数据的描述第三节统计分析方法的选择第四节科研数据的综合分析第五节统计分析结果的解释与表达医学科研数据的整理与分析第一节科研数据的检查与整理23(一)假设检验(二)区间估计(三)变量间关系的研究(四)判别分析一、统计分析方法概述(一)假设检验一、统计分析方法概述24包括有计量资料分布类型的假设检验、计量资料方差的假设检验、计量资料均数的假设检验、等级资料分布或位置的假设检验、两种属性间的独立性检验以及两种方法判断结果一致性的检验等。(一)假设检验包括有计量资料分布类型的假设检验、计量资料方差的假设检验、计25(二)区间估计▲概念:根据样本均数,按一定的可信度计算出总体均数很可能在的一个数值范围,这个范围称为总体均数的可信区间。▲方法:(1)u分布法(2)t分布法(二)区间估计▲概念:根据样本均数,按一定的可信度计算出总26总体均数(μ)的100(1-α)%置信区间(CI):(1)已知总体标准差σ,按正态分布原理,计算公式为:(2)σ未知,n较小,按t分布原理计算:(3)σ未知,n足够大(如n>100),按正态分布原理计算:(二)区间估计总体均数(μ)的100(1-α)%置信区间(CI):(二)区27总体率的置信区间估计查表法当n≤50时正态近似法当样本含量足够大,且样本率p和(1-p)均不太小。一般认为np和n(1-p)≥5。p±uαsp

总体率的置信区间估计查表法28(一)假设检验(二)区间估计(三)变量间关系的研究(四)判别分析一、统计分析方法概述(一)假设检验一、统计分析方法概述291.各指标之间无自变量与因变量之分(1) 研究变量之间的相互关系有直线相关分析、典型相关分析等。(2) 研究多个变量的内部从属关系,并寻找综合指标,降低变量的维数,其常用的方法主要有主成分分析、因子分析和对应分析。(3) 研究多个变量内部或多个样品之间的亲疏关系有聚类分析。(4) 研究多个变量内部的各种复杂关系有线性结构方程的协方差分析。(三)变量间关系的研究1.各指标之间无自变量与因变量之分(三)变量间关系的研究302.各指标之间有自变量与因变量之分研究变量之间的依存关系有直线回归分析、曲线回归分析、多项式回归分析、多元线性回归分析、概率模型回归分析、生存资料的参数模型回归分析、COX模型回归分析和对数线性模型分析。(三)变量间关系的研究2.各指标之间有自变量与因变量之分研究变量之间的依存关系有31(一)假设检验(二)区间估计(三)变量间关系的研究(四)判别分析根据一些明确分类的总体所提供的信息,对未知个体的归属进行分类的判别分析。一、统计分析方法概述(一)假设检验一、统计分析方法概述32分析目的资料类型设计方案数理统计条件选择统计分析方法需考虑的因素分析目的选择统计分析方法需考虑的因素33二、计量资料假设检验方法的选择例:欲了解某地城乡婴儿营养状况有无差别,测量了其血红蛋白含量,见下表。二、计量资料假设检验方法的选择例:欲了解某地城乡婴儿营养状况34首先要明确每次拟分析的定性变量个数是多少?其次要弄清定性变量的属性、列联表中频数的多少以及资料的收集方式。三、计数资料假设检验方法的选择首先要明确每次拟分析的定性变量个数是多少?三、计数资料假设检35科研数据的分析与处理课件36每次只分析两个变量时,可将资料整理为2×2表、2×k表和R×C表的形式。常用的统计分析方法有Pearsonχ2检验、校正χ2检验、配对计数资料的McNemarχ2检验、Fisher精确概率法检验、秩和检验、Ridit分析、等级相关分析、典型相关分析、一般趋势和线性趋势检验、Kappa检验等;如果需要同时分析研究的定性变量的个数≥3时,常用的统计分析方法有加权χ2检验、Mantel-haenszelχ2检验、logistic回归模型和对数线性模型等。每次只分析两个变量时,可将资料整理为2×2表、2×k表和R×37在计数资料的分析过程中,对于R×C表形式资料的分析是一个难点,存在的问题比较多。根据二维列联表中两个分组变量的类型以及分析的目的,对R×C表资料进行分类,因为不同类型的R×C表资料和不同的分析目的,就有不同的分析方法。R×C表检验方法的选择在计数资料的分析过程中,对于R×C表形式资料的分析是一个难点38双向无序R×C表资料及其统计分析方法的选择单向有序R×C表资料及其统计分析方法的选择双向有序且属性不同的R×C表资料及其统计分析方法的选择双向有序且属性相同的R×C表资料及其统计分析方法的选择R×C表检验方法的选择双向无序R×C表资料及其统计分析方法的选择R×C表检验方法的39科研数据的分析与处理课件40科研数据的分析与处理课件41对单向有序R×C表的两个分组变量,其中一个是无序的(实验分组变量——不同药品);另一个却是有序的(指标分组变量——处理效果)。此时不适合选用χ2检验分析资料,因为χ2检验与“疗效”的有序性之间没有任何联系,故应采用与“有序性”有联系的秩和检验或Ridit分析。R×C表检验方法的选择对单向有序R×C表的两个分组变量,其中一个是无序的(实验分组42科研数据的分析与处理课件43对双向有序且属性不同的R×C表的两个分组变量,如年龄组别与某种疾病发生程度都是有序的,但属性不同,此时,也不适合选用χ2检验分析资料,因为χ2检验与两个变量的有序性之间没有任何联系,应改用与两个变量的“有序性”有联系的等级相关分析、典型相关分析或线性趋势检验。R×C表检验方法的选择对双向有序且属性不同的R×C表的两个分组变量,如年龄组别与某44科研数据的分析与处理课件45对双向有序且属性相同的R×C表的两个分组变量,如两种方法对某种疾病发病程度诊断结果,它们都是有序的,且属性也相同。此时,研究的目的是要考察两种测定方法的测定结果之间是否具有一致性,故仍不适合选用一般的χ2检验分析资料,应采用与两个变量的有序性有联系的一致性检验或称Kappa检验,还可以用特殊的模型分析方法。R×C表检验方法的选择对双向有序且属性相同的R×C表的两个分组变量,如两种方法对某46医学科研数据的整理与分析第一节科研数据的检查与整理第二节科研数据的描述第三节统计分析方法的选择第四节科研数据的综合分析第五节统计分析结果的解释与表达医学科研数据的整理与分析第一节科研数据的检查与整理47对于同一份统计资料,由于研究目的的不同,处理方法不同,可以从多个方面进行分析,此即“综合分析”。通过对数据资料的综合分析,可以充分利用、挖掘资料所内涵的信息。第四节科研数据的综合分析对于同一份统计资料,由于研究目的的不同,处理方法不同,可以从48【实例】某医师将20名失眠患者随机等分为两组,一组服用安眠药,另一组服用安慰剂,研究者要评价某安眠药的催眠效果,治疗失眠前后的睡眠时间及其差值结果见表,试作统计分析。【实例】某医师将20名失眠患者随机等分为两组,一组服用安眠药49科研数据的分析与处理课件50平行组对照设计分析思路试验组:疗前疗后=>差值同质性比较组间比较

对照组:疗前疗后=>差值平行组对照设计分析思路51疗前是否均衡可比?

–两组疗前的比较每种药物是否有疗效?

–各组疗效的组内比较疗效间有没有差别?

–疗效差别的比较本例分析中的三个步骤是环环相扣的。疗前是否均衡可比?52平行组对照设计分析思路试验组:疗前疗后=>差值

同质性比较组间比较

对照组:疗前疗后=>差值平行组对照设计分析思路53【实例】对一组胃癌病人先后用两种泌酸刺激剂,然后分别测定其最大酸排量(mEq/h),以分析两药的效果,见表。【实例】对一组胃癌病人先后用两种泌酸刺激剂,然后分别测定其最54科研数据的分析与处理课件55配对资料t检验分析。按α=0.05水准拒绝H0,接受H1,差别有统计学意义,胃癌病人用加大组织胺后的最大酸排量与用五肽胃泌素后的最大酸排量间差别有统计学意义。配对资料t检验分析。56五肽胃泌素引起的最大酸排量是加大组织胺的百分之多少?五肽胃泌素引起的最大酸排量是加大组织胺的百分之多少?57•胃癌病人用加大组织胺后的最大酸排量比用五肽胃泌素者平均多1.30(95%CI:1.02~1.57)mEq/h。而两次测定值之间回归分析显示:若加大组织胺引起的最大酸排量升高1mEq/h,则五肽胃泌素引起者将平均递升0.90(95%CI:0.88~0.92)mEq/h,即五肽胃泌素引起的最大酸排量只是加大组织胺的90%。综合分析的结论•胃癌病人用加大组织胺后的最大酸排量比用五肽胃泌素者平均多158针对差值分析的配对t检验与阐明变量线性依存关系的回归分析相结合,假设检验与区间估计互补,使所得结论更加丰富、更加具体。针对差值分析的配对t检验与阐明变量线性依存关系的回归分析相结59例研究放射线对嗜酸粒细胞的影响。对一批同一种系的体重接近的小白鼠,以完全随机抽样方法抽取了11只小白鼠,在注射肾上腺素前、后二次测定其嗜酸粒细胞数,然后用一定剂量的放射线照射,经过24小时,再重复上述实验,每一只小白鼠均有4个测定值。二、进行综合分析的方法例研究放射线对嗜酸粒细胞的影响。二、进行综合分析的方法60科研数据的分析与处理课件611.单纯肾上腺素的作用

放射线照射之前,测定嗜酸粒细胞数(×106个/L),然后注射一定剂量的肾上腺素,再测其嗜酸性粒细胞,将⑵、⑶按自身对照设计作t检验(t=3.767,P<0.01)。2.照射放射线后肾上腺素的作用在照射一定剂量的放射线后,重复上述实验,将⑷、⑸按自身对照设计作t检验(t=6.921,P<0.001)。综合分析1.单纯肾上腺素的作用综合分析623.单纯照射放射线的作用将尚未注射肾上腺素时,照射放射线前、后的测定值,即⑵、⑷按自身对照设计作t检验(t=4.219,P<0.01)。4.照射放射线是否改变肾上腺素的作用

将放射线照射前的差值[⑶―⑵]与放射线照射后的差值[⑸―⑷],按自身对照设计作t检验(t=0.849,P>0.40)。

综合分析3.单纯照射放射线的作用综合分析631.小白鼠受到放射线照射后,血液中嗜酸性粒细胞减少;2.小白鼠注射肾上腺素后,血液中嗜酸性粒细胞减少;3.小白鼠受放射线照射24小时内,并未改变肾上腺素降低嗜酸性粒细胞数的作用和程度。结论1.小白鼠受到放射线照射后,血液中嗜酸性粒细胞减少;结论64例7.2下面就是该科研资料较为完整的背景介绍:某研究者收集到103例冠心病患者和100例正常对照者的多项指标,其中有组别(G)、性别(X1)、年龄(X2)、高血压史(X3)、吸烟史(X4)、胆固醇含量(X5)、甘油三酯含量(X6)、低密度脂蛋白含量(X7)、密度脂蛋白含量(X8)、脂蛋白(X9)、载脂蛋白A1含量(X10)、载脂蛋白B含量(X11)、基因型Xbal(X12)、基因型EcoRl(X13)、用药情况(X14),资料的格式见表7.5所示。例7.2下面就是该科研资料较为完整的背景介绍:某研究者收集65科研数据的分析与处理课件66(1)对冠心病人而言,直接分析某种基因型(X12或X13)取不同水平时7项血脂指标的均值和均值向量之间的差别有无显著性意义?(2)对冠心病人而言,同时分析“性别、吸烟史、高血压史、某种基因型(X12或X13)”对7项血脂指标的均值和均值向量的影响有无显著性意义?(3)对冠心病人而言,在设法排除“年龄、性别、吸烟史、高血压史和用药情况”等因素影响的前提下,分析某种基因型(X12或X13)取不同水平时7项血脂指标均值之间的差别有无显著性意义?(1)对冠心病人而言,直接分析某种基因型(X12或X13)取67科研数据的分析与处理课件68(4)对冠心病人而言,试对7项血脂指标间的内部从属性做客观评价。(5)对冠心病人而言,试对7项血脂指标间的亲疏关系做客观评价。(6)对冠心病人而言,假定病情轻重可通过7项血脂指标很好地反映出来,试根据7项血脂指标的数据,将他们划分成3组,以便做出关于病情“轻、中、重”的评判,可有的放矢地采取不同方案对不同病情的患者进行治疗。(4)对冠心病人而言,试对7项血脂指标间的内部从属性做客观评69科研数据的分析与处理课件70(7)利用正常人与冠心病人的7项血脂指标数据,建立一种方法,用来对一个怀疑患有冠心病的就诊者进行辅助诊断。(8)利用正常人与冠心病人的全部资料,建立一种方法,筛选出冠心病的危险因素,并且,当各危险因素在其取值范围内分别取某确定值时,预报某人患冠心病的概率有多大。(7)利用正常人与冠心病人的7项血脂指标数据,建立一种方法,71医学科研数据的整理与分析第一节科研数据的检查与整理第二节科研数据的描述第三节统计分析方法的选择第四节科研数据的综合分析第五节统计分析结果的解释与表达医学科研数据的整理与分析第一节科研数据的检查与整理72第五节统计分析结果的解释与表达1.要正确理解假设检验的结论。2.结论不能绝对化。3.在解释统计分析结果时,必须结合医学实际。第五节统计分析结果的解释与表达1.要正确理解假设检验的结论73(1)资料未作任何统计处理,仅根据实际数据的大小,凭经验做出某组与另一组之间的差别有显著性的结论;(2)虽然做了统计处理,但未交代所选用的统计分析方法,仅仅给出了P值;(3)做了统计学处理,也交代了所用统计分析方法,并给出了P值,未给出统计量的具体值。结果分析统计分析表达的常见错误(1)资料未作任何统计处理,仅根据实际数据的大小,凭经验做出74(1)所选用的统计分析方法;(2)根据样本数据计算所得的检验统计量的具体取值及其自由度;(3)假设检验的具体P值(写出P值的确切范围,如0.05>P>0.02);(4)有关总体参数的95%置信区间。结果分析统计分析结果的表述要求(1)所选用的统计分析方法;结果分析统计分析结果的表述要求75科研数据的分析与处理课件76科研数据的分析与处理课件77医学科研数据的整理与分析DataSortingandAnalysisinMedicalResearch李志春新乡医学院公共卫生学院医学科研数据的整理与分析李志春78医学科研数据的整理与分析医学科研数据的整理与分析79医学科研数据的整理与分析第一节科研数据的检查与整理第二节科研数据的描述第三节统计分析方法的选择第四节科研数据的综合分析第五节统计分析结果的解释与表达医学科研数据的整理与分析第一节科研数据的检查与整理80一、对象的检查二、缺项与差错三、资料的整理第一节科研数据的检查与整理一、对象的检查第一节科研数据的检查与整理81一、对象的检查首先要鉴别所调查或研究的个体是否属于所规定的调查对象或研究对象。在进行临床研究时,要特别注意疾病诊断、分类的正确性,这对于保证研究结果的正确性是十分必要的。一、对象的检查首先要鉴别所调查或研究的个体是否属于所82由于多种原因在一些调查表中经常可以见到缺项的存在,缺项的存在严重地影响到资料的完整性。通过检查发现研究资料中的差错也是十分必要的,应对研究数据作认真的检查。二、缺项与差错检查由于多种原因在一些调查表中经常可以见到缺项的存在,缺83专业检查统计检查二、缺项与差错检查专业检查二、缺项与差错检查84人工检查计算机检查二、缺项与差错检查人工检查二、缺项与差错检查85在周密实验设计指导下获得的实验数据,不应随意舍弃,否则实验结果的真实性与完整性就会受到破坏。可疑数据的处理在周密实验设计指导下获得的实验数据,不应随意舍弃,否则实验结86科研数据的分析与处理课件87在该数据指标服从正态分布的前提下,可用统计方法检查个别“可疑值”是否应当舍弃。当n>10时,可以用“”作为舍弃可疑值的准则。当n≤10时,可以采用Q检验法、Dixon检验法或Grubbs检验法,进行测量值的一致性检验,从而判断是否剔除可疑值。可疑数据的处理在该数据指标服从正态分布的前提下,可用统计方法检查个别“可疑88科研数据的分析与处理课件89在对资料做好检查、核对后,就需要把杂乱无章的资料条理化,以便于进行统计计算与分析,即整理资料。三、资料的整理在对资料做好检查、核对后,就需要把杂乱无章的资料条理化,以便90数据的计算机管理数据库的选择数据录入数据核查与清理数据加工(如编码、标准化、根据原始记录产生新的研究变量等)数据最终锁定并进入分析数据的计算机管理数据库的选择91科研数据的分析与处理课件92医学科研数据的整理与分析第一节科研数据的检查与整理第二节科研数据的描述第三节统计分析方法的选择第四节科研数据的综合分析第五节统计分析结果的解释与表达医学科研数据的整理与分析第一节科研数据的检查与整理93一、统计指标二、统计表三、统计图第二节科研数据的描述表达一、统计指标第二节科研数据的描述表达94(一)总量指标与相对数指标(二)平均数指标(三)变异指标一、统计指标(一)总量指标与相对数指标一、统计指标95统计表是用表格的方式表达统计资料和指标。在编制统计表时,应该遵循以下原则:1.重点突出,简单明了。即一张表只包含一个中心内容,使人一目了然,不要包罗万象。2.主谓分明,层次清楚。二、统计表统计表是用表格的方式表达统计资料和指标。在编制统计表96一、统计指标二、统计表三、统计图第二节科研数据的描述表达一、统计指标第二节科研数据的描述表达97科研数据的分析与处理课件98科研数据的分析与处理课件99医学科研数据的整理与分析第一节科研数据的检查与整理第二节科研数据的描述第三节统计分析方法的选择第四节科研数据的综合分析第五节统计分析结果的解释与表达医学科研数据的整理与分析第一节科研数据的检查与整理100(一)假设检验(二)区间估计(三)变量间关系的研究(四)判别分析一、统计分析方法概述(一)假设检验一、统计分析方法概述101包括有计量资料分布类型的假设检验、计量资料方差的假设检验、计量资料均数的假设检验、等级资料分布或位置的假设检验、两种属性间的独立性检验以及两种方法判断结果一致性的检验等。(一)假设检验包括有计量资料分布类型的假设检验、计量资料方差的假设检验、计102(二)区间估计▲概念:根据样本均数,按一定的可信度计算出总体均数很可能在的一个数值范围,这个范围称为总体均数的可信区间。▲方法:(1)u分布法(2)t分布法(二)区间估计▲概念:根据样本均数,按一定的可信度计算出总103总体均数(μ)的100(1-α)%置信区间(CI):(1)已知总体标准差σ,按正态分布原理,计算公式为:(2)σ未知,n较小,按t分布原理计算:(3)σ未知,n足够大(如n>100),按正态分布原理计算:(二)区间估计总体均数(μ)的100(1-α)%置信区间(CI):(二)区104总体率的置信区间估计查表法当n≤50时正态近似法当样本含量足够大,且样本率p和(1-p)均不太小。一般认为np和n(1-p)≥5。p±uαsp

总体率的置信区间估计查表法105(一)假设检验(二)区间估计(三)变量间关系的研究(四)判别分析一、统计分析方法概述(一)假设检验一、统计分析方法概述1061.各指标之间无自变量与因变量之分(1) 研究变量之间的相互关系有直线相关分析、典型相关分析等。(2) 研究多个变量的内部从属关系,并寻找综合指标,降低变量的维数,其常用的方法主要有主成分分析、因子分析和对应分析。(3) 研究多个变量内部或多个样品之间的亲疏关系有聚类分析。(4) 研究多个变量内部的各种复杂关系有线性结构方程的协方差分析。(三)变量间关系的研究1.各指标之间无自变量与因变量之分(三)变量间关系的研究1072.各指标之间有自变量与因变量之分研究变量之间的依存关系有直线回归分析、曲线回归分析、多项式回归分析、多元线性回归分析、概率模型回归分析、生存资料的参数模型回归分析、COX模型回归分析和对数线性模型分析。(三)变量间关系的研究2.各指标之间有自变量与因变量之分研究变量之间的依存关系有108(一)假设检验(二)区间估计(三)变量间关系的研究(四)判别分析根据一些明确分类的总体所提供的信息,对未知个体的归属进行分类的判别分析。一、统计分析方法概述(一)假设检验一、统计分析方法概述109分析目的资料类型设计方案数理统计条件选择统计分析方法需考虑的因素分析目的选择统计分析方法需考虑的因素110二、计量资料假设检验方法的选择例:欲了解某地城乡婴儿营养状况有无差别,测量了其血红蛋白含量,见下表。二、计量资料假设检验方法的选择例:欲了解某地城乡婴儿营养状况111首先要明确每次拟分析的定性变量个数是多少?其次要弄清定性变量的属性、列联表中频数的多少以及资料的收集方式。三、计数资料假设检验方法的选择首先要明确每次拟分析的定性变量个数是多少?三、计数资料假设检112科研数据的分析与处理课件113每次只分析两个变量时,可将资料整理为2×2表、2×k表和R×C表的形式。常用的统计分析方法有Pearsonχ2检验、校正χ2检验、配对计数资料的McNemarχ2检验、Fisher精确概率法检验、秩和检验、Ridit分析、等级相关分析、典型相关分析、一般趋势和线性趋势检验、Kappa检验等;如果需要同时分析研究的定性变量的个数≥3时,常用的统计分析方法有加权χ2检验、Mantel-haenszelχ2检验、logistic回归模型和对数线性模型等。每次只分析两个变量时,可将资料整理为2×2表、2×k表和R×114在计数资料的分析过程中,对于R×C表形式资料的分析是一个难点,存在的问题比较多。根据二维列联表中两个分组变量的类型以及分析的目的,对R×C表资料进行分类,因为不同类型的R×C表资料和不同的分析目的,就有不同的分析方法。R×C表检验方法的选择在计数资料的分析过程中,对于R×C表形式资料的分析是一个难点115双向无序R×C表资料及其统计分析方法的选择单向有序R×C表资料及其统计分析方法的选择双向有序且属性不同的R×C表资料及其统计分析方法的选择双向有序且属性相同的R×C表资料及其统计分析方法的选择R×C表检验方法的选择双向无序R×C表资料及其统计分析方法的选择R×C表检验方法的116科研数据的分析与处理课件117科研数据的分析与处理课件118对单向有序R×C表的两个分组变量,其中一个是无序的(实验分组变量——不同药品);另一个却是有序的(指标分组变量——处理效果)。此时不适合选用χ2检验分析资料,因为χ2检验与“疗效”的有序性之间没有任何联系,故应采用与“有序性”有联系的秩和检验或Ridit分析。R×C表检验方法的选择对单向有序R×C表的两个分组变量,其中一个是无序的(实验分组119科研数据的分析与处理课件120对双向有序且属性不同的R×C表的两个分组变量,如年龄组别与某种疾病发生程度都是有序的,但属性不同,此时,也不适合选用χ2检验分析资料,因为χ2检验与两个变量的有序性之间没有任何联系,应改用与两个变量的“有序性”有联系的等级相关分析、典型相关分析或线性趋势检验。R×C表检验方法的选择对双向有序且属性不同的R×C表的两个分组变量,如年龄组别与某121科研数据的分析与处理课件122对双向有序且属性相同的R×C表的两个分组变量,如两种方法对某种疾病发病程度诊断结果,它们都是有序的,且属性也相同。此时,研究的目的是要考察两种测定方法的测定结果之间是否具有一致性,故仍不适合选用一般的χ2检验分析资料,应采用与两个变量的有序性有联系的一致性检验或称Kappa检验,还可以用特殊的模型分析方法。R×C表检验方法的选择对双向有序且属性相同的R×C表的两个分组变量,如两种方法对某123医学科研数据的整理与分析第一节科研数据的检查与整理第二节科研数据的描述第三节统计分析方法的选择第四节科研数据的综合分析第五节统计分析结果的解释与表达医学科研数据的整理与分析第一节科研数据的检查与整理124对于同一份统计资料,由于研究目的的不同,处理方法不同,可以从多个方面进行分析,此即“综合分析”。通过对数据资料的综合分析,可以充分利用、挖掘资料所内涵的信息。第四节科研数据的综合分析对于同一份统计资料,由于研究目的的不同,处理方法不同,可以从125【实例】某医师将20名失眠患者随机等分为两组,一组服用安眠药,另一组服用安慰剂,研究者要评价某安眠药的催眠效果,治疗失眠前后的睡眠时间及其差值结果见表,试作统计分析。【实例】某医师将20名失眠患者随机等分为两组,一组服用安眠药126科研数据的分析与处理课件127平行组对照设计分析思路试验组:疗前疗后=>差值同质性比较组间比较

对照组:疗前疗后=>差值平行组对照设计分析思路128疗前是否均衡可比?

–两组疗前的比较每种药物是否有疗效?

–各组疗效的组内比较疗效间有没有差别?

–疗效差别的比较本例分析中的三个步骤是环环相扣的。疗前是否均衡可比?129平行组对照设计分析思路试验组:疗前疗后=>差值

同质性比较组间比较

对照组:疗前疗后=>差值平行组对照设计分析思路130【实例】对一组胃癌病人先后用两种泌酸刺激剂,然后分别测定其最大酸排量(mEq/h),以分析两药的效果,见表。【实例】对一组胃癌病人先后用两种泌酸刺激剂,然后分别测定其最131科研数据的分析与处理课件132配对资料t检验分析。按α=0.05水准拒绝H0,接受H1,差别有统计学意义,胃癌病人用加大组织胺后的最大酸排量与用五肽胃泌素后的最大酸排量间差别有统计学意义。配对资料t检验分析。133五肽胃泌素引起的最大酸排量是加大组织胺的百分之多少?五肽胃泌素引起的最大酸排量是加大组织胺的百分之多少?134•胃癌病人用加大组织胺后的最大酸排量比用五肽胃泌素者平均多1.30(95%CI:1.02~1.57)mEq/h。而两次测定值之间回归分析显示:若加大组织胺引起的最大酸排量升高1mEq/h,则五肽胃泌素引起者将平均递升0.90(95%CI:0.88~0.92)mEq/h,即五肽胃泌素引起的最大酸排量只是加大组织胺的90%。综合分析的结论•胃癌病人用加大组织胺后的最大酸排量比用五肽胃泌素者平均多1135针对差值分析的配对t检验与阐明变量线性依存关系的回归分析相结合,假设检验与区间估计互补,使所得结论更加丰富、更加具体。针对差值分析的配对t检验与阐明变量线性依存关系的回归分析相结136例研究放射线对嗜酸粒细胞的影响。对一批同一种系的体重接近的小白鼠,以完全随机抽样方法抽取了11只小白鼠,在注射肾上腺素前、后二次测定其嗜酸粒细胞数,然后用一定剂量的放射线照射,经过24小时,再重复上述实验,每一只小白鼠均有4个测定值。二、进行综合分析的方法例研究放射线对嗜酸粒细胞的影响。二、进行综合分析的方法137科研数据的分析与处理课件1381.单纯肾上腺素的作用

放射线照射之前,测定嗜酸粒细胞数(×106个/L),然后注射一定剂量的肾上腺素,再测其嗜酸性粒细胞,将⑵、⑶按自身对照设计作t检验(t=3.767,P<0.01)。2.照射放射线后肾上腺素的作用在照射一定剂量的放射线后,重复上述实验,将⑷、⑸按自身对照设计作t检验(t=6.921,P<0.001)。综合分析1.单纯肾上腺素的作用综合分析1393.单纯照射放射线的作用将尚未注射肾上腺素时,照射放射线前、后的测定值,即⑵、⑷按自身对照设计作t检验(t=4.219,P<0.01)。4.照射放射线是否改变肾上腺素的作用

将放射线照射前的差值[⑶―⑵]与放射线照射后的差值[⑸―⑷],按自身对照设计作t检验(t=0.849,P>0.40)。

综合分析3.单纯照射放射线的作用综合分析1401.小白鼠受到放射线照射后,血液中嗜酸性粒细胞减少;2.小白鼠注射肾上腺素后,血液中嗜酸性粒细胞减少;3.小白

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论