试验数据统计分析步骤_第1页
试验数据统计分析步骤_第2页
试验数据统计分析步骤_第3页
试验数据统计分析步骤_第4页
试验数据统计分析步骤_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试验数据统计分析教程则要求两个变量均为随机变量且服从正态分布,也就是说只有H型回归分析资料才能进行直线相关分析(Spearman秩相关分析可分析定量资料与定性资料的相关性)。③统计量量纲单位不同相关系数是无量纲的统计量,而斜率却是有量纲的统计量,其量纲为“响应变量量纲自变量量纲”,截距的量纲与响应变量量纲相同史。2,相关和回归分析的相同点①方向一致对某资料同时计算直线相关系数和直线回归系数,可发现它们的正负号一致。②假设检验等价对同一样本,对其直线相关系数和直线回归系数进行假设检验所得到的值是相同的。3,直线相关与回归分析的关键点(绘制散布图)将(X,Y)的n对数值绘在直角坐标系内,得到X与Y变化趋势的散布图,如果n个点形成的散布图呈一条明显的曲线趋势时,宜拟合一条曲线回归方程;如果n个点在一条不太宽的长带内随机地分布着,此“长带”不与X轴平行,也不与Y轴垂直,10/29且各散点的分布情况不存在明显的曲线趋势,可考虑进行直线相关和回归分析;如果n个点形成的散布图近似于一个圆盘,则说明X与Y之间无确定的变化趋势,几乎是互相独立的,不能硬把他们捏合在一起分析。4,直线相关与回归分析要点总结①必须有专业知识为依据;②必须绘制散布图,并正确分析散布图;③计算关键的统计量(如r、a、b),并进行假设检验;④结合专业和统计学知识判断所作的统计分析是否有实用价值。若是直线相关分析,就是要结合s的数值大小(一般应「2>0.5),给出较为明确的专业结论;若是直线回归分析,就是要看所拟合的直线回归方程与全部散点的吻合程度,对直线回归方程中的2个参数(总体截距、总体斜率)的假设检验是否都具有统计学意义,其正负号是否符合专业上的含义,整个直线回归方程的剩余标准差是否较小,将各X值代入直线回归方程后,其对应的Y的预测值在专业上是否都成立。二、一元多因素回归分析方法当结果变量(常称为应变量)依赖于原因变量(常称为自变量)变化时,研究应变量随多个自变量变化的规律所对应的统计分析11/29方法,称为多重回归分析。进行多重回归分析时应把握的要领如下①当应变量为近似服从正态分布的随机变量时,常选用多重线性回归分析。②当应变量分别为二值变量、多值有序变量或多值名义变量时,应分别采用一般的多重logistic回归分析、有序变量的多重logistic回归分析和扩展的多重logistic回归分析。备注:可用Grubbs法检验某些“可疑值”是否为异常值。§1-6:定性资料的统计分析一、定性资料与列联表定性资料(如治愈、未愈),一般不以个体为计量单位,而是以处理组为计量单位,换句话说,资料以分组且用表格的形式呈现出来,这种表通称为“列联表一般来说,一个列联表中只有一个结果变量,其他都是原因变量,但也有少数列联表中的变量不包含结果变量,此时只能考察全部定性变量全部水平组合下的频数分布情况。定性资料有些属于原因、有些属于结果,若将定性变量的具体取值一一列出,则不便看出资料之间内在的联系,故人们常以表格的形式对资料进行整理或归纳,这种表格被称为列联表。只含有两个定性变量,因而叫做二维列联表,表中的原始频数只有两行两列12/29,简称为2x2表或四格表;而表中的原始频数占3行4列,故简称为3x4表,一般被简称为RxC表;表中含有3个定性变量,故被称为三维列联表,当列联表中定性变量的个数大于等于3时,一般被统称为高维列联表。二、定性资料分析步骤正确地实现定性资料的统计分析,关键是三点。其一,给定性资料所对应的列联表命名;其二,弄清统计分析的目的;其三,检查定性资料是否具备某些特定分析方法所要求的前提条件。每次只分析两个定性变量时,可将资料整理为2x2表、2xk和RxX表的形式。常用的统计分析方法有Pearson次检验、校正%2检验、配对计数资料的MxNemarx%2检验、Fisher的精确检验、秩和检验、Rid让分析、等级相关分析、典型相关分析、一般趋势和线性趋势检验、Kappa检验等;若需要同时分析的定性变量的个数N3时,常用的统计分析方法有加权%2检验、Mantel-haenszel总检验、logisMx回归模型和对数线性模型等。一般浮检验与变量的有序性没有联系,用一般浮检验进行分析,得到的结论是两组的频数分布是否相同,而不能得出两组疗效之间的差别是否具有显著意义的结论。一般%2检验只能用来考察列联表资料的行变量与列变量之间是否独立。分析定性资料的相关分析方法,如:Spearman秩相关分析,Kendall秩相关分析或典型相关分析。13/29三、2x2表资料的分析方法1,2x2表资料分析方法概述关于2x2表资料的统计分析方法的合理选择:2x2表资料的统计分析方法取决于其设计类型,即横断面研究设计、队列研究设计、病例对照研究设计和配对设计四种类型,每种类型又需考虑一些具体情况,方可选择较为合适的统计分析方法处理资料。常用的方法有:一般总检验、校正%2检验、Fisher的精确检验;计算相对危险度(RR)、计算比数比(OR)、检验总体RR(或OR)与1之间的差别是否具有统计学意义的%2MH检验;配对设计定性资料的McNemar为2检验。一般认为,2x2表资料采用Fisher精确检验法结果比较可靠,若用统计软件实现统计计算,均可选用Fisher精确检验计算的结果。对于二维列联表而言,一般可分为以下4类:第1类:双向无序的二维列联表。当表中小于5的理论频数的个数小于总格子数的1/5时,需要选用Fisher的精确检验,否则,可以选用建检验。若是2x2表(或称四格表),应根据实验设计类型,选择相应的统计分析方法:若属横断面研究设计,当缺乏统计软件进行Fisher精确计算时,还可考虑用校正的%2检验;若属队列研究设计或病例对照研究设计,先将其视为横断面14/29研究设计资料处理,当得到Pv0.05时,在求出相对危险度RR(队列研究设计时用)或比数比OR(病例2对照研究设计时用)后,用%2MH计算公式检验RR(或OR)是否等于1。第2类:结果变量为有序变量的二维列联表。此时,所选用的统计分析方法必须与结果变量的有序性有联系,可供选用的统计分析方法有“秩和检验'Ridt分析呜“有序变量的Logistic回归分析”。第3类:双向有序且属性不同的二维列联表。此时,根据实际情况可能提出四个不同的分析目的,将对应四套分析方法:目的一:仅关心结果变量的有序性,可将其视为前面介绍的“第2类列联表”,选择相应的统计分析方法;目的二:希望研究两有序变量之间的相关性的高低,此时宜选用定性资料的相关分析,如Spearman秩相关分析或典型相关分析;目的三:希望研究两有序变量之间是否存在线性变化趋势,可以选用线性趋势检验;目的四:希望研究各实验分组中的频数分布是否相同,此时可选用一般水检验或Fisher精确检验(注意:此时的结论不应该是“行变量与列变量之间呈正相关或负相关关系o第4类:双向有序且属性相同的二维列联表。这种表一般都是考察用两种类似的检测方法检测同-一批样品,看检测结果是否一致,故需要做一致性检验或称Kappa检验。若是2x2表时,通常称为配对设计的四格表,此时,常检验不一致部分相差是否具有统计学意义,用McNemar%215/29检验;当然,也可做一致性检验。但这两种检验的目的和对检验结果的解释是不同的。2,3种分析2x2表资料的方法的注意事项①一般的%2检验;②连续性校正的浮检验;③Fisher的精确检验。选择条件:当总样本含量n240,且理论频数T均大于5时,选用方法①;当总样本含量n>40,但有理论频数满足仁Tv5时,选用方法②;当总样本含量n<40或有理论频数小于1时,选用方法③。样本较小的定性资料的统计分析,一般不宜采用工2检验,而应选用Fisher的精确检验来处理。配对研究设计的2x2表资料,对于隐含金标准和特设金标准的2x2表资料,可有2种统计分析方法:①检验2种方法检测结果不一致部分差异是否具有统计学意义,可用McNemar%2检验公式计算;②检验2种检测方法检测结果是否具有一致性,可用Kappa检验(即一致性检验)法。比较两种检测方法的检测结果是否一致,原本属于配对设计问题,但人们在收集资料时常按成组设计形式列表,这样就将配对设计问题人为地转化为成组设计的问题了,通常都会降低检验的功效16/29不:格,靴长?修改行的形式)1720- IS2J0合格 4、公路 frit21198什格 ・ 1 3不介解 c 4 17一H 建 1 20袅ianttm力处理前篇检鹿第唳(&।修改后的形式)去3饵坟甘祈3处理花行疗介知T(&I戒3,理论频数的计算方法・1两一为■WRMW/制»现・告累♦一; 2敷 /泊一 -it

ffWA M<a) ”(b) 40(e)一拘H Ug49M so⑺♦H 41《■》 59(■) 1U0(“与各原始频数对应的理论频数的计算方法为:与特定格对应的行合计与列合计相乘后除以n。例如,与观察频数“针对应的理论频数=(exg)/no四、RxC表资料的分析方法xC表资料的统计分析方法取决于表中两定性变量的性质和分析B的,按性质可将此类列联表分为以下四类:即“双向无序的RxC表”、“结果变量为有序变量的单向有序的RxC君,“双向有序且属性不同的RxC表”和“双向有序且属性相同的RxC表”。对于RxC表资料,还需结合资料所具备的条件或分析目的,选用合适的统计分析方法,他们是:一般贮检验、Fisher的精确检验;秩和检验、Ridit分析、有序变量的Logistic回归分析;秩相关分析或典型相关分析;线性趋势检验;一致性(或叫Kappa)检验或特殊模型分析。1,双向无序的RxC表资料17/29顾名思义,就是表中2个定性变量都是名义变量,表中没有小于5的理论频数,可以选用一般的总检验公式计算。表中小于5的理论频数的格子数若过了总格子数的1/5,若仍选用一般的%2检验公式计算,将会增大犯假阳性错误的概率,故应改用Fisher的精确检验法。2,单向有序的RxC表资料“结果变量为有序变量的单向有序RxC列联表”,可以选用的统计分析方法有秩和检验、Ridit分析和有序变量的logistic回归分析;原因变量为有序变量的单向有序RxC列联表C列联表”,应被视为“双向无序的RxC列联表”,因列联表内小于5的理论频数的格子数超过了总格子数的1/5,故宜选用Fisher的精确检验法。3,双性有序且属性不同的RxC资料RxC列联表中的2个定性变量都是有序变量,且它们的属性(如一个变量为年龄,而另一个变量为疗效,显然它们反映了事物的不同方面,称为属性)不同,此时,称这样的列联表资料为双向有序且属性不同的RxC列联表资料。一般来说,有以下4个可能的分析目的。⑴只关心各年龄组患患者治疗结果之间的差异是否具有统计学18/29意义,此时,年龄的有序性就变得无关紧要了,可将此时的“双向有序RxC列联表资料”视为“结果变量为有序变量的单向有序RxC列联表资料”,可以选用的统计分析方法有秩和检验、Ridit分析和有序变量的logistical归分析。⑵若希望考察年龄与疗效之间是否存在线性相关关系,此时,需要选用处理定性资料的相关分析方法,通常采用Spearman秩相关分析方法。⑶若2个有序变量之间的相关关系具有统计学意义,研究者希望进一步了解这2个有序变量之间的变化关系是呈直线关系还是呈某种曲线关系,此时宜选用线性趋势检验。⑷若希望考察列联表中各行上的频数分布是否相同,宜选用一般%2检验或Fisher的精确检验(若列联表内小于5的理论频数的格子数超过了总格子数的1/5)。当RxC列联表中的2个定性变量都是有序变量,且它们的属性相同,则称这样的列联表资料为双向有序且属性相同的RxC列联表资料,这样的资料被称为双向有序且属性相同的“方形”列联表资料,简称为“方表这样的资料实际上就是配对设计2x2列联表资料的“扩大”,只不过在处理配对设计2x2列联表资料时,人们更关心的是219/29第一章:数据分析基本方法与步骤?残部公类)宝量受样味宝挡受样(统计资料一般分为定量资料和定性资料两大类。定量资料测定每个观察单位某项指标量的大小,所得的资料称为定量资料定量资料又可细分为计量资料(可带度量单位和小数点,如:某人身高为1.173m)和计数资料(一般只带度量单位,但不可带小数点,如:某人脉搏为73次/min)。①计量资料在定量资料中,若指标的取值可以带度量衡单位,甚至可以带小数标志测量的精度的定量资料,就叫“计量资料例如测得正常成年男子身高、体重、血红蛋白、总铁结合力等所得的资料。②计数资料在定量资料中,若指标的取值可以带度量衡单位,但不可以带小数即只能取整数,通常为正整数的定量资料,就叫“计数资料”。例如测得正常成年男子脉搏数次、引体向上的次数次。2/29种检测方法检测的结果不一致部分的数量之间的差异是否具有统计学意义,而在处理“方表”资料时,人们更关心的是2种检测方法检测的结果之间是否具有一致性,故常用的统计分析方法叫做一致性检验或称为Kappa检验。五、高维列联表资料的分析方法高维表资料的统计分析方法取决于表中定性变量是否能分出“原因和结果变量”,若分不出原因和结果变量,一般需要选用对数线性模型分析法。若分得出原因和结果变量,则可分为以下3种情形:即结果变量为二值变量的高维表、结果变量为多值有序变量的高维表和结果变量为多值名义变量的高维表。结果变量为二值变量的高维列联表。可以选用多元Logistic回归分析或对数线性模型分析,某些特殊情况下还可选用加权为2检验。第2类:结果变量为多值有序变量的高维列联表。可以选用有序变量的多元Logistic回归分析。第3类:结果变量为多值名义变量(如血型)的高维列联表。可以选用对数线性模型分析或扩展的多元Logistic回归分析。多(五)维列联表资料,处理这种资料可供选用的统计分析方法有两种,其一,对数线性模型,用此法是比较复杂的,要想寻找到最佳的模型,非下大功夫不可。其二,采用多元Logistic回归分析模型,用此法也需要下点功夫方可获得较为理想的计算结果,不仅考察了多个定性的原因变量、还同时考察了多个交互作用20/29项对观测结果变量的影响.§1-7:图表及其他一、相对数“比与率,,有时较难分清,因此,人们在使用中经常混淆。它们的共同点在于求率与比时所用公式的基本形式是完全相同的,都是由两个绝对数之商乘以100%。它们的不同点在于率反映某种事物或现象发生的强度,而比则反映“部分与整体”或“某一部分与另一部分”之间的关系。率是强度相对数,表示在一定范围和时间内,某现象的发生次数与该现象可能发生的总次数之比,说明该现象发生的强度。构成比它表示仅具有属性的那一部分个体数目占全部个体总数的比重。构成比的一个明显特点是属于同一整体的各项之和必须是100%。相对比它是两个有关指标数值之比,说明两者的对比水平:用来反映发展速度时,定基比与环比分别为定基比各时间点上的统计指标都以第个时间点上的统计指标为分母求得环比各时间点上的统计指标都以它前面的那个时间点上的统计指标为分母求得。用来反映增长速度时,定基比与环比分别为定基比各时间点上定基比发展速度减一,环比各时间点上环比发展速度减一。21/29二、图表复式条图适合表达具有一个统计指标,两个分组因素的资料,横轴上先安排其中的一个分组因素,在其不同水平处再安排另一个因素。通常这两个因素都是名义变量,不能表达连续变量(如浓度、时间变化等)。线图适合表达观察指标随时间变化的趋势,名义变量,不适合用普通线图来表达。第二章:SPSS统计软件应用§1-1:关键功能项的用法22/291,正交设计Data-orthogonaldesign2,数据处理有时需要对变量进行分层分析,例如对性别中的男女分别分析,需要进行数据拆分,命令为:Data-splitfiles三、模块Analyze(一)亚模块:Descriptivestatistics,基本数据统计分析Analyze-Descriptivestatistics,用于了解数据的基本特征,为统计分析做准备。主要包括:1,频数分析Frequencies:Analyze-DescriptiveStatistics-Frequencies一般用于分析频数资料(定量资料里的计数资料),包括集中趋势、离散趋势、频数分布(峰度、偏度)。2,描述性统计分析Des分ptives:Analyze-Descriptivestatistics-Descriptives,一般用于描述一个变量的数据分布情况,和频数分析的功能类似,区别在于该部分有一个对分析变量进行标准化处理的选项Z=(X-X')/Sii3,探索分析Explore:Analyze-Descriptivestatistics-Explore主要目的:①对数据进行初步检查,判断有无离群点(outliers)和极端值(extremevalues);②对前提条件假定进行检验,如正态性和方差齐性检验,不满足正态分布和方差齐性时,提示数据转换的方式,最后决定使用参23/29数检验还是非参数检验进行数据分析。给出基本统计量、正态性检验和描述性统计图(茎叶图、直方图和箱丝图)。Spreadvs.LevelwithleveneTest:Levebe方差齐性测验,首先选择untransformed,对原始数据进行齐性检验,如果满足齐性,则到此为止。如果不满足齐性,应该选择powerestimation选项,确定事转换方法,在6种基变化方法中尝试寻找满足齐性的方法。这6种方法分别为:Naturallog(自然对数变换系统默认)、1/squareroot平方根倒数变换、Reciprocal倒数变换、squareroot平方根变换、square平方变换、cube立方变换。正态性检验:Analyze-descriptivestatistics-explore-plots-normalityplotswithtestsSig(significancelevel)即P值越大,越支持资料服从正态分布;正态性检验Q-Q图,散点的分布接近于一条直线,则资料服从正态分布。4,crosstabs列联表资料分析用于二维及高维列联表、定性资料分析工具,有22种检验和相关性度量方法。该分析方法往往需要将数据说明为频数数据,方法,Data-weightcases-weightcaseby■选择相应的变量进行指定。24/29★Statistics:统计W.击Statistics按钮.弹出Statistics(统计量)对话和(M5-17),Chi-square检验:对于四格表资料,用输出Pearsonx?检验、似然比k2检验(Likelihoodratio)»注续性校正x?履验(ContinuityCorrecUon)及Fisher精确概率冷验(FisherSExactlest)的结果,说明:PearsonChi-square:非校正乂’检验,适于RXC表资料0ContinuityCorrection:校正乂?检验,仅用于四格表资料,LikelihoodRatio:似然比x?检验,适于RXC表资料,FishefsExactTest:Fisher精谢概率检的,仅用于四格表资料.Linear-by-LincarAssociation:线性相关性检验.两货量均为等级变量,目均从小到大排列晡方有意义,其他情况可忽略C配对计数费科的x?检验(McNemar检验Correlations:计奇Pearson和Spearman相关系数.用以说明打变量和列变出的相关程度,◊Nominal:两分类变址的关联发(AsMK,ialion)测量.口ContingencyCoefficient:列联系数.C=V(x2/(x24-N)),这里,N为总例数.C取值在。至1之间,其值越大,表示关联性越强,PhiandCramcfsV6H〃x,/N):Cramur列联系数.V二x7N(k-[))).这里,k为行数和列数中较小的一个数.对于四格表资料,4>=V.两者取值均在0至1之间.其值越大,表示关联悴越怪口Lambda:减少预测误差率,取值在。乍I之间,】表小弦测效果最好,0表示雄差.Uncertainlycoetllcieni:不定系虬25/29oOrdinal:两忏序分类变里(等级变城)的X联度测量.Gamma:测量两个等级变垃之间关联度的统计殳.YMP-Q)/(P4Q),这里,P为和谐对f数(Concordantpairs).Q为非和谐时子数।Discordantpairs).丫取值在一】干+1之间,+1我小完全正关联(Perfectpositiverelationship)*—I表示完全女美联(Perfectnegativerelationship).U表示无关联."Somersd:该统计量为Gamma统“星的非对称形式的扩展,与Gamma统计呈恪一小同的是,分母部分加I.中性对子数(Tiedpairs).其取值危困及母义与Gamma相同.二Kendallstau-b:计算式为:】/(P-Q"V((P+Q-»Tx)X(P+Q+Ty)).这里.Tx为第1个变量的中性数.丁丫为第2个变量的中性数.门Kendall'stau-c:匹算式为:tc=2nMP-Q)/(N?<m-I)),这里,m为打数和列数中较小的数,N为样本总例数.ONominalbyInterval:一个定性变域和•个定量变量间的关联度。口EU:关联度统计纪.Kappa:k系数,为吻合度测量(Measureofagreement)系数.用以测俄两观测者或两观测设得之间的吻合程度,取值一I至+12何,其值越大,说明吻合程度越高.Risk:危险度分析,只适于四格衣资料,可纶出相对危险度和比数比(Odds皿沁)・□McNcman配对计数灸科的x?检验.□Cochran'sandMantel-Haenszelstatistics:Mamel-Haenszd公共OR值检验,用以检验在协变依(分层变量)存在条件卜,两个二分类变量是否独立•选此项后,Testcommonoddsratioequeals:[\_\被激活,怅内】为系统默认,即检验公大OR值与1有无显著性茅异.分层变量(男女-吸烟与否・患病情况)经Risk分析,得出or值(不包括1说明说明是致病因素),若检验显著,不需要再观察Mantel-haenszel计算的公共OR值。•注意:经一致性检验各层的OR值之间有显著差异时,不宜计算公共OR值。(二)亚模块:comparemeans均数比较Analyze-comparemeans用于定量资料的分析,有18种统计量。1,单样本T测验Analyze-comparemeans-onesampleTtests用于已知样本均数和总体均数的比较,需在testvalue处输入总体均值。Confidenceinterval95%,是样本均数与总体均数之差的95%置信区间估计,如果有显著差异,区间应不包含0.26/292,配对样本T测验,Analyze-comparemeans-PairedsamplesTtest:用于配对定量资料的比较,检验配对样本差值的总体均数与。的差异有无显著性意义,以及配对样本是否相关。独立样本T测验,Analyze-comparemeans-independentsamplesTtest:也称两样本T测验,用来检验两个独立样本的总体均数是否有显著差异。单向方差分析,Analyze-comparemeans-onewayanova用于完全随机资料(定量)的多个样本均数的比较和样本均数间的多重比较,亦可进行多个处理组与一个对照组的比较。(备注:一般这些处理都属于一个因素的多个水平)Dependentlist:因变量,可以是1个也可以是多个Factor:因素(自变量),只能是一个Posthocmultiplecomparisons(多重比较)27/29◊EqualVariancesAssumed:满足方差齐性要求。满足方K齐性要求共有14种方法可供选抨,常用的方法有LSD法(LeastrignificaniDifference»域小显蓍差值法),Scheft'e法,SNK法(Student-Neuman-Keuls),Tukey法.Duncan法,Bonferroni法等,H*IJ«LSD法最敏感,Scheffe法较不敏感,SNK法应用较多a多重比较一般在方笨分析显著的情况下应用,芥方差分析不显著.无论多禾比较的结果如何,都不应采纳。□Dunnett:Dunnctt法,用T•多个处理组和一个对照组的比较。选择此项,可激活ControlCategories栏中设定第1纠(First)或最1组(Last)为对照组供选择.Test栏中确定单、双例检验。02-side:双侧检验,为系统默认方式.OControl:单侧检验.比较组均数大于对照组均数.O<Control:单侧检验.比较纠均数小于对照蛆均数.OEqualVariancesnotAssumed:不满足方差齐性要求时,以下方法M供选择:Tambane'sT2Dunnett'sT3Games-HowellDunnett'sC★Contrasts...:有序分组(类)的多重比较。此略。(三)亚模块:Generallinearmodels广义线性模型分析,Analyze-Generallinearmodels,用于定量资料的分析,有18种统计量。主菜单Analy2的GeneralLinearModels《广义线性模型)过程含有4个子模块,即Univariate(单变量方若分析八RepealedMeasures(簟复渊量方差分析)、Muhivaiiate(多变量方差分析)和VarianeComponenS(方差分量分析),本章仅介绍前两个模块的内容.这两个模块包含了一般的方某分析内容,如完仝随机设计资料的方差分析(One.wayANOVA).班机单位处设计资料的方差分析(Two-wayANOVA).拉丁方设计资料的方差分析(ThreewayANOVA)、析因分析(Factorialanalysis)、交叉设计(Cross-overdesign)«正交设计(Orthogonaldesign)、裂区设计(Split-plotdesign)资料的方差分析、协方差分析、收贪史世数据的方差分析,等等.广义线性模型分析过程既可分析各个囚索对一个反应变■的主效应,亦可分析各因素之间的交互效应:既可用于平衡设计资料,亦可用于季平衡设计资料:既可用于完整数据的较料,办可用于缺失数据的资料:该过程还可用于回白分析.(四)亚模块:correlate相关分析,Analyze-correlate1,双变量相关分析:Analyze-correlate-bivariate双变量正态分布资料可选择积矩相关系数(pearson相关系数),非双变量正态分布资料,可选择等级相关系数(spearman相关系28/29数)或kendall相关系数等非参数方法分析。(五)亚模块:Regression回归分析,Analyze-Regression1,线性回归分析Analyze-Regression-linear用于一个或多个自变量和一个因变量之间的线性数量关系。Method:「Enter司:回归分析方法,有5忡方法可供选界.Enter:强迫引入法.即普通回归分析,所选自变量仝部进入方程,为系统默认方式.Stepwise:逐步回归法.根据在Options对话M中设定的标准在”算过程中逐步加入有显著性意义的变出和典除无拈著性意义的变量,立到所建立的方程式中不再有可加入和可副除的变量为止.Remove:强迫别除法.根据设定的条件然.除自变时,Backward:向后逐步法.所选自变量令部走入方程,限处Options对语机中设定的标不在计a过程中逐个的除变量,直到所建立的方程式中不再含有m制珍的变状为止.Forward:向前逐力法.根执Options对话框中设定的标准在计第过程中逐个加入单个丈量,通到所建。的方桎式中不再有可加入的交付为止,29/29定性资料观测每个观察单位某项指标的状况,所得的资料称为定性资料。定性资料又可细分为名义资料(如血型分为:A、B、AB、。型)和有序资料(如疗效分为:治愈、显效、好转、无效、死亡)。①名义资料在定性资料中,若指标的不同状况之间在本质上无数量大小或先后顺序之分的定性资料,就叫“名义资料”。例如某单位全体员工按血型系统型、型、型、型来记录每个人的情况所得的资料;又例如某市全体员工按职业分为工人、农民、知识分子、军人等来记录每个人的情况所得的资料。②有序资料在定性资料中,若指标质的不同状况之间在本质上有数量大小或有先后顺序之分的定性资料,就叫“有序资料例如某病患者按治疗后的疗效治愈、显效、好转、无效、死亡来划分所得的资料;又例如矽肺病患者按肺门密度级别来划分所得的资料。判断资料性质的关键是把资料还原为基本观察单位的具体取值形式,而不要被资料的表现所迷惑。关键是要看每一个具体的取值是由“观察单位个数”计算得到的,还是由每一个观察单位自身的观测结果计算得到的。若属于前者,就应叫定性资料飞若属于后者,就应叫定量资料。§1-2:重复取样、重复测量、重复试验重复原则的概念重复通常有三层含义,即“重复取样”、“重复测量”和“重复试验”O1,重复取样:从同一个样品中多次取样,随着时间的推移,测量某定量指标的数值,称为“重复取样”O随着时间的推移,2,重复测量:对接受某种处理的个体,3/29对其进行多次观测,称为“重复测量”O3,重复试验:试验设计中所讲的重复原则指的是“重复试验”,即在相同的试验条件下,做两次或两次以上的独立试验。这里的“独立”是指要用不同的个体或样品做试验,而不是在同一个体或样品上做多次试验。整个试验设计所包括的各组内重复试验次数之和,称为样本大小或样本含量(n)。相同的试验条件下,对不同的受试对象(或样品)进行观测称为n次独立的重复试验。在不同的试验条件下(通常为不同时间),对同一受试对象进行反复观测,称为重复测量。重复测量数据之间并不满足独立性的要求。相同试验条件下的试验次数称为样本含量n,n<3,当指标的变异度较大时,很难呈现出数据之间的规律性。对照组的形式有多种,即自身对照(处理前、后对照)、完全随机对照(空白对照、相互对照、试验对照、标准对照)、中外或历史对照。在实际应用中,往往是多种对照形式同时运用。§1-3:试验设计的基本类型试验设计类型有几十种,其中常见的有:配对设计、成组设计、单因素K水平设计-(K>3).配伍组设计、拉丁方设计、交叉设计、析因设计、正交设计和具有重复测量的设计。从是否便于考察因素之间交互作用的角度看,前六种设计都不便考察交互作用,后三种设计是可以考察交互作用的。从同时考察4/29因素的个数多少角度看,前三种设计都属于单因素设计,配伍组设计属于二因素设计,拉丁方设计、交叉设计都属于三因素设计,而后三种设计即可以用于二因素设计,又可以用于多因素设计。由于配伍组设计、拉丁方设计和交叉设计都不便考察交互作用,故最适合用于安排只含一个处理因素,含一个或二个区组因素的试验研究场合。如果试验中同时涉及二个或二个以上处理因素,因素之间的交互作用往往又是不可忽视的,此时,就应当选用析因设计或正交设计。如果希望观察接受不同处理的几组受试对象某些定量观测指标随时间推移的动态变化趋势,需要在不同时间点上从同一个受试对象身上进行多次观测,这就是所谓的重复测量设计。§1-4:定量资料的分析程序一、定量资料分析的步骤①若数据服从正态分布,且满足方差齐性(即两组或多组总体方差相等),一般优先选用参数检验法,如t检验、U检验、方差分析(亦称F检验)等;②若数据的分布类型不明确,或不满足参数检验的前提条件,可选用非参数检验法,如符号检验,秩和检验等;③若资料经某种变量变换后已满足参数检验的前提条件,仍可对变换后的数据进行参数检验;④若只有一个试验因素,称为单因素,当它只有两个水平时,可选用t检验;当两组样本含量都很大时,可用U检验取代t检验;⑤若属单因素k5/29水平设计(G3)或两个及两个以上因素的各种试验设计时,都必须选用F检验;⑥若观察的效应指标(即研究者关心的定量观测指标)只有一个,可选择上述特定设计类型下的一元分析;⑦若效应指标有两个或两个以上,且在专业上需同时考察,则应选择多元分析方法。二、定量资料分析误区1,t测验适用范围及应用误区t检验的前提条件:用于比较均值的t检验可以分成3类。第一类是针对单组设计定量资料的;第二类是针对配对设计定量资料的;第三类则是针对成组设计定量资料的。后两种设计类型的区别在于事先是否将两组研究对象按照某一个或几个方面特征相似配成对子。无论哪种类型的t检验,都必须在满足特定的前提条件下应用才是合理的。t测验进行均值比较对应的试验设计类型较少,只有单组设计、配对设计和成组设计3种,t测验处理前2种设计类型的定量资料时,资料应满足正态分布的要求,处理成组资料时,应满足方差齐性和正态分布的要求。t检验每次只能比较二个平均数,因此,它仅适用于单因素一、二水平的实验设计类型。t检验仅适合分析单组、配对及成组设计的定量资料,并不适合6/29分析单因素k(G3)水平设计定量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论