




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
建模培训讲座第二讲方差分析及第1页,共100页,2023年,2月20日,星期四在现实的生产和经营管理中,经常要分析各种因素对研究对象某些特征值的影响.方差分析(analysisofvariance)就是采用数理统计方法对数据进行分析,以鉴别各种因素对研究对象的某些特征值影响大小的一种有效方法.研究对象的特征值,即所考察的试验(其涵义包括调查,收集等)结果(如产品质量、数量、销量、成本等)称为试验指标,简称指标,常用x表示.在试验中对所关心的“指标”有影响的、要加以考察而改变状态的原因称为因素,用A,B,C等大写英文字母表示.第2.1节方差分析的基本思想
第2页,共100页,2023年,2月20日,星期四在科学实验中常常要探讨不同实验条件或处理方法对实验结果的影响。通常是比较不同实验条件下样本均值间的差异方差分析是检验多组样本均值间的差异是否具有统计意义的一种方法。例如医学界研究几种药物对某种疾病的疗效;农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响不同饲料对牲畜体重增长的效果等都可以使用方差分析方法去解决第3页,共100页,2023年,2月20日,星期四因素在试验中所取的各种不同状态称为因素的水平.因素A的r个水平常用A1,A2,…,Ar表示,其中r称为因素A的水平数.若在试验中考虑了因素的全部水平,则该因素称为固定因素;若在试验中仅随机选择了因素的部分水平,则该因素称为随机因素.若只考察一个因素对指标的影响,这种试验称为单因素试验,相应的方差分析就称为单因素方差分析;若一个试验中同时考察两个因素,则相应的试验称为双因素试验,这时所作的方差分析称为双因素方差分析,在多因素试验中要考察的因素多于两个,相应的方差分析称为多因素方差分析.第4页,共100页,2023年,2月20日,星期四
方差分析(ANOVA)又称
F
检验,其目的是推断多组资料的总体均数是否相等。本章主要内容包括单因素方差分析(即完全随机设计资料的方差分析)、两因素方差分析(即随机区组设计资料的方差分析)和三因素方差分析(即拉丁方设计资料的方差分析)及多个样本均数间的多重比较。第5页,共100页,2023年,2月20日,星期四方差分析的基本思想
方差分析的基本思想借助以下例题予以说明:
例9-1为研究煤矿粉尘作业环境对尘肺的影响,将18只大鼠随机分到甲、乙、丙3个组,每组6只,分别在地面办公楼、煤炭仓库和矿井下染尘,12周后测量大鼠全肺湿重(g),数据见表9—2,问不同环境下大鼠全肺湿重有无差别?第6页,共100页,2023年,2月20日,星期四甲组乙组丙组4.24.55.63.34.43.63.73.54.54.34.25.14.14.64.93.34.24.7
ni666第7页,共100页,2023年,2月20日,星期四
从以上资料可看出,三个组的数据各不相同,这种差异(总变异)可以分解成两部分:即
(1)组间变异:甲、乙、丙三个组大鼠全肺湿重各不相等(此变异反映了处理因素的作用,以及随机误差的作用)
(2)组内变异:各组内部大鼠的全肺湿重各不相等(此变异主要反映的是随机误差的作用)第8页,共100页,2023年,2月20日,星期四各部分变异的计算:
①总变异(全部试验数据间大小不等)用总离均差平方和来表示。
其中第9页,共100页,2023年,2月20日,星期四甲组乙组丙组4.24.55.63.34.43.63.73.54.54.34.25.14.14.64.93.34.24.7
ni666第10页,共100页,2023年,2月20日,星期四
②组间变异(由于所接受的处理因素不同而致各组间大小不等)用组间离均差平方和来表示。
各组均数之间相差越大,它们与总均数的差值就越大,越大;反之,越小。第11页,共100页,2023年,2月20日,星期四甲组乙组丙组4.24.55.63.34.43.63.73.54.54.34.25.14.14.64.93.34.24.7
ni666第12页,共100页,2023年,2月20日,星期四③组内变异(同一处理组内部试验数据大小不等)用组内离均差平方和来表示。
第13页,共100页,2023年,2月20日,星期四三个变异之间的关系:
其中:
第14页,共100页,2023年,2月20日,星期四离均差平方和只能反映变异的绝对大小。变异程度除与离均差平方和的大小有关外,还与其自由度有关,由于各部分自由度不相等,因此各部分离均差平方和不能直接比较,须除以相应的自由度,该比值称均方差,简称均方(MS)。
的大小就反映了各部分变异的平均大小。第15页,共100页,2023年,2月20日,星期四
方差分析就是通过比较组内均方和组间均方的大小关系来判断处理因素有无效应。
检验统计量:
如果各组的总体均数相等,即无处理因素的作用,则组内变异和组间变异都只反映随机误差的大小,此时组间均方和组内均方大小相当,即F值则接近1,各组均数间的差异没有统计学意义;反之,如果处理有作用,则组间变异不仅包含随机误差,还有处理因素引起的变异(组间变异主要反映处理因素的作用),此时组间均方远大于组内均方,则F值远大于1,各组均数间的差异有统计学意义。故依据F值的大小可判断各组之间有无差别。第16页,共100页,2023年,2月20日,星期四
可见,方差分析的基本思想就是根据实验设计的类型,将全部测量值总的变异分解成两个或多个部分,每个部分的变异可由某个因素的作用(或某几个因素的作用)加以解释,通过比较各部分的均方与随机误差项均方的大小,借助
F
分布来推断各研究因素对实验结果有无影响。第17页,共100页,2023年,2月20日,星期四二、方差分析的应用条件(1)各观测值相互独立,并且服从正态分布;(2)各组总体方差相等,即方差齐性。第18页,共100页,2023年,2月20日,星期四例2.1.1
某公司为了研究三种内容的广告宣传对某种无季节性的大型机械销售量的影响进行了调查统计.经广告广泛宣传后,按寄回的广告上的订购数计算,一年四个季度的销售量(单位:台)为:广告类型 第一季度 第二季度 第三季度 第四季度A1 163 176 170 185 A2 184 198 179 190 A3 206 191 218 224 A1是强调运输方便性的广告,A2是强调节省燃料的经济性的广告,A3是强调噪音低的优良性的广告.试判断:新闻广告的类型对该种机械的销售量是否有显著影响?若影响显著,哪一种广告内容为好?新闻广告是所要检验的因素,三种不同的内容是三个水平,这是一个单因素三水平的试验.第19页,共100页,2023年,2月20日,星期四试验过程中各种偶然性(随机性)因素的干扰所致差异,称为试验误差.如果差异单纯是由误差引起的,那么我们认为广告的不同类型对销售量没有显著影响,则可简称因素(新闻广告)不显著,如果不同广告下销售量的不同,除了误差影响外,主要是由于广告类型(水平)不同所造成的,那么我们就认为因素的不同水平对销售量有显著影响,简称因素显著.方差分析就是通过对试验结果的分析去判断因素本身及各因素间交互作用对指标是否影响显著的一种统计方法.第20页,共100页,2023年,2月20日,星期四单因素方差分析(singlefactoranalysisofvariance)是要判断因素各水平对指标是否有显著影响,归结为判断不同总体是否有相同分布的问题.由于实际中常遇到的是具有正态分布的总体,同时,在进行方差分析时,除了所关心的因素外,其他条件总是尽可能使其保持一致,这样就可以认为每个总体的方差是相同的,因而,判断几个总体是否具有相同分布的问题就简化为检验几个具有等方差的正态总体均值是否相等的问题.第2.2节单因素方差分析第21页,共100页,2023年,2月20日,星期四考虑的因素记为A,假定它有r个水平,并对水平Ai作了ni次观察,第i水平的第j次观察为,这样可得观察资料设是来自总体的简单随机样本,检验其中1.数学模型
第22页,共100页,2023年,2月20日,星期四记则等价于记总观察次数,组平均值,总平均值,则有平方和分解式:2.方差分析第23页,共100页,2023年,2月20日,星期四Q称为总离差平方和,简称总平方和,它反映全部数据之间的差异;Q1称为误差平方和或组内平方和,反映了随机误差的影响;Q2称为组间平方和或因素A的平方和,反映了各总体的样本平均值之间的差异,在一定程度上反映了间的差异程度,因而通过Q2与Q1的相对大小可以反映H0是否成立.若Q2显著地大于Q1,说明间的差异显著地大于随机误差,那么H0可能不成立.第24页,共100页,2023年,2月20日,星期四取也就是说有的把握认为因素对指标有显著影响,即间的差异是显著的.给定显著性水平时,拒绝H0.第25页,共100页,2023年,2月20日,星期四通常情况下要列出方差分析表(analysisofvariancetable):第26页,共100页,2023年,2月20日,星期四例2.1.1
某公司为了研究三种内容的广告宣传对某种无季节性的大型机械销售量的影响进行了调查统计.经广告广泛宣传后,按寄回的广告上的订购数计算,一年四个季度的销售量(单位:台)为:广告类型 第一季度 第二季度 第三季度 第四季度A1 163 176 170 185 A2 184 198 179 190 A3 206 191 218 224 A1是强调运输方便性的广告,A2是强调节省燃料的经济性的广告,A3是强调噪音低的优良性的广告.试判断:新闻广告的类型对该种机械的销售量是否有显著影响?若影响显著,哪一种广告内容为好?第27页,共100页,2023年,2月20日,星期四所以拒绝H0,即认为广告内容不同对销售量的影响是显著.分析结果如下:第28页,共100页,2023年,2月20日,星期四例2.设有三台机器,用来生产规格相同的铝合金薄板.取样,测量薄板的厚度精确至千分之一厘米.得结果如表所示.问不同机器对生产的铝合金板的厚度有无影响请看分别用菜单系统和程序进行讨论程序名datalb给出了单因素方差分析的典型解法,进行了方差分析同时又在各水平组间进行了均值的比较,作了直方图,菜单系统和程序中均有选项”Dunnett”进行某一水平和其余水平的均值差异比较和检验,选项”snk”则进行所有水平间均值差异的比较和检验.第29页,共100页,2023年,2月20日,星期四例.设有三台机器,用来生产规格相同的铝合金薄板.取样,测量薄板的厚度精确至千分之一厘米.得结果如表所示.问不同机器对生产的铝合金板的厚度有无影响?第30页,共100页,2023年,2月20日,星期四1.编程输入数据:DataE411;inputc$y@@;cards;10.23620.25730.25810.23820.25330.26410.24820.25530.25910.24520.25430.26710.24320.26130.262;procprint;RUN;第31页,共100页,2023年,2月20日,星期四Solution→Analysis→Analyst(分析员系统)(出现空白数据表)→File→OpenBySasName…
(在Makeoneselection窗口中)work选中数据名E411→(OK)→Statistics→ANOVA→One-WayANOVA…Independent填分类变量c→Dependent因变量yPlots—可选择分水平的盒形图(Box-&-WhiskerPlot),条形图(BarChart)及均值、标准差图Means—ComparisonsMethods给出了10种多重比较的方法
α为选择的显著性水平,Breakdown可按水平分组出描述性统计量→OK(点击运行后的结果树标签则会打开相应图.第32页,共100页,2023年,2月20日,星期四编程进行单因素方差分析DataE411;inputc$y@@;cards;10.23620.25730.25810.23820.25330.26410.24820.25530.25910.24520.25430.26710.24320.26130.262;procglm
data=E411;/*glm为方差分析*/classc;/*分类变量c*/modely=c;/*模型因变量=自变量*/lsmeansc;/*最小误差法*/meansc;/*求c的均值*/RUN;第33页,共100页,2023年,2月20日,星期四第34页,共100页,2023年,2月20日,星期四自由度公式总自由度ft=试验次数n-1;误差自由度fe=总自由度ft-模型自由度f模型方差分析中
(单因素模型)因素A(即模型)的自由度fA=水平数-1(A,B双因素考虑交互效应模型)
因素A的自由度fA=水平数-1
因素B的自由度fB=水平数-1
交互效应A*B的自由度fA*B=fA*fB
模型自由度f模型=fA+fB+fA*B
回归分析中项自由度=1
模型自由度f模型=项自由度之和第35页,共100页,2023年,2月20日,星期四第2.3节双因素方差分析双因素方差分析的数据结构为1.无交互作用的双因素方差分析(doublefactoranalysisofvariance)因素第36页,共100页,2023年,2月20日,星期四因素A的第i种效应和因素B的第j种效应分别记作,试验误差记作,那么其中假定(1)数学模型ji,ba第37页,共100页,2023年,2月20日,星期四判断因素A是否显著,等价于检验假设判断因素B是否显著等价于检验假设将总离差平方和Q进行分解:选取检验统计量:(2)方差分析第38页,共100页,2023年,2月20日,星期四列出如下方差分析表:第39页,共100页,2023年,2月20日,星期四例2.3.1为提高某种产品的合格率,考察原料用量和来源地对其是否有影响.原料来源地有三个:甲、乙、丙.原料用量有三种:现用量、增加5%、增加8%.每个水平组合各做一次试验,得到的数据如下:试分析原料用量及来源地对产品合格率的影响是否显著.解:设原料来源地为因素A,三个地区为因素A的三个水平,第i个水平对合格率的特殊效应为;原料用量为因素B,三种用料量为因素B的三个水平,第j个水平对合格率的特殊效应为,原假设为第40页,共100页,2023年,2月20日,星期四双因素试验的方差分析,案例第41页,共100页,2023年,2月20日,星期四第42页,共100页,2023年,2月20日,星期四因素和指标之间的应该是什么样的模型是由它们之间的客观关系确定的,譬如双因素A、B数据表(类似数据Rocket处数据表)进行方差分析讨论时可能的模型有以下几种:1)主效应A、B都显著、交互效应A*B显著(有交互效应的双因素方差分析模型)2)只有主效应A显著、主效应B显著(只有主效应的双因素方差分析模型)3)只有主效应A显著(单因素方差分析模型)4)只有主效应B显著(单因素方差分析模型)第43页,共100页,2023年,2月20日,星期四我们的研究是发现这样的合适的模型.看下例分析过程.
例3分析下面数据表,说明合适的模型是个单因素模型(数据名E632)
下表(数据名E632)给出某种化工过程在三种浓度、四种温度水平下得率的数据.第44页,共100页,2023年,2月20日,星期四第45页,共100页,2023年,2月20日,星期四例2.3.2
抗牵拉强度是硬橡胶的一项重要的性能指标,现试验考察下列两个因素对该指标的影响.A(硫化时间):A1(40秒),A2(60秒).B(催化剂种类):B1(甲种),B2(乙种),B3(丙种).六种组合水平下,各重复做了两次试验,测得数据(单位:kg/cm2)如下,试问因素A,因素B对该指标的影响是否显著?2.有交互作用的双因素方差分析
第46页,共100页,2023年,2月20日,星期四第二节两因素方差分析第47页,共100页,2023年,2月20日,星期四
1.数据输入:见DataRocket2.编程进行:procglm
data=rocket;classfm;/*class语句说明对分类变量
f,m分析*/modelr=fmf*m;
/*模型:连续变量r;考虑因素f,m及交互f*m*/lsmeansfmf*m;run;说明:如果要考虑交互效应,则每一水平组合必须做重复试验,否则可以不做重复试验.第48页,共100页,2023年,2月20日,星期四3.应用分析员应用系统:Solution→Analysis→Analyst(分析员系统)→(出现空白数据表)→File→OpenBySas(在Makeoneselection窗口中)→work(选中数据名Datarocket)→(OK)Statistics→ANOVA→FactorialANOVA…→Independent填分类变量f,m→Dependent填因变量R
→Model-----StandardModelsMaineffectsonly只考虑主效应;Effectsupto2-wayinteractions考虑交互效应Plots—可选择响应变量的均值(主效应或交互效应)连线图Means—ComparisonsMethods给出了10种多重比较的方法
α为选择的显著性水平,Breakdown可按水平分组出描述性统计量→OK请看演示第49页,共100页,2023年,2月20日,星期四第三节多因素(≥3)方差分析
指标y(回收率),因素:XA(尿素量),XB(水量),XC(反应时间),XD(溶剂量)(一)初步分析:从数据表(见dataQ98)看出各因素等间距取值,由正交多项式理论,此时因素的主效应(在以下变换的前提下,注意未经变换主效应的线性部分和二次项部分无法有正交性分解)可以进一步分解成线性部分和二次项部分.对于显著因素,如果二次项部分不显著,只是线性项部分显著,那么因素与指标呈线性关系;如果二次项部分显著那么因素与指标呈抛物线关系.因素等间距取值时,因素的取值与水平数(自然数1,2,3)可以有线性变换关系
新变量(可看成水平序号,已经无量纲影响)=(原变量-左端点)/步长+1此时在SAS中应先用水平数为自变量进行项的删选,删选结束用水平数与原始变量进行方差分析和回归分析结论完全相同第50页,共100页,2023年,2月20日,星期四说明:A,B,C,B分别是四个因素在正交表上的水平值(二)数据输入dataQ98;inputnumber$ABCDXAXBXCXDy;A2=A**2;B2=B**2;C2=C**2;D2=D**2;XA2=XA**2;XB2=XB**2;XC2=XC**2;XD2=XD**2;cards;(数据略)procprint;run;第51页,共100页,2023年,2月20日,星期四
(三)分析过程进行分析时(1)当因素很多或误差自由度显然不够时可先只考察所有因素的主效应,如有可能再进一步考虑主要因素的二次项和交互项或(2)当试验次数相对较多时直接在进行变量代换新变量(可看成水平序号)=(原变量-左端点)/步长+1后,可考虑所有一次项和二次项采用逐步回归删去不显著的项直接讨论本例先采用方法(1)分步讨论与直接采用方法(2)讨论的结果是一致的方法(1)第一步得输出表如下:第52页,共100页,2023年,2月20日,星期四第53页,共100页,2023年,2月20日,星期四分析:由于每个因素自由度2,合计模型自由度8,n-1-p=0即误差自由度为0,从而无法产生统计量F和相应概率Pr,但从平方和分解中可以看出因素效应大小的顺序,并看出因素D是不显著的,故可以删去因素D后进入
StatisticsRegression-Linear重新分析(在选项Statistics中选择Ⅰ型平方和SS)得表如下(从平方和比较中可以看出因素A只是线性效应而因素B,C呈抛物线效应,):第54页,共100页,2023年,2月20日,星期四删除A2项重新上步工作得最终结果如表:
第55页,共100页,2023年,2月20日,星期四项的删选结束后当采用原始数据进行回归可发现方差分析结束完成一致并且得原变量和指标的回归方程见下表方法(1)的以上过程与对新变量采用方法(2)直接利用逐步回归直接完成的结论相同第56页,共100页,2023年,2月20日,星期四第57页,共100页,2023年,2月20日,星期四第58页,共100页,2023年,2月20日,星期四多因素(≥3)方差分析(续)五因素三水平安排在正交表L18(37)上,要考察每个因素和其平方对指标y的影响的显著性.数据见下程序dataQ146;inputnumber$ABCDEy;A2=A*A;B2=B*B;C2=C*C;D2=D*D;E2=E*E;cards;111111943.44212222975.06(…数据部分略);procprint;run;第59页,共100页,2023年,2月20日,星期四Solution→Analysis→Analyst(“分析员应用”)→File→OpenBySasName…→
(在Makeoneselection窗口中)work选中数据名Q146→(OK)→Statistics→Regression→Linear…线性回归在线性回归主窗口中Dependen填入因变量;Explanatory填入各自变量;(以下为返回式选项窗口,进入该类窗口并进行选择后→OK返回)→OK→Model选择筛选变量的方法→逐步回归stepwiseselection(如果对项的入选采取较宽容的态度可以适当调大α值譬如0.1)→OK;→Statistics选择Type1sumofsquares→OK→OK请看演示第60页,共100页,2023年,2月20日,星期四第61页,共100页,2023年,2月20日,星期四总和T,修正项CT,以及各列的波动平方和Si和总波动平方和ST等可以用SAS求得:dataQ143;inputABCEmy;cards;11115.09/*数据前三列为正交表L9(34)前三列*/122220.39133324.56212316.8223123.23231218.94313221.01321315.59332122.34;procprint;run;第62页,共100页,2023年,2月20日,星期四运行数据后再利用SAS菜单系统进行方差分析:Solution→Analysis→Analyst→(分析员系统)(出现空白数据表)→File→OpenBySas(在Makeoneselection窗口中)
→work(选中数据名DataQ143)→(OK)→Statistics→ANOVA→LinearModels…→Independent填分类变量A,B,C→Dependent因变量(响应变量)填y→在选项Statistics→
Type1下打勾→OK→OK请看演示第63页,共100页,2023年,2月20日,星期四发现因素A不显著,准备删去因素A,重新进入菜单系统:Statistics→ANOVA→LinearModels…→Reset后→Independent填分类变量B,C→Dependent因变量(响应变量)填y在选项Statistics→Type1下打勾→OK→OK请看演示第64页,共100页,2023年,2月20日,星期四第四节拉丁方设计资料的方差分析
一、拉丁方设计完全随机设计只涉及到一个处理因素;随机区组设计涉及一个处理因素和一个区组因素。若实验涉及一个处理因素和两个控制因素,而且每个因素的水平数相等,此时可采用拉丁方设计来安排实验,将两个控制因素分别安排在拉丁方的行和列上。第65页,共100页,2023年,2月20日,星期四4×4ABCDDABCCDABBCDA第66页,共100页,2023年,2月20日,星期四拉丁方是由g个拉丁字母排成的g×g方阵,每行或每列中每个字母都只出现一次,这样的方阵称为g阶拉丁方。拉丁方设计是在随机区组设计的基础上发展的,它可多安排一个已知的对实验结果有影响的非处理因素,提高了效率。应用时,根据水平数g
来选定拉丁方大小。第67页,共100页,2023年,2月20日,星期四3×34×45×5ABCCABBCAABCDDABCCDABBCDAABCDEEABCDDEABCCDEABBCDEA第68页,共100页,2023年,2月20日,星期四
例9-3研究A、B、C、D四种食品,以及甲、乙、丙、丁四种加工方法对小白鼠增体重的影响。拟用4窝大鼠,每窝4只,每只小白鼠随机喂养一种食品、随机采用一种加工方法;8周后观察大鼠增体重情况。实验结果如表9-9所示。问:(1)食品种类是否影响大鼠体重增加?(2)食品加工方法是否影响大鼠增体重?(3)不同窝别的大鼠体重增加是否不同?区组号甲乙丙丁180(D)70(B)51(C)48(A)247(A)75(C)78(D)45(B)348(B)80(D)47(A)52(C)446(C)81(A)49(B)77(D)表9-9四种食品及四种加工方法喂养大鼠所增体重(g)第69页,共100页,2023年,2月20日,星期四4×4ABCDDABCCDABBCDA第70页,共100页,2023年,2月20日,星期四二、变异分解表9-8拉丁方设计资料的方差分析表
表中C为校正数,、、分别为不同处理、行区组、列区组的合计。第71页,共100页,2023年,2月20日,星期四三、分析步骤例9-3问:(1)食品种类是否影响大鼠体重增加?(2)食品加工方法是否影响大鼠增体重?(3)不同窝别的大鼠体重增加是否不同?表9-9四种食品及四种加工方法喂养大鼠所增体重(g)第72页,共100页,2023年,2月20日,星期四解:
(1)建立检验假设,确定检验水准H处理0:A=B=C=D
即四种食品对大鼠体重增加相同
H处理1:A,B,C,D不全相等即四种食品对大鼠体重增加不全相同H行0:1=2=3=4
即不同窝别大鼠体重增加相同
H行1:1,2,3,4不全相等即不同窝别大鼠体重增加不全相同H列0:甲=乙=丙=丁
即不同加工方法对大鼠体重增加相同
H列1:甲,乙,丙,丁不全相等即不同加工方法对大鼠体重增加不全相同
=0.05第73页,共100页,2023年,2月20日,星期四(2)计算检验统计量
=62772-59292.25=3479.75
(2232+2122+2242+3152)-59292.25=1726.25
(2492+2452+2272+2532)-59292.25=98.75(2212+3062+2252+2222)-59292.25=1304.25
=3479.75-1726.25-98.75-1304.25=350.5
第74页,共100页,2023年,2月20日,星期四表9-10例9-3方差分析表变异来源
SSV
MSFP处理间1726.253575.4179.85<0.01行区组98.75332.9170.56>0.05列区组1304.253434.7507.44<0.05误差350.50658.417总3479.7515第75页,共100页,2023年,2月20日,星期四(3)确定P值,作出推断结论①对处理:以处理=3和误差=6查F界值表,F0.05(3,6)=4.76,F0.01(3,6)=9.78,得P<0.01,按=0.05水准拒绝H0,接受H1,差别有统计学意义,可认为食品种类能影响大鼠增重。②对行区组:以行=3和误差=6查F界值表,F0.05(3,6)=4.76,F0.01(3,6)=9.78,得P>0.05,按=0.05水准不拒绝H0,差别无统计学意义,尚不能认为不同窝别可影响大鼠增重。③对列区组:以列=3和误差=6查F界值表,F0.05(3,6)=4.76,F0.01(3,6)=9.78,得P<0.05,按=0.05水准拒绝H0,接受H1,差别有统计学意义,可认为食品加工方法会影响大鼠增重。第76页,共100页,2023年,2月20日,星期四拉丁方设计的要求:
①一定是三因素,且三因素水平数相等;②行间、列间、处理间均无交互作用;③各行、列、处理的方差齐。拉丁方设计的优缺点:
优点是可同时研究三个因素,减少实验次数。从组内变异中不但分离出行区组变异,而且还分离出列区组变异,使误差变异进一步减小。缺点是要求处理组数与所要控制的两个因素水平数相等,一般实验不容易满足此条件,而且数据缺失会增加统计分析的难度。第77页,共100页,2023年,2月20日,星期四第五节多个均数间的两两比较
经过方差分析,若拒绝了检验假设H0,只能说明多个总体均数不等或不全相等。若要得到各组均数间更详细的信息,应在方差分析的基础上进行多个样本均数的两两比较。多重比较常用的方法有:SNK-q检验、LSD-t
检验和Dunnett-t
检验。第78页,共100页,2023年,2月20日,星期四一、SNK-q检验
SNK(Student-Newman-Keuls)检验,亦称q
检验,适用于多个均数两两之间的全面比较。检验统计量q
的计算公式为:
第79页,共100页,2023年,2月20日,星期四例9-4例9-1经
F检验结论有统计学意义,试用SNK-q检验方法对三组均数进行多重比较。解:
(1)建立假设,确定检验水准。
H0
:(对比组总体均数相等);
H1
:(对比组总体均数不等);
第80页,共100页,2023年,2月20日,星期四(2)计算检验统计量q值。
①计算差值的标准误:本例nA=nB=6,MS误差=MS组内=0.269
②将三个样本均数从小到大排序,并赋予秩次:均数3.8174.2334.733
组别甲组乙组丙组秩次(R)
123
③列表计算检验统计量q
值:表9-12例9-1的3个样本均数两两比较的q检验
第81页,共100页,2023年,2月20日,星期四(3)确定P值,作出推断结论 以误差=15及组数
a
查
q
界值表,并确定
P
值,填入表9-12。
结论:甲组与丙组(“1与3”)比较P<0.05,按=0.05水准拒绝H0,接受H1,有统计学意义,可认为甲组(办公楼)全肺湿重小于丙组(矿井);其余对比组之间比较均P>0.05,按=0.05水准不拒绝H0。因此,可认为矿井下环境会造成肺功能损害。
第82页,共100页,2023年,2月20日,星期四二、Dunnett-t
检验
Dunnett–t检验适用于多个实验组与一个对照组均数差别的多重比较。检验统计量为:
第83页,共100页,2023年,2月20日,星期四
例9-5例9-2中甲组是对照组,研究目的是比较乙营养素和丙营养素是否比甲营养素多增加体重,经F检验结论有统计学意义,试用Dunnett-t检验方法对三组均数进行多重比较。解:
(1)建立假设,确定检验水准。
H0:
(所比较实验组与对照组总体均数相等)
H1:(所比较实验组与对照组总体均数不等)
(2)计算检验统计量Dunnett-t值。
①本例
nT=nC=6,MS误差=16.122,则差值的标准误为
2.318第84页,共100页,2023年,2月20日,星期四
②列表计算tD统计量,如表9-13所示。
(3)确定P值,作出推断结论。
以及处理数T=2查Dunnett-t检验界值表,并确定P值,填入表9-13。丙组与甲组比较P<0.05,按=0.05水准拒绝H0,接受H1,有统计学意义,可认为丙营养素比对照组体重增加更多。但乙组与甲组比较P>0.05,没有统计学意义,按=0.05水准不拒绝H0,尚不能认为乙营养素与对照组增加体重不同。
表9-13例9-2的2个处理组与对照组均数比较的tD检验第85页,共100页,2023年,2月20日,星期四三、LSD-t
检验
LSD-t
检验即最小显著差异t
检验,适用于一对或几对在专业上有特殊意义的样本均数间的比较。检验统计量
t
的计算公式为:
LSD-
第86页,共100页,2023年,2月20日,星期四例9-6例9-3中食品种类是否影响大鼠增体重,研究目的只为比较A食品与B食品,C食品与D食品便可;多组间经F检验结论有统计学意义,试用LSD-t检验方法对这两对均数进行多重比较。 检验步骤为:
(1)建立检验假设,确定检验水准
H0:A=
B即所研究的两个对比组的总体均数相等
H1:A≠
B即所研究的两个对比组的总体均数不等
=0.05
(2)计算检验统计量
①本例nA=nB=4,MS误差=58.417,=误差=6第87页,共100页,2023年,2月20日,星期四
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 怎样养成团队习惯
- 孩子逻辑思维的提升方法
- 红色旅游调研汇报
- 团队建设在幼教工作中的重要性计划
- 小班科普知识普及活动计划
- 规范细节重要性
- 水务政策与公共利益的平衡计划
- 孩子如何制定学习计划模板
- 水务行业的创新案例分享计划
- 情境教学法在幼儿园的运用研究计划
- 优艺国际环保科技(新乡)有限公司新乡市医疗废物集中处理中心迁建扩能项目环境影响报告
- 经验萃取实战技术课件
- 医学女性盆腔肿瘤的影像学表现和鉴别专题课件
- 南汇区供排水一体化整合研究的任务书
- 23CG60 预制桩桩顶机械连接(螺丝紧固式)
- 小学道德与法治-【课堂实录】生活中处处有规则教学设计学情分析教材分析课后反思
- 军营相亲活动策划方案
- Python语言基础与应用学习通课后章节答案期末考试题库2023年
- 大学生心理健康教育高职PPT全套教学课件
- 挖掘机驾驶员岗位安全达标考试试题
- 音乐育人思政先行:课程思政融入小学音乐教学的路径 论文
评论
0/150
提交评论