




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
直线回归和相关田间试验设计与统计分析1回归和相关的概念前面几章讨论的资料和统计方法只着重一个单独变数,例如产量等变数的分布及其特征在农业试验工作中,大部分问题是包括两个或两个以上变数在一起变异的问题例如降雨量、温度和光照等气候因子对番茄产量的影响等。2023/10/201回归和相关的概念把许多种变数摆在一起的研究,目的在于发现它们之间存在的规律性,以预测或估计变数间的变异趋向,在统计上称作回归与相关研究研究两个变数之间关系时,因变数不同而有两种不同的研究方法。变数之间的关系函数关系统计关系1.变数之间的关系1回归和相关的概念函数关系是一种一一对应的确定关系不包含误差的干扰
xy1回归和相关的概念统计关系一种非确定的关系一个变数取值受到另一个变数的影响两者之间既有关系,但又不是完全确定的函数关系变数之间的关系受到误差的干扰
xy是指一个变数的取值受到另一个变数的影响,两者有关系,但不存在完全确定的函数关系。相关关系因果关系:自变数(原因变数)和依变数(结果变数)。从统计学角度讲,确定性关系与不确定性关系的区别仅在于前者不存在随机误差,而后者不可避免地具有试验误差。1回归和相关的概念2.自变数和依变数变数之间的统计关系因果关系相关关系自变数(independentvariable)依变数(dependentvariable)呈现出一种共同变化的特点1回归和相关的概念3.回归分析和相关分析回归分析对具有因果关系的两个变数,可以推算出Y随X改变的方程,此时的方程称为Y依X的回归方程(regressionequationofYonX)以计算回归方程为基础的分析方法称为回归分析原则上两个变数中Y含有试验误差而X不含有试验误差时着重进行回归分析1回归和相关的概念3.回归分析和相关分析回归分析的类型一个自变量两个及两个以上自变量回归模型多元回归一元回归线性回归非线性回归线性回归非线性回归回归分析的特征:①有自变数和依变数之分;②具有预测的作用,即可以由X的数量变化来预测Y的数量变化;③自变数x无误差或误差很小,依变数y存在误差。回归分析(regressionanalysis)
对回归模型资料,通常在确定自变数和依变数的基础上,建立由X来预测Y的回归方程式,并推定当自变数X取某一定值时依变数Y将会在什么范围内变化。1回归和相关的概念3.回归分析和相关分析相关分析对具有相关关系的两个变数,可以计算出表示相关密切程度的统计数,并检验其显著性通常在Y和X均含有误差时着重进行相关分析1回归和相关的概念3.回归分析和相关分析相关分析在直线相关时,这一统计数称为相关系数(correlationcoefficient),记为r在多元相关时称为复相关系数(multiplecorrelation)记为Ry.1.2…m曲线相关时称为相关指数(correlationindex),记为R1回归和相关的概念3.回归分析和相关分析相关系数简单相关系数r复相关系数Ry.1.2..m相关指数R直线相关多元相关曲线相关偏相关系数Ry.1…多元相关相关系数的种类①表示两个变数的偕同变异;②没有自变数与依变数之分;③不具有预测的作用;④存在随机误差。特征:
相关分析
(correlationanalysis):研究两个变数之间有无关系,以及关系的密切程度和性质,而不需要由一变数去估测另一变数。相关系数复相关系数相关指数rRy.12…mR1回归和相关的概念回归分析和相关关系对具有因果关系的两个变数,统计分析的任务是由试验数据推算一个方程为y依x的回归方程对具有相关关系的两个变数,统计分析的目标是计算表示y和x相关密切和程度的统计数并测其显著性1回归和相关的概念回归分析和相关关系原则上y含有试验误差而x不含试验误差时着重进行回归分析;y和x均含有试验误差时则着重去进行相关分析但没有明显的界限,而实际它们的分析包括着相互的信息1回归和相关的概念两个变数资料的散点图
对具有统计关系的两个变数资料,将其观测值分别以坐标点的形式标记与同一直角坐标平面上,获得散点图(scatterdiagram)通过散点图可以初步判定变数之间的关系相关的性质和密切程度变数的关系是直线型,还是非直线型是否有一些特殊的点表示着其他因素的干扰1回归和相关的概念1234x,生物产量(g)0.00.51.01.52.0y,稻谷产量(g)水稻单株生物产量与稻谷产量的散点图1回归和相关的概念3.23.644.44.8x,每平方米颖花数(万)05560657075y,结实率(%)水稻每平方米颖花数和结实率的散点图1回归和相关的概念34567890250300350400450x,最高叶面积指数y,产量(kg/亩)水稻最高叶面积指数和亩产量的散点图第二节
直线回归田间试验设计与统计分析2.1直线回归方程1.直线回归方程式在散点图上呈直线趋势的两个变数,如果要概括其在数量上的互变规律,即从X的变化来预测或估计Y的变化,则要采用直线回归方程来描述linearregressionequation
是和x对应的依变数的点估计值
a是回归截距(regressionintercept)b是回归系数(regressioncoefficient)要使能够最好地代表y和x在数量上的互变关系,必须使XY2.1直线回归方程1.直线回归方程式分别对a和b求偏导数并另其为0,即可获得正规方程组(normalequations):2.1直线回归方程1.直线回归方程式正规方程组解之得:2.1直线回归方程1.直线回归方程式
是x的离均差和y的离均差的乘积和,简称为乘积和(sumofproducts),记作SP分母是x的离均差平方和,记作SSx2.1直线回归方程1.直线回归方程式a、b的取值及意义A、b皆可正可负若b=0或和0的差异不显著,表明y的变异和x的取值大小无关,直线回归关系不能成立2.1直线回归方程XY2.1直线回归方程2.直线回归的计算[例]一些夏季害虫盛发期的早迟和春季温度高低有关。江苏武进连续9年测定3月下旬至4月中旬旬平均温度累积值(x,旬.度)和水稻一代三化螟盛发期(y,以5月10日为0)的关系,得结果于下表。试计算其直线回归方程。Y12169273139-1X35.534.131.740.336.840.231.73244.22.1直线回归方程因而有:从而得到回归方程:2.1直线回归方程对回归方程的解析回归系数的意义:当3月下旬至4月中旬的积温每提高1旬.度时,一代三化螟虫的盛发期平均将提早1.1天截距的意义:若积温为0,则一代三化螟虫的盛发期将在6月27-28日由于x的实测区间为[31.7,44.2],根据回归方程对Y的预测只能内插而不能外延2.1直线回归方程303438425/5-55/1005/1555/20105/2515(月/日)x,3月下旬至4月中旬平均温度累积值y,一代三化螟盛发期2.1直线回归方程例.在粉皮冬瓜雌花谢花后7-11天测量果实纵径,获得如下数据,试作回归分析谢花后天数x7891011果实纵径y14.316.817.217.618.52.1直线回归方程2.1直线回归方程例.测得大红番茄果实横径与果重的一组数据资料,试作横径与果重两个变数间的回归分析。果实横径x10628.98.587.87.77.47果重y14013213012111610810510695902.1直线回归方程2.1直线回归方程四、直线回归的估计标准误满足为最小的直线回归方程和实测的观察点并不重合,表明该回归方程仍然存在随机误差。Q就是误差的一种度量,称之为离回归平方和(sumofsquarestodeviationfromregression)或剩余平方和2.1直线回归方程四、直线回归的估计标准误由于在建立回归方程时用了a和b两个统计数,故Q的自由度ν=n-2因而,可定义回归方程的估计标准误为:越小,各观测值点越靠近回归曲线,反之,越远2.1直线回归方程四、直线回归的估计标准误Q值的计算:2.1直线回归方程四、直线回归的估计标准误Q值的计算:2.1直线回归方程Q值的计算:使用EXCEL中STEYX函数计算返回通过线性回归法计算每个x的y预测值时所产生的标准误差。标准误差用来度量根据单个x变量计算出的y预测值的误差量。语法STEYX(known_y's,known_x's)Known_y's
为因变量数据点数组或区域。Known_x's
为自变量数据点数组或区域。2.1直线回归方程五、直线回归的数学模型和基本假定数学模型样本的线性组成为:2.1直线回归方程五、直线回归的数学模型和基本假定基本假定:Y是随机变数,而X是没有误差的固定变数,至少和Y比较起来X的误差小到可以忽略在任一X上都存在一个Y的总体,是作正态分布的,其平均数是X的线形函数2.1直线回归方程五、直线回归的数学模型和基本假定基本假定:所有Y总体都具有共同的方差,这一方差不因X的不同而不同,直线回归总体具有随机误差项相互独立,并作正态分布,具有样本b≠0总体β≠0?回归系数也有抽样误差!总体β=0HAH02.2直线回归的假设测验和区间估计一、直线回归的假设测验1、回归关系的假设测验t测验若总体不存在直线回归关系,则总体回归系数β=0若总体存在直线回归关系,则总体回归系数β≠0。2.2直线回归的假设测验和区间估计一、直线回归的假设测验-t测验对直线回归的假设测验为:H0:β=0;对HA:β≠0回归系数b的标准误为:遵循ν=n-2的t分布2.2直线回归的假设测验和区间估计[例]水稻一代三化螟盛发期夏季害虫盛发期的早迟和春季温度高低有关Y12169273139-1X35.534.131.740.336.840.231.73244.2试测验回归关系的显著性2.2直线回归的假设测验和区间估计ν=n-2=9-2=72.2直线回归的假设测验和区间估计接受HA:β≠0,即认为积温和一代三化螟盛发期是有真实的直线回归关系。2.2直线回归的假设测验和区间估计一、直线回归的假设测验F测验2.2直线回归的假设测验和区间估计总平方和ν=n-1离回归平方和ν=n-2回归平方和ν=(n-1)-(n-2)=12.2直线回归的假设测验和区间估计三个平方和的意义总平方和(SSy)反映因变量的n个观察值与其均值的总离差回归平方和(SSR或U)反映自变量x的变化对因变量y取值变化的影响,或者说,是由于x与y之间的线性关系引起的y的取值变化,也称为可解释的平方和离回归平方和(SSE或Q)反映除x以外的其他因素对y取值的影响,也称为不可解释的平方和或剩余平方和2.1直线回归方程XYF测验SS总=SS回+SS离ν总=ν回+ν离ν总=n-1ν回=1ν离=n-22.2直线回归的假设测验和区间估计2.2直线回归的假设测验和区间估计[例]水稻一代三化螟盛发期夏季害虫盛发期的早迟和春季温度高低有关用F测验检测回归关系的显著性变异来源DFSSMSFF0.01回归1174.8886174.888616.40**12.25离回归774.667010.6667总变异8245556SUMMARYOUTPUT回归统计MultipleR0.837138563RSquare0.700800973AdjustedRSquare0.658058255标准误差3.265988788观测值9方差分析
dfSSMSFSignificanceF回归分析1174.8887762174.888776216.395798030.004875908残差774.6667793410.66668276总计8245555556
Coefficients标准误差tStatP-value下限95.0%上限95.0%Intercept48.5493193610.127786264.7936753520.00198070424.6009103672.49772836XVariable1-1.0996220390.271567101-4.0491725120.004875908-1.74177619-0.4574678872.2直线回归的假设测验和区间估计直线回归分析中的t检验和F检验F(v1=1,v2=n-2)=t2(v=n-2)在直线回归方程中,t检验和F检验的结果是一致的在多元非线性回归方程中F检验是针对回归方程总体回归关系存在与否的检验而t检验是对各个回归系数是否为零进行检验因此,应先进行F检验,F值显著的情况下再进行t检验2.2直线回归的假设测验和区间估计两个样本回归系数比较时的假设检验若有两个直线回归样本,分别具有回归系数b1、b2和总体回归系数β1、β2,则在检验b1、b2的差异显著性时,有:Ho:β1-β2=0HA:β1-β2≠0两个样本回归数差数的标准误为2.2直线回归的假设测验和区间估计两个样本回归系数比较时的假设检验由于遵循v=(n1-2)+(n2-2)的t分布,故由可测定在β1-β2=0的总体中获得现有
b1-b2≠0的概率2.2直线回归的假设测验和区间估计二.直线回归的区间估计-直线回归的抽样误差在直线回归总体中抽取若干样本时,由于的存在,各样本的a、b值都有误差由给出的点估计的精确性,决定于和a、b的误差的大小因此对α、β以及μY/X作出区间估计是比较科学的2.2直线回归的假设测验和区间估计回归截距的置信区间样本回归截距而和b的误差a的标准误为2.2直线回归的假设测验和区间估计回归截距的置信区间而(a-α)/sa是遵循ν=n-2的t分布所以对总体回归截距α有95%可靠度的置信区间为2.2直线回归的假设测验和区间估计回归系数的置信区间服从自由度为n-2的t分布可以导出β的95%、99%置信区间为:2.2直线回归的假设测验和区间估计条件总体平均数
Y/X的置信区间根据回归模型的定义,每一个X上都由一个Y变数的条件总体,该条件总体的平均数为
Y/X
,而样本估计值为
由于,故的标准误为:
2.2直线回归的假设测验和区间估计条件总体平均数
Y/X的置信区间可以导出
Y/X的95%、99%置信区间为:由于服从自由度为n-2的t分布
2.2直线回归的假设测验和区间估计例:试根据例1资料估计:当3月下旬至4月中旬的积温为40旬·度时,历年的一代三化螟平均盛发期在何时(取95%可靠度)?将x=40代入方程得:2.2直线回归的假设测验和区间估计2.2直线回归的假设测验和区间估计条件总体预测值的置信区间这是以一定的保证概率估计任一X上Y单个预测值的存在范围2.2直线回归的假设测验和区间估计条件总体预测值的置信区间故保证概率为0.95的Y(p)预测区间为:2.2直线回归的假设测验和区间估计条件总体预测值的置信区间[例]试根据例1资料估计:某年3月下旬至4月中旬的积温为40旬·度,试估计该年的一代三化螟盛发期在何时(取95%可靠度)?2.2直线回归的假设测验和区间估计置信区间和预测区间图示第三节
直线相关田间试验设计与统计分析3直线相关有时我们无法或不需要由一个变数来估计另一个变数的值,我们感兴趣的是这两个变数之间有没有什么关系如:番茄的产量和什么性状有关呢?通过相关分析表明:产量和每花序上花的数目以及每果序上果实的数目有关如何提高产量呢?保花,保果3直线相关什么是相关分析呢?相关分析是一种用来表示两个变量之间关系强度的数学方法。3直线相关什么情况下使用相关分析呢?变数(性状)之间是平行的关系简化数据,如:产量、生育期等性状的构成要素很多,可从中找出影响大的要素一个性状的数据比较难以获得时,找出一个与之相关性大的数据容易获得的性状取代之3直线相关如何判断直线相关关系的存在呢?先作scatterplot,散点图是直观地观察连续变化变量间关系的重要工具用直线描述用曲线描述可能有周期变化无明显关系相关性有多大?3直线相关相关系数设有一X、Y均为随机变量的双变数总体,具有N对(X,Y)。若在标有这N个(X,Y)坐标点的直角坐标上移动坐标轴,将X轴和Y轴分别平移到μX和μY上,则各点位置不变,而所取坐标变为(X-μX,Y-μY)3直线相关IIIIVIII3直线相关IIIIVIII3直线相关IIIIVIII3直线相关
的值可用来度量两个变数直线相关程度和性质但是,X和Y的变异程度、所取单位及N的大小都会影响3直线相关为了具有可比性,需要将离均差转化为标准化离均差,再以N除之,从而得到双变数总体的相关系数为:3直线相关决定系数(determinationcoefficient)从这个等式可以看出:y与x直线回归效果的好坏取决于回归平方和
和离回归平方和或者说回归效果取决于回归平方和在总平方和中所占的比例3直线相关决定系数(determinationcoefficient)即:这个比例越大,y与x的直线回归效果就越好,反之则差。我们把上式的比值叫做x对y的决定系数,记为r23直线相关决定系数(determinationcoefficient)决定系数的大小表示了回归方程可靠程度的高低,或者说表示了回归直线拟合度的高低。
0≤r2≤1
决定系数表示了两个互为因果关系的相关变量间直线相关的程度。3直线相关决定系数(determinationcoefficient)因为如果获得了一个回归方程:
y=a+bxbyx=b如果将x变为依变数,方程可变为
x=-a/b+1/b*ybxy=1/b
那么r2=1forever!Why?根据函数关系获得的3直线相关根据统计关系获得的决定系数会是怎样的?如例1
以积温x为依变数,盛发期y为自变数,回归方程为:
x=42.0-0.64y
以盛发期y为依变数,积温x为自变数,回归方程为:
y=48.5-1.1x
那么
r2=-0.64×(-1.1)=0.7因有误差的存在使统计关系不同于函数关系3直线相关但决定系数介于0和1之间,不能反应直线关系的性质——是同向增减或是异向增减若求r2的平方根,且取平方根的符号与乘积和SPxy的符号一致,这样求出的平方根既可表示y与x的直线相关的程度,也可表示直线相关的性质。3直线相关把这样计算所得的统计量称为x与y的相关系数(coefficientofcorrelation),记为r,即3直线相关-1.0+1.00-0.5+0.5完全负相关无线性相关完全正相关负相关程度增加r正相关程度增加3直线相关相关关系都有哪些类型呢?相关关系非线性相关线性相关正相关正相关负相关负相关完全相关不相关0<r<1-1<r<0r=0r=0零相关正相关负相关零相关r=0r=0r=-1r=1完全正相关完全负相关零相关零相关3直线相关相关系数和决定系数有何区别?决定系数是相关系数的平方值除|r|=1or0外,r2<|r|
因此,决定系数可以防止对相关系数所表示的相关程度作夸张的解释r值可正可负,而r2都取正值,因此,在相关分析中可以将两者结合起来,即由r表示正或负的相关性质,由r2表示相关的程度在多元回归分析中r2是表示一个回归方程优劣的重要参数3直线相关相关系数和决定系数有何区别?相关系数实际是两个回归系数的几何平均值。这正反映了相关与回归的不同:相关是双向的关系,而回归是单向的。3直线相关相关系数和决定系数有何区别?直线回归分析侧重于寻求它们之间的联系形式
——直线回归方程直线相关分析侧重于揭示它们之间的联系程度和性质
——计算出相关系数。两种分析所进行的显著性检验都是解决y与x间是否存在直线关系。因而二者的检验是等价的。
3直线相关所获得的r值有统计学意义吗?由于有抽样误差的,r是否能真正地表明相关关系的存在,还需进一步进行假设检验ρ=0的假设检验r本身不服从某个已知的理论分布,但当n>5时ρ=0总体中的抽样分布近似与正态分布,因此,可用t检验,统计量为:3直线相关根据例1的资料r=-0.8344,作假设检验提出假设:H0:
;H1:
0确定显著水平计算得t=-4.05|t|>t0.01否定原假设,认为线性关系是真实存在的3直线相关与本例中回归系数的t检验相比较,我们会发现,相关系数假设检验的t值和回归系数的t值是相同的两种分析所进行的显著性检验都是解决y与x间是否存在直线关系。因而二者的检验是等价的。在实际应用中,对同一资料而言,两种检验只选其一即可。3直线相关ρ=C的假设检验目的时为了检验实得的r与某一指定的或理论的相关系数C是否有显著差异在ρ≠0时,r的抽样分布有很大的偏态,需对r进行反双曲正切变换3直线相关ρ=C的假设检验r>0r<0Z具有近似的正态分布,可用统计量u进行检验3直线相关直线回归和相关都有哪些内在关系?直线回归与相关的性质或方向相同,显著性检验等价。相关系数是标准化的回归系数。回归系数是有单位的,但若对b作消去单位的标准化处理,即对b中x和y的离均差以各自的标准差sx
和sy为单位,则有:3直线相关3直线相关直线回归和相关都有哪些内在关系?相关系数r是y依x的回归系数和x依y的回归系数的几何平均数3直线相关直线回归何相关都有哪些内在关系?线性回归方程也可以用相关系数表示3直线相关直线回归何相关都有哪些内在关系?线性回归和离回归平方和也可用相关系数表示3直线相关直线回归和相关的应用要点直线回归分析与相关分析在生物科学研究领域中已得到了广泛的应用,但在实际工作中却很容易被误用或作出错误的解释。必须注意以下几点:回归和相关分析要有学科专业知识作指导要严格控制研究对象(X和Y)以外的有关因素。直线回归和相关不显著并不意味X和Y没有关系3直线相关直线回归和相关的应用要点一个显著的r或b并不代表X和Y的关系就一定是线性的。对难以发现X和Y的真实曲线关系,允许X和Y在一定的范围之内用线性关系进行描述,但是使用范围也必须严格限制在观察值范围之内3直线相关直线回归和相关的应用要点一个显著的相关或回归并不一定具有实践上的预测意义。例如,当ν=50时,|r|=0.273即显著,但r2=0.074,表明X和Y可用线性关系说明的部分仅占总变异的7.4%,未说明的部分占92.6%,显然由X预测Y并不可靠因此,当需要用X预测Y时要求|r|>0.7。3直线相关直线回归和相关的应用要点为了提高回归和相关分析的准确性,两个变数的样本容量n(观察值对数)要尽可能大,最小不能低于5第五节
协方差分析田间试验设计与统计分析Analysisofcovariance5.1协方差分析的意义和功用
一、协方差分析的意义协方差(covariance)是两个变数的互变异数总体协方差定义样本协方差定义称为均积(meanproducts)或协方,记作MP5.1协方差分析的意义和功用
5.1协方差分析的意义和功用
方差与协方差VariancexX变异Covariancex,yx,y协同变异5.1协方差分析的意义和功用
方差分析与协方差分析方差分析变异平方和自由度SStSSe协方差分析变异乘积和自由度SPtSPe回归分析相关分析5.1协方差分析的意义和功用
二、协方差分析的功用统计控制估计协方差分量5.1协方差分析的意义和功用
统计控制试验设计的基本原则随机重复局部控制试验控制5.1协方差分析的意义和功用
统计控制在有些情况下,试验控制很难做到如:研究几种生长素对减少番茄落花落果的效应要求番茄的花序上的初始花数相同若初始花数与落花落果率存在线性回归关系y=a+bx将落花落果率矫正到初始花数都相同时的落花落果率统计控制5.1协方差分析的意义和功用
估计协方差分量方差分析中根据均方MS与期望均方EMS间的关系可获得不同变异来源的方差分量估计值协方差分析中也可以根据均积MP与期望均积EMP间的关可获得不同变异来源的协方差分量估计值5.2单向分组资料的协方差分析
一、资料模式与线性组成设有k组回归样本,每组各有n对观察值处理处理1…处理k观测指标xy…xy观测值xij、yij(i=1,2,…kj=1,2,…n)x11x12…x1j…x1ny11y12…y1j…y1n…xk1xk2…xkj…xknyk1yk2…ykj…ykn5.2单向分组资料的协方差分析
一、资料模式与线性组成每个y观察值不仅具有组效应和随机误差,还受x变数的影响为第i个处理效应为经回归矫正的处理平均数为Y依X的回归系数5.2单向分组资料的协方差分析
一、资料模式与线性组成ay’ij如在观察值中剔除处理效应,则协方差分析就是与x的线性回归分析5.2单向分组资料的协方差分析
一、资料模式与线性组成对观察值进行回归矫正,除去x不同的影响,则协方差分析就是的方差分析5.2单向分组资料的协方差分析
二、乘积和和自由度的分解根据方差分析中平方和分解的原理,协方差分析中总乘积和SPT也可分为组间SPt和组内SPe两部分5.2单向分组资料的协方差分析
例:为了研究A、B、C三种肥料对于苹果的增产效果,选了24株同龄苹果树,第一年记下各树的产量(x),第二年将每种肥料随机施于8株苹果树上,再记下其产量(y),结果见下表肥料观察值Ax4758534649565444y5466635156666150BX5253645859616366Y5453676262636469CX4448465059575853y5258546170646966三、回归关系的协方差分析5.2单向分组资料的协方差分析
三、回归关系的协方差分析对x和y分别进行方差分析,可得如下结果变异来源DFx变数y变数SSMSFSSMSF肥料间2356.08178.046.34**60.75030.375<1肥料内21587528.083830.873565总变异23945.83891.62推断可靠吗?5.2单向分组资料的协方差分析
上述推断是否可靠受以下条件限制:如x和y之间没有回归关系,那么上述推断是正确的如果x和y之间有回归关系,那么上述推断就是不可靠的需要将x对y的影响消除后,才能检验处理间是否真正存在显著差异利用专业知识进行分析:x和y是同一株苹果树上相邻两年的产量,第一年是基础,第二年产量是在原基础上的发展,两者具有因果关系x,y之间是否存在直线回归关系专业知识分析回归的显著性测验NoANOVA(y)Yes测验矫正平均数之间的差异显著性No无差异Yes矫正平均数的多重比较协方差分析的基本步骤5.2单向分组资料的协方差分析
测验x和y是否存在直线回归关系对处理内项(误差)作回归分析测验H0:β=0对HA≠0离回归平方和Qe和自由度ve=k(n-1)-1如接受H0:β=0则表明该资料只能用Y变数值作方差分析如否定H0:β=0则表明x和y有着显著的直线回归关系,因而需要进行以下步骤5.2单向分组资料的协方差分析
测验x和y是否存在直线回归关系5.2单向分组资料的协方差分析
测验x和y是否存在直线回归关系**否定H0:β=05.2单向分组资料的协方差分析
测验矫正平均数间的差异显著性校正y的总平方和与自由度,即总离回归平方和与自由度5.2单向分组资料的协方差分析
测验矫正平均数间的差异显著性矫正y的误差项平方和与自由度,即误差离回归平方和与自由度5.2单向分组资料的协方差分析
测验矫正平均数间的差异显著性矫正y的处理间平方和与自由度及F检验**5.2单向分组资料的协方差分析
处理平均数的矫正和矫正平均数的多重比较已经算得y依x的回归系数b=1.1515说明无论哪个处理,若x增加一个单位,y则平均将增加b=1.1515个单位对y的矫正可用以下公式5.2单向分组资料的协方差分析
处理平均数的矫正和矫正平均数的多重比较对于是:肥料B=肥料C>肥料A对于是:肥料C>肥料A>肥料B5.2单向分组资料的协方差分析
矫正平均数的多重比较矫正数差数的标准误假设5.2单向分组资料的协方差分析
矫正平均数的多重比较根据上式可对矫正平均数的差异显著性做出测验还可以使用LSD、LSR等方法进行多重比较5.2单向分组资料的协方差分析
矫正平均数的多重比较测验不同肥料效应的矫正平均数的差异显著性时,算得:肥料A和B:t=6.84**肥料A与C:t=-2.844*肥料B与C:t=-512**肥料矫正后的苹果产量差异显著性5%1%C64.29aAA62.06bAB55.51cB5.2单向分组资料的协方差分析
本例中,不考虑第一年产量对第二年产量的影响时,通过方差分析,不同肥料对苹果产量的效应是不显著的如考虑了第一年产量对第二年产量的影响时,发现它们之间存在回归关系,用协方差分析时发现,不同肥料对苹果产量的效应差异是显著的。因此,正确的试验设计、严格的试验控制和相应的统计方法,对于获得正确的试验结论是十分重要的5.2单向分组资料的协方差分析
协方差分析步骤总结:测验x和y是否存在直线回归关系如不存在直线回归关系,直接作方差分析测验矫正平均数间的差异显著性如矫正平均数间差异显著,则算出各个矫正平均数并进行多重比较,作出相应的统计推断5.3两向分组资料的协方差分析例:对6个菜豆品种(k=6)进行维生素C含(y,mg/100g)比较试验,4次重复(n=4),随机区组设计根据前人的研究,菜豆维生素C含量不仅与品种有关,而且与豆荚的成熟度有关。但在试验中又无法使所有小区的豆荚都同时成熟,所以同时测定了100g所采豆荚干物重百分率x,作为豆荚成熟度指标。测定结果列于表,试作协方差分析5.3两向分组资料的协方差分析菜豆品种的维生素C含量与豆荚干物重百分率测定结果品种区组I
区组II区组III区组IV合计平均xi1yi1xi2yi2xi3yi3xi4yi4xi·yi·A134.093.033.494.834.791.738.980.8141.0360.335.2590.08A23647.33851.551.233.352.027.2182.615345.65383A331.781.430.110033.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- T/CAPE 11003-2023在役管道泄漏维修技术规范
- T/CAPA 2-2021乳房整形美容标准
- m前厅考试题及答案
- 国信培训考试题及答案
- 公共传播面试题及答案
- 杭州幼师面试题库及答案
- 剑桥语文考试题及答案
- T/CAEPI 47-2022固定污染源二氧化碳排放连续监测系统技术要求
- 残联工作方案模板
- 登飞来峰望岳教学设计
- 2024年移动网格经理(认证考试)备考试题库大全-上单选、多选题汇
- 胸外科护理常规(全本) 胸外科疾病护理常规
- 医学课件内科胸腔镜术
- 天津市南开区2023-2024学年四年级下学期6月期末数学试题
- 河南省信阳市固始县2023-2024学年四年级下学期6月期末英语试题
- 恋爱心理与自我成长 知到智慧树网课答案
- 珍奇观赏植物智慧树知到期末考试答案2024年
- 医疗行业创新创业
- 《神笔马良》整本书阅读教学设计
- JJG 26-2011杠杆千分尺、杠杆卡卡规
- 新疆维吾尔自治区2023年道德与法治中考试卷(附参考答案)
评论
0/150
提交评论