版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第八章直线回归与相关
第一节回归和相关的概念第二节直线回归:直线回归方程的计算及检验第三节直线相关:相关系数与决定系数的计算2/5/2023LaboratoryofChemicalEcology1、函数关系与统计关系第一节回归和相关的概念变量之间的关系函数关系统计关系因果关系相关关系2/5/2023LaboratoryofChemicalEcology函数关系:是一种确定的关系。例如圆面积与半径的关系为:2/5/2023LaboratoryofChemicalEcology统计关系:是一种非确定关系,即一个变数的取值受到另一变数的影响,两者之间有关系,但又不存在完全确定的函数关系。例如作物的产量与施肥量、水稻的千粒重与株高。2/5/2023LaboratoryofChemicalEcology2、自变数与依变数对具有统计关系的两个变数,分别用变数符号X和Y表示。根据两个变数的作用特点,统计关系又可分为因果关系和相关关系两种。2/5/2023LaboratoryofChemicalEcology两个变数间的关系若有原因和反应(结果)的性质,则称这两个变数间存在因果关系,并定义原因变数为自变数(independentvariable),以X表示;定义结果变数为依变数(dependentvariable),以Y表示。例如施肥量和产量的关系。2/5/2023LaboratoryofChemicalEcology如果两个变数并不是原因和结果的关系,而呈现一种共同变化的特点,则称这两个变数间存在相关关系。相关关系中没有自变数和依变数之分。例如玉米穗长与穗重的关系。2/5/2023LaboratoryofChemicalEcology(1)对具有因果关系的两个变数,统计分析的任务是由试验数据推算出一个表示Y随X的改变而改变的方程,称之为回归方程(regressionequationofYonX),这一过程称为回归分析。3、回归分析和相关分析2/5/2023LaboratoryofChemicalEcology(2)对具有相关关系的两个变数,统计分析的目标是计算表示Y和X关系密切程度的统计数,并测验其显著性。这一过程称为相关分析。决定系数R相关系数r2/5/2023LaboratoryofChemicalEcology将两个变数的n对观察值(x1,y1)、(x2,y2)、…、(xn,yn)分别以坐标点的形式标记于同一直角坐标平面上得到的图:4、两个变数资料的散点图2/5/2023LaboratoryofChemicalEcology散点图(scatterdiagram)1234x,生物产量(g)0.00.51.01.52.0y,稻谷产量(g)水稻单株生物产量与稻谷产量的散点图2/5/2023LaboratoryofChemicalEcology3.23.644.44.8x,每平方米颖花数(万)05560657075y,结实率(%)水稻每平方米颖花数和结实率的散点图2/5/2023LaboratoryofChemicalEcology34567890250300350400450x,最高叶面积指数y,产量(kg/亩)水稻最高叶面积指数和亩产量的散点图2/5/2023LaboratoryofChemicalEcology研究“一因一果”,即一个自变量与一个依变量的回归分析称为一元回归分析;研究“多因一果”,即多个自变量与一个依变量的回归分析称为多元回归分析。一元回归分析又分为直线回归分析与曲线回归分析两种;多元回归分析又分为多元线性回归分析与多元非线性回归分析两种。2/5/2023LaboratoryofChemicalEcology第二节直线回归
一、直线回归方程的建立对于两个相关变量,一个变量用x表示,另一个变量用y表示,如果通过试验或调查获得两个变量的n对观测值:(x1,y1),(x2,y2),……,(xn,yn)
2/5/2023LaboratoryofChemicalEcology2/5/2023LaboratoryofChemicalEcology在x、y直角坐标平面上可以作出无数条直线,我们把所有直线中最接近散点图中全部散点的直线用来表示x与y的直线关系,这条直线称为回归直线。设回归直线的方程为:
为依变数的估计值,a为回归直线的截距,b是回归系数2/5/2023LaboratoryofChemicalEcologya、b应使回归估计值与实际观测值y的偏差平方和最小,即:直线回归方程的求解2/5/2023LaboratoryofChemicalEcology根据微积分学中的求极值的方法,令Q对a、b的一阶偏导数等于0,即:2/5/2023LaboratoryofChemicalEcology整理得关于a、b的正规方程组:解正规方程组,得:x的离均差和y的离均差的乘积之和,称之为乘积和。2/5/2023LaboratoryofChemicalEcologyb叫做样本回归系数,表示x改变一个单位,y平均改变的数量;b的符号反映了x影响y的性质,b的绝对值大小反映了x影响y的程度;
叫做回归估计值,是当x在其研究范围内取某一个值时,y值平均数的估计值。2/5/2023LaboratoryofChemicalEcology
回归方程的基本性质:
性质1最小;性质2;性质3回归直线通过点。2/5/2023LaboratoryofChemicalEcology例一些夏季害虫盛发期的早迟和春季温度高低有关。江苏武进连续九年测定3月下旬至4月中旬旬平均温度积累值(x,旬·度)和水稻一代三化螟盛发期(y,以5月10日为0)的关系,得结果于表,试计算其直线回归方程。2/5/2023LaboratoryofChemicalEcologyX35.534.131.740.336.840.231.739.244.2y12169273139-1注:以5月10日为0。2/5/2023LaboratoryofChemicalEcology1、作散点图2/5/2023LaboratoryofChemicalEcology2、计算回归截距a,回归系数b,建立直线回归方程首先根据实际观测值计算出下列数据:n=9∑x=35.5+34.1+……+44.2=333.7∑x2=35.52+34.12+……+44.22=12517.49∑y=12+16+……+(-1)=70∑y2=122+162+……+(-1)2=749∑xy=35.5*12+34.1*16+……+44.2*(-1)=2436.46个一级数据2/5/2023LaboratoryofChemicalEcologySSx=∑x2–(∑x)2/n=144.6356SSy=∑y2–(∑y)2/n=249.5556SP=∑xy–∑x∑y/n=-159.0444(乘积和)
5个二级数据2/5/2023LaboratoryofChemicalEcology解正规方程组2/5/2023LaboratoryofChemicalEcology进而计算出b、a:2/5/2023LaboratoryofChemicalEcology得到直线回归方程为:2/5/2023LaboratoryofChemicalEcology自变量x的取值区间2/5/2023LaboratoryofChemicalEcology3、直线回归的偏离度估计偏差平方和的大小表示了实测点与回归直线偏离的程度,因而偏差平方和又称为离回归平方和。离回归均方为:在建立回归方程时,使用了a,b两个统计数,故自由度为n-22/5/2023LaboratoryofChemicalEcology离回归均方的平方根叫离回归标准误,记为,即
离回归标准误Sy/x的大小表示了回归直线与实测点偏差的程度,即回归估测值与实际观测值y偏差的程度,于是我们把离回归标准误Sy/x用来表示回归方程的偏离度。(8-6)2/5/2023LaboratoryofChemicalEcology
(8-7)
利用(8-7)式先计算出,然后再代入(8-6)式求Sy/x。
对于【例8.1】有2/5/2023LaboratoryofChemicalEcology[例2]计算例1资料获得的回归方程的估计标准误xyy`y-y`(y-y`)235.5129.51272.48736.186734.11611.05214.947924.481731.7913.6912......40.324.2346......36.878.0832......40.234.3446......31.71313.6912......39.295.4442......44.2-1-0.0538-0.94620.8953求和∑74.66702/5/2023LaboratoryofChemicalEcologySy/x=3.266天,表明用回归方程由3-4月的积温预测一代三化螟盛发时,有一个3.266天的估计标准误。2/5/2023LaboratoryofChemicalEcology二、直线回归的显著性检验根据回归方程的计算程序,任意二组变量(X,Y)都可以得到一个回归方程:如果不经过显著性检验,显然不能确定两变量(X,Y)之间是否真实存在直线关系。也就是说,不经过显著检验的回归方程毫无意义。可以采用F测验和t测验两种方法2/5/2023LaboratoryofChemicalEcology1、直线回归的变异来源图的分解图2/5/2023LaboratoryofChemicalEcology
从上图看到:
上式两端平方,然后对所有的n点求和,则有2/5/2023LaboratoryofChemicalEcology
由于所以于是2/5/2023LaboratoryofChemicalEcology
所以有
反映了y的总变异程度,称为y的总平方和,记为SSy;反映了由于y与x间存在直线关系所引起的y的变异程度,称为回归平方和,记为SSR;反映了除y与x存在直线关系以外的原因,包括随机误差所引起的y的变异程度,称为离回归平方和,记为SSr。2/5/2023LaboratoryofChemicalEcology
可表示为:
这表明y的总平方和剖分为回归平方和与离回归平方和两部分。与此相对应,y的总自由度dfy也划分为回归自由度dfR与离回归自由度dfr两部分,即平方和的分解2/5/2023LaboratoryofChemicalEcology
在直线回归分析中,回归自由度等于自变量的个数,即;y的总自由度;离回归自由度。于是:离回归均方,回归均方
自由度的分解2/5/2023LaboratoryofChemicalEcology
2、回归关系显著性检验—F检验无效假设H0:=0,备择假设HA:≠0。在无效假设成立的条件下,回归均方与离回归均方的比值服从和的F分布,所以可以用
df1=1,df2=n-2来检验回归关系即回归方程的显著性。2/5/2023LaboratoryofChemicalEcology对于【例1】资料,有而。于是可以列出方差分析表进行回归关系显著性检验。2/5/2023LaboratoryofChemicalEcology变异来源dfSSMSF值F0.05F0.01回归SSR1174.8886174.888616.40**5.5912.25离回归SSr774.667010.6667总变异8249.5556回归关系方差分析2/5/2023LaboratoryofChemicalEcology因为,表明存在极显著的直线关系。
2/5/2023LaboratoryofChemicalEcology
3、回归系数的显著性检验—t检验回归系数显著性检验的无效假设和备择假设为
HO:β=0,HA:β≠0。β为总体的回归系数2/5/2023LaboratoryofChemicalEcologyt值的计算公式为:回归系数b的标准误回归方程的标准误2/5/2023LaboratoryofChemicalEcology
对于【例1】资料,已计算得
故有
2/5/2023LaboratoryofChemicalEcology当,查t值表,得
因,,否定HO:β=0,接受HA:β≠0,即直线回归系数b=-1.0996是极显著的,表明存在极显著的直线关系,可用所建立的直线回归方程来进行预测和控制。,
,
2/5/2023LaboratoryofChemicalEcology三、回归方程的应用1.预测:发生期预测;由x去预测y。例,一代三化螟蛾盛发期y与3-4月积温x的回归方程如下:=48.5485-1.0996x假设某年的积温x=35,则=48.5485-1.0996×35=10.0625≈10.1即该虫盛发期约为5月20日(以5月10日为0)左右2/5/2023LaboratoryofChemicalEcology2.控制:由y去控制x。例,某作物的产量y与施肥量x的回归方程如下:=391.93+6.62x若希望产量y>600斤/亩,则施肥量至少要多少斤/亩?由=391.93+6.62x>600可推出x>(斤/亩)2/5/2023LaboratoryofChemicalEcology注:①实际应用中,预测应结合误差和概率进行区间估计。
②应用回归方程时,自变量x的取值范围只限于原观察值的变化范围。③样本容量n应尽可能的大,至少要大于5。2/5/2023LaboratoryofChemicalEcology回归分析的完整步骤:第一步建立回归方程必作第二步进行回归关系的显著性检验第三步绘制回归直线2/5/2023LaboratoryofChemicalEcology温度x322926232017历期y5.86.87.488.58.9计算线性回归方程,并检验2/5/2023LaboratoryofChemicalEcology第三节直线相关
进行直线相关分析的基本任务在于根据x、y的实际观测值,计算表示两个相关变量x、y间线性相关程度和性质的统计量——相关系数r并进行显著性检验。2/5/2023LaboratoryofChemicalEcology
我们把比值
叫做x对y的决定系数(coefficientofdetermination),记为r2,即在依变量y的总变异中,由回归关系引起的变异部分所占的百分比。一、决定系数和相关系数总变异=直线回归变异+离回归变异(误差项)2/5/2023LaboratoryofChemicalEcology决定系数的意义:决定系数表示了两个变量间直线相关的程度。2/5/2023LaboratoryofChemicalEcology相关系数coefficientofcorrelation,记为r:回归因素所引起的变异与总变异之比的平方根,表示变量间联系程度和联系性质的统计指标。相关系数2/5/2023LaboratoryofChemicalEcology二、相关系数的计算
【例】计算10个小区中某作物植株数量和产量(kg)的相关系数。株数(x)68707071717173747676产量(y)506068656972717375772/5/2023LaboratoryofChemicalEcology根据表中所列数据先计算出:代入r计算公式得:即株数与产量的相关系数为0.8475。2/5/2023LaboratoryofChemicalEcology此时无效假设、备择假设为H0:ρ=0,HA:ρ≠0。三、相关系数的显著性检验测定一个样本相关系数为r所在的总体相关系数ρ是否为02/5/2023LaboratoryofChemicalEcology
t检验的计算公式为:t=,df=n-2(8-27)其中,,叫做相关系数标准误。F检验的计算公式为:F=,df1=1,df2=n-2(8-28)2/5/2023LaboratoryofChemicalEcology
查表法检验r的显著性,具体作法是:P376页
先根据自由度n-2查临界r值(附表10),得,若|r|<,P>0.05,则相关系数r不显著,在r的右上方标记“ns”;若≤|r|<,0.01<P≤0.05,则相关系数r显著,在r的右上方标记“*”;若|r|≥,P≤0.01,则相关系数r极显著,在r的右上方标记“**”。2/5/2023LaboratoryofChemicalEcology
对于上例中,因为df=n-2=10-2=8,查附表10得:=0.632,=0.765,而r=0.8475>,P<0.01,表明株数与产量之间的相关系数极显著。
2/5/2023LaboratoryofChemicalEcology四、相关系数与回归系数的关系从相关系数计算公式的导出可以看到:相关变量x与y的相关系数r是y对x的回归系数与x对y的相关系数bxy的几何平均数:2/5/2023LaboratoryofChemicalEcology
五、应用直线回归与相关的注意事项1、变量间是否存在相关2、其余变量尽量保持一致3、观测值要尽可能的多4、外推要谨慎5、正确理解回归或相关显著与否的含义6、一个显著的回归方程并不一定具有实践上的预测意义2/5/2023LaboratoryofChemicalEcology六、相关与回归的计算器处理例,进行温度对菌丝生长影响试验,将孢子接种后分别置于不同温度下12h,测量其菌丝的平均长度如表:温度(℃)1821242730长度(mm)0.250.602.504.506.75建立温度与菌丝生长长度间的回归方程。2/5/2023LaboratoryofChemicalEcology进入
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度原材料采购:木屑长期供应合同
- 2024年度代持能源权益合同
- 2024年度工程承包合同:基础设施建设施工合同
- 04版电子商务平台搭建与运营合同
- 2024年度物联网技术应用合同
- 湿式潜水衣市场发展现状调查及供需格局分析预测报告
- 贵金属制钥匙圈市场需求与消费特点分析
- 灯罩座市场发展现状调查及供需格局分析预测报告
- 2024年度智慧城市系统开发与应用合同
- 磁带录音机市场发展现状调查及供需格局分析预测报告
- 任务3-批评语训练课件
- 常用孔轴卡簧规格尺寸
- 宫颈上皮内瘤变管理指南课件
- 水泵试运行记录表
- 最新高警示药品目录
- 双减背景下的作业设计与实施优秀案例PPT
- 朗读者的10篇美文
- 五年级上册心理健康教育课件-学会合作 全国通用(共20张PPT)
- 《会计电算化理论》课程教学大纲
- 一级二级三级医养结合机构服务质量评价标准(试行)
- 埋针治疗评分标准
评论
0/150
提交评论