直线回归与相关_第1页
直线回归与相关_第2页
直线回归与相关_第3页
直线回归与相关_第4页
直线回归与相关_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

直线回归与相关第一页,共三十二页,编辑于2023年,星期三Section8.1

ConceptsAboutRegressionandCorrelation

回归与相关的基本概念第二页,共三十二页,编辑于2023年,星期三一、确定性关系与相关关系确定性关系:两变量间的函数关系

圆的周长与半径的关系:C=2R

速度、时间与路程的关系:L=STx与y的函数关系:y=a+bx相关关系:两变量在宏观上存在关系,但并未精确到可以用函数关系来表达。施肥量与产量的关系身高与年龄的关系;年龄与血脂的关系;身高与体重的关系;体重与体表面积的关系;药物浓度与反应率的关系;第三页,共三十二页,编辑于2023年,星期三二、反应变量与解释变量反应变量(responsevariable):度量研究结果的变量,也称为因变量(dependentvariable)产量y解释变量(explanatoryvariable):解释或引起反应变量改变的变量,也称为自变量(independentvariable)施肥量x第四页,共三十二页,编辑于2023年,星期三三、相关性与因果关系施肥量对水稻产量影响的研究不同施肥量(解释变量)对水稻产量(反应变量)的影响中学生数学与语文成绩的关系两变量并没有谁影响谁的情形若将数学成绩视为反应变量,语文成绩视为解释变量,则可利用两成绩的相关性以一考生的语文成绩预测该考生的数学成绩第五页,共三十二页,编辑于2023年,星期三Section8.2

ScatterPlots

散点图第六页,共三十二页,编辑于2023年,星期三

x累积温y盛发期35.534.131.740.336.840.231.739.244.212169273139-1

表1累积温和一代三化螟盛发期的关系一些夏季害虫盛发期的早迟和春季温度高低有关。江苏武进连续9年测定3月下旬至4月中旬旬平均温度累积值(x,旬·度)和水稻一代三化螟盛发期(y,以5月10日为0)的关系,得结果于右表。例:累积温和一代三化螟盛发期的关系第七页,共三十二页,编辑于2023年,星期三例:累积温和一代三化螟盛发期的散点图第八页,共三十二页,编辑于2023年,星期三利用散点图判断相关性质及密切程度r=0(h)r=0(f)r=-1(d)r=1(b)0<r<1(a)-1<r<0(c)r

0(e)r

0(g)零相关正相关负相关完全正相关完全负相关零相关零相关零相关第九页,共三十二页,编辑于2023年,星期三Section8.3

CorrelationAnalysis

相关系数第十页,共三十二页,编辑于2023年,星期三一、什么是相关系数x的离均差平方和:y的离均差平方和:x与y

间的离均差积和:

第十一页,共三十二页,编辑于2023年,星期三二、相关系数的性质-1≤r≤1r的符号表示相关的性质r=0为零相关或不相关r>0为正相关r<0为负相关第十二页,共三十二页,编辑于2023年,星期三二、相关系数的性质r的绝对值表示相关的密切程度r的绝对值越接近于1,相关越密切;r的绝对值越接近于0,相关越不密切;r的绝对值为0,零相关或不相关;r的绝对值为1,完全相关r=1,完全正相关r=-1,完全负相关第十三页,共三十二页,编辑于2023年,星期三三、利用相关系数判断相关性质及密切程度r=0(h)r=0(f)r=-1(d)r=1(b)0<r<1(a)-1<r<0(c)r

0(e)r

0(g)零相关正相关负相关完全正相关完全负相关零相关零相关零相关第十四页,共三十二页,编辑于2023年,星期三四、相关系数的计算第十五页,共三十二页,编辑于2023年,星期三[例1]试计算表1资料的相关系数。

四、相关系数的计算第十六页,共三十二页,编辑于2023年,星期三

四、相关系数的计算第十七页,共三十二页,编辑于2023年,星期三Section8.4

Least-SquaresRegression

最小平方回归第十八页,共三十二页,编辑于2023年,星期三一、直线回归方程的计算

y因变量,响应变量

(dependentvariable,responsevariable)x自变量,解释变量

(independentvariable,explanatoryvariable)

直线回归的形式:第十九页,共三十二页,编辑于2023年,星期三最小二乘法(leastsquareestimation)一、直线回归方程的计算第二十页,共三十二页,编辑于2023年,星期三

一、直线回归方程的计算[例2]试计算表1资料的回归方程。在例1已算得:第二十一页,共三十二页,编辑于2023年,星期三

因而有:

b=-159.0444/144.6356=-1.0996[天/(旬·度)]a==7.7778-(-1.0996×37.0778)=48.5485(天)故得表1资料的回归方程为:=48.5485-1.0996x一、直线回归方程的计算第二十二页,共三十二页,编辑于2023年,星期三回归系数和回归截距的意义为:当3月下旬至4月中旬的积温(x)每提高1旬·度时,一代三化螟的盛发期平均将提早1.1天;若积温为0,则一代三化螟的盛发期将在6月27—28日(x=0时,=48.5;因y是以5月10日为0,故48.5为6月27—28日)。由于x变数的实测区间为[31.7,44.2],当x<31.7或>44.2时,y的变化是否还符合=48.5-1.1x的规律,观察数据中未曾得到任何信息。在应用回归方程预测时,需限定x的区间为[31.7,44.2];如要在x<31.7或>44.2的区间外延,则必须有新的依据。一、直线回归方程的计算第二十三页,共三十二页,编辑于2023年,星期三

x,3月下旬至4月中旬旬平均温度累积值旬平均温度累积值和一代三化螟盛发期的关系二、直线回归方程的图示第二十四页,共三十二页,编辑于2023年,星期三

=SSy-b(SP)=SSy-b2(SSx)=∑y2-a∑y-b∑xy离回归平方和三、直线回归的估计标准误第二十五页,共三十二页,编辑于2023年,星期三将SSy分解成两个部分,即:四、直线回归关系的假设测验回归和离回归的方差比遵循F分布

第二十六页,共三十二页,编辑于2023年,星期三[例3]试用F测验法检测表1资料回归关系的显著性。变异来源DFSSMSFF0.01回归1174.8886174.888616.4012.25离回归774.667010.6667总变异8249.5556四、直线回归关系的假设测验第二十七页,共三十二页,编辑于2023年,星期三五、回归方程的应用-预测(一)所有自变量为x的个体y的平均值的预测区间

保证概率为0.95的预测区间为:

第二十八页,共三十二页,编辑于2023年,星期三[例4]试根据表1资料估计:当3月下旬至4月中旬的积温为40旬·度时,历年的一代三化螟平均盛发期在何时(取95%可靠度)?将x=40代入方程得五、回归方程的应用-预测第二十九页,共三十二页,编辑于2023年,星期三五、回归方程的应用-预测第三十页,共三十二页,编辑于2023年,星期三(二)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论