第9章-直线回归与相关分析-1_第1页
第9章-直线回归与相关分析-1_第2页
第9章-直线回归与相关分析-1_第3页
第9章-直线回归与相关分析-1_第4页
第9章-直线回归与相关分析-1_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目的要求:(1)了解回归与相关的概念,以及回归和相关分析的种类;(2)掌握一元线性回归分析方法;(3)掌握一元相关分析方法。第一节回归和相关的概念1.函数关系与统计关系2.自变数与依变数3.回归分析和相关分析4.两个变数资料的散点图u、t、F、检验——差异显著性检验,只涉及一个变量。回归与相关分析——研究变量间关系的统计方法。两个变量之间的关系:函数关系(确定性关系)回归关系统计关系(不确定关系)相关关系1.函数关系与统计关系1885年,高尔登在英国皇家学会上发表了关于回归现象的演说,并于1886年发表的《在遗传的身长中向中等身长的回归》论文中,正式提出回归概念。“相关”的概念最初是由进化论创始人达尔文(CharlesDarwin,1809-1882)于1859年在《物种起源》中提出的。1885年,达尔文的表第高尔登(FrancisGalton,1822-1911)在英国皇家学会上发表了关于身长遗传中相关现象的演说,首次赋予“相关”一词以新的涵义。2.自变数与依变数回归分析:研究变量之间的联系形式的一种统计方法。联系形式用回归方程来表示。由方程次数不同来分线性回归——方程次数为1,如:y=a+bx。非线性回归——方程次数不为1,如:y=axb(b≠1)。

由方程的自变量个数来分一元回归——只有一个自变量,如:y=a+bx,y=axb多元回归——自变量个数多于1,如:

y=b0+b1x1+…+bmxm3.回归分析和相关分析一个自变量两个及两个以上自变量回归模型多元回归一元回归线性回归非线性回归线性回归非线性回归相关关系

如果两个变数并不是原因和结果的关系,而呈现一种共同变化的特点,则称这两个变数间存在相关关系。相关关系中并没有自变数和依变数之分。如在玉米穗长与穗重的关系中,它们是同步增长、互有影响的,既不能说穗长是穗重的原因,也不能说穗重决定穗长。在这种情况下,X和Y可分别用于表示任一变数。(X和Y均有误差存在)相关分析:研究变量之间的联系程度和联系性质的一种统计方法。程度:变量间关系密切程度。变量关系性质:正(负)相关——方向一致(相反)一元直线相关(简单相关)相关分析复相关多元线性相关偏相关将计算回归方程为基础的统计分析方法称为回归分析,将计算相关系数为基础的统计分析方法称为相关分析。原则上两个变数中Y含有试验误差而X不含试验误差时着重进行回归分析;Y和X均含有试验误差时则着重去进行相关分析。它们的界限并不十分严格,因为在回归分析中包含有相关分析的信息,在相关分析中也包含有回归分析的信息

函数关系有精确的数学表达式(确定性的关系)直线回归分析一元回归分析变量间的关系因果关系曲线回归分析

(回归分析)多元回归分析多元线性回归分析统计关系 多元非线性回归分析(非确定性的关系)简单相关分析——直线相关分析相关关系复相关分析(相关分析)多元相关分析偏相关分析散点图作用:(1)两个变数之间的关系(有关/无关)(2)关系类型(线性关系/非线性关系)(3)相关的性质与密切程度(4)异常值的存在4.两个变数资料的散点图散点图GraphingthedataFittingthebeststraightlineNorelationshipRelationshipbutnotstraight-linedNegativelinearrelationshipPositivelinearrelationshipWhichone?Needcriterion一个自变量两个及两个以上自变量回归模型多元回归一元回归线性回归非线性回归线性回归非线性回归回归分析:研究变量之间的联系形式的一种统计方法。联系形式用回归方程来表示。第二节简单回归分析一、直线回归方程二、直线回归的假设测验和区间估计三、直线回归的矩阵求解第二节简单回归分析Example:Areaofayeastcolonyonsuccessivedays.Area(y)Timedays(x)HLSlope(b)=H/LaIntercept(atx=0)00MethodPP.159[例9.1]一些夏季害虫盛发期的早迟和春季温度高低有关。江苏武进连续9年测定3月下旬至4月中旬旬平均温度累积值(x,旬·度)和水稻一代三化螟盛发期(y,以5月10日为0)的关系,得结果于表9.1。试计算其直线回归方程。x累积温y盛发期35.534.131.740.336.840.231.739.244.212169273139-1解:一级统计数

PP.160二级统计数注:回归与相关分析中,一般要求中间结果保留4~6位小数。b=-1.0996表明累积温每升高(减少)1℃,将使一代三化螟蛾的盛发期提前(延迟)约1.1天。回归方程:

注意,由于实测区间为[31.7,44.2],当<31.7或 >44.2时,的变化是否还符合 的规律,还必须提供新的依据。 回归截距=48.5485的意义为:若3月下旬的积温为0,则一代三化螟盛发期为48.5485,即在6月27-28日。xy三、回归关系的显著性检验检验x与y是否有真实的回归关系。H0:=0HA:≠0

㈠F测验:回归关系引起的变异依变量y的总变异

其它因素引起的变异xy回归平方和,记作U或SS回离回归平方和(偏差平方和)记作Q或SS离

=0因为()所以其中,——回归平方和,记作U或SS回

——离回归平方和(偏差平方和)记作Q或SS离xy回归平方和,记作U或SS回离回归平方和(偏差平方和)记作Q或SS离所以,SSy=SS回+SS离相应地,dfy=df回+df离其中,dfy=n-1

df回=1

df离=dfy-df回=n-2变异来源DFSSMSFF0.01回归1SS回MSRMSR/MSe离回归n-2SS离MSe总变异n-1SSTPP.164各项平方和的实用计算公式:

pp.162∴S2回==SS回,S2离=Sy/x----回归估计标准误,是表示回归估计精度的重要统计数。S离大(或小),由回归方程估计y的精度就低(或高)。pp.161-162

F<F0.05

接受不显著。当F0.05≤F<F0.01时,否定H0,推断回归关系显著,记*

F≥F0.01

否定极显著,**PP.164上例,已知:SSy=249.5556,SSx=144.6356,SP=-159.0444,n=9,dfy=n-1=8解:

df回=1SS离=SSy-SS回=74.6670df离=n-2=7PP.164F0.05(1,7)=5.59F0.01(1,7)=12.25因为F>F0.01,所以否定H0,推断回归关系极显著,即表明累积温x与一代三化螟蛾盛发期y具有真实的直线关系。PP.164㈡t测验:数统可证:当分子自由度=1时,F与t

有如下关系:F=t2

其中,叫做回归系数标准误。查临界

t值用离回归自由度df离=n-2。PP.165上例,已知:b=-1.0996,SSx=144.6356,SS离=74.6670,n=9解:

t0.05(7)=2.36df=n-2=9-2=7t0.01(7)=3.50因为|t|>t0.01(7),所以否定H0,推断回归关系极显著,即表明累积温与一代三化螟蛾盛发期具有真实的直线关系。PP.164PP.165(二)直线回归的区间估计参数b的方差估计量的方差预测值的方差为:置信区间和预测区间的图示

1.进入LR模式:inv键+mode键+2键2.清零:inv键+AC键3.按xi,yi顺序输数据:例9.1

35.5+[(…键、12+RUN键、

34.1+[(…键、16+RUN键,

……

44.2

+[(…键、

-1+RUN键利用CASIOfx3600计算器进行直线回归与相关分析4.获得结果:

INV键+7键,8键,9键,获得相应数字键下方棕色指标结果(A、B、r)

INV键+4键,5键,6键,获得相应数字键下方棕色指标结果(ỹ、yσn

、yσn-1)

Kout键+4键,5键,6键,获得相应数字键下方黑色指标结果(∑y2、∑y、∑xy)

INTERCEPT(known_y's,known_x's)计算两组数据的回归截距SLOPE(known_y's,known_x's)计算两组数据的斜率LINEST(known_y's,known_x's,const,stats)计算两组数据回归截距和回归系数CORREL(array1,array2)计算两组数据的相关系数COVAR(array1,array2)计算两组数据的协方差EXCEL电子表格提供的部分粘帖函数利用数据分析工具(五)直线回归的数学模型和基本假定直线回归模型中,Y总体的每一个值由以下三部分组成:①回归截距,②回归系数,③Y变数的随机误差。总体直线回归的数学模型:~N(0,)。相应的样本线性组成为:(9·7)(9·8)回归分析时的假定:(1)Y变数是随机变数,而X变数则是没有误差的固定变数,至少和Y变数比较起来X的误差小到可以忽略。(2)在任一X上都存在着一个Y总体(可称为条件总体),它是作正态分布的,其平均数是X的线性函数:(9·9)

的样本估计值,与X的关系就是线性回归方程(9·1)。(3)所有的Y总体都具有共同的方差,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论