一元回归及简单相关分析_第1页
一元回归及简单相关分析_第2页
一元回归及简单相关分析_第3页
一元回归及简单相关分析_第4页
一元回归及简单相关分析_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十章 一元回归及简单相关分析(One-place Linear RegressionAnd Correlation Analysis) 在实际问题中我们常常会遇到多个变量同处于一个过程之中,它们互相联系、互相制约.在有的变量间有完全确定的函数关系,例如电压V、电阻R与电流I之间有关系式:V=IR;在圆面积S与半径R之间有关系式S=R2. 自然界众多的变量之间,除了以上所说的那种确定性的关系外,还有一类重要的关系,即所谓的相关关系.比如,人的身高与体重之间的关系.虽然一个人的身高并不能确定体重,但是总的说来,身高者,体重也大.我们称身高与体重这两个变量具有相关关系. 回归分析方法是一种常用的数

2、理统计方法,是处理多个变量变之间相关的一种数学方法. 实际上,由于实验误差的影响,即使是具有确定性关系的变量之间,也常表现出某种程度的不确定性. 回归分析方法是处理变量间相关关系的有力工具.它不仅为建立变量间关系的数学表达式(经验公式)提供了一般的方法,而且还能判明所建立的经验公式的有效性,从而达到利用经验公式预测、控制等目的.因此,回归分析方法的应用越来越广泛,其方法本身也在不断丰富和发展. 10.1 回归与相关的基本概念 10.2 一元线性回归方程 10.3 一元线性回归的检验 10.4 一元非线性回归 10.5 相关10.1 回归与相关的基本概念相关关系两变量X,Y均为随机变量,任一变量

3、的每一可能值都有另一变量的一个确定分布与之对应。2. 回归关系X是非随机变量或随机变量,Y是随机变量,对X的每一确定值 都有Y的一个确定分布与之对应。3. 按两变量相关(或回归)的程度分类(1)完全相关(2)不相关(3)统计相关(不完全相关)10.2 一元线性回归方程1.散点图2.一元正态线性回归模型()3.回归方程参数的估计难点 在一元线性回归分析里,我们要考察随机变量Y与一个普通变量x之间的关系. 对于有一定联系的两个变量:x与y,通过观测或实验得到n对数据(x1,y1), (x2,y2), .,(xn, yn)用什么方法可以得到这两个变量之间的经验公式呢?为此举例如下:1.散点图 例:维

4、尼纶纤维的耐热水性能好坏可以用指标“缩醛化度”Y(克分子%)来衡量.这个指标越高,耐热水性能也越好.而甲醛浓度是影响缩醛化度的重要因素.在生产中常用甲醛浓度x(克/升)去控制这一指标.为此必须找出它们之间的关系,现安排了一批试验,获得如下数据: 若重复这些试验,在同一甲醛浓度x下,所获得的缩醛化度Y不完全一致.这表明x与Y之间不能用一个完全确定的函数关系来表达.Y31302928272618 20 22 24 26 28 30 x 散点与近似直线图 为了看出它们之间是否有关及存在什么样的关系,我们在直角坐标系下作出了这些点,从图上可看出:随甲醛浓度x的增加,缩醛化度Y也增加,且这些点近似在一条

5、直线附近,但又不完全在一条直线上.引起这些点与直线偏离的原因是由于在生产和测试过程中还存在一些不可控的因素,它们都在影响着试验结果. 这样我们可以把试验结果Y看成由两部分叠加而成:一部分是由x的线性函数引起,记为 ;另一部分是由随机因素引起,记为,即一般假设随机误差N(0,2).即Y N( ,2) 在 中,x是一般变量,它可以精确测量或可以加以控制,Y是可观察其值的随机变量, N(0,2)是不可观察的随机变量, 是未知参数. 为了获得未知参数 的估计,需要进行若干次独立试验.设试验结果为(x1,Y1), (x2,Y2), .,(xn,Yn) 则 1 N(0,2) 2 N(0,2) n N(0,

6、2)这里1,., n相互独立.这就是一元线性回归模型.2.一元正态线性回归模型(simple normal linear regression model)样本线性回归方程 为各X处Y的总体均数的估计 相互独立3.参数 和 的估计原则:最小二乘法(least sum of squares),即可保证各实测点至直线的纵向距离的平方和最小。正规方程10.3一元线性回归检验1.b和a的数学期望与方差 普通最小二乘估计量a, b分别是 的线性组 合,因此, a, b 的概率分布取决于 分布特征。 在 是正态分布的假设下, 是正态分布,则a, b也服从正态分布。 Y的离均差,总变异残差回归的变异2. 平

7、方和分解公式 对于n组数据(x1,y1),(x2,y2),(xn,yn),有是y1,y2,yn这 n个数据的偏差平方和,它的大小描述了这n个数据的分散程度。几个平方和的意义:由此可知,它的几何意义是,在回归直线上,其横坐标为 的点的纵坐标.平均数也是 由上面的分析可知,y1,y2,yn分散程度可以分解为两部分ST=SR+SE,其中一部分是通过x对于y的线性相关关系而引起的y的分散性,另一部分是剩余部分引起的y的分散性.平方和的分解3.回归方程的检验:定理:(1)F-检验(2)t-检验4.一元回归的方差分析方差来源平方和自由度均方F值回归1残差n-2总和n-15.两个回归方程的比较两个回归方程为

8、检验步骤:6.点估计与区间估计 的 的区间: 的 的区间:残(n-2)对回归线 的估计:对 的估计:例:对大白鼠,如从出生第6天起,每三天秤一次体重,直到第18天。见下表。试计算日龄X与体重Y之间的回归方程。大白鼠618日龄的体重编号12345日龄69121518体重1116.522262910.4 一元非线性回归(nonlinear regression)1.双曲线:2.幂函数:3.指数曲线:4.对数曲线:5.S型曲线:6.多项式回归:7.曲线拟合状况的检验() 一般情况可用剩余均方的大小来判断拟合的优劣,剩余均方愈小,拟合得愈好。通常采用多种变换方法,比较每种变换方法的剩余均方,从中选出最优者。10.5 相关(Correlation)1.相关系数(correlation coefficient)(1)样本相关系数()(2)总体相关系数2.相关系数的性质3.相关系数的计算4.相关系数检验(难点)(1)t 检验(2)相关系数检验表(3)Z 变换前提

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论