第6章 回归分析(201362)_第1页
第6章 回归分析(201362)_第2页
第6章 回归分析(201362)_第3页
第6章 回归分析(201362)_第4页
第6章 回归分析(201362)_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、误差理论与数据处理第6章 回归分析误差理论与数据处理l 回归分析的基本概念l 一元线性回归方程的求解l 回归方程的方差分析和显著性检验l一元非线性回归分析方法重点与难点误差理论与数据处理第一节回归分析的基本概念第一节回归分析的基本概念一、变量间的关系一、变量间的关系 在现实世界中存在大量的变量, 它们有相互依存、相互制约的关系,一般分为两类:确定性关系与非确定性关系。 Ex.1 球的直径 X 与球的体积 V 之间有确定的函数关系 :361XV 变量间可以用明确的函数关系式精确地表示出来。或者说变量间存在着唯一确定的关系,称存在着唯一确定的关系,称为为确定性关系,又称为函数关系。误差理论与数据处

2、理第一节回归分析的基本概念第一节回归分析的基本概念一、变量间的关系一、变量间的关系 Ex.2 江河上游地区森林覆盖面积Y与下游的水流量X之间的关系。 Ex.3 农作物产量Y与降雨量 X1 ,氮、磷、钾的施肥量X2 、X3 、X4 之间的关系。 变量间存在着密切的关系,但不能用确定的不能用确定的函数式精确表达,称为函数式精确表达,称为不确定性关系,又称为相关关系。 EX. 4 产品的价格X与需求量M之间存在关系。 特点 变量间的关系无法用确定的函数来明确表述。 EX. 5 零件的加工误差与零件的直径之间的关系。 误差理论与数据处理 根据以上数据,分析人体内脂肪含量与年龄之间有怎根据以上数据,分析

3、人体内脂肪含量与年龄之间有怎样的关系?样的关系?如何研究变量间的相关关系?如何研究变量间的相关关系?实例1:人体脂肪含量与年龄之间的关系注:表中各年龄对应的脂肪数是这个年龄人群的样本平均数。注:表中各年龄对应的脂肪数是这个年龄人群的样本平均数。年龄年龄23273941454950脂肪9.517.821.225.927.526.328.2年龄年龄53545657586061脂肪 29.630.231.430.833.535.234.6误差理论与数据处理x0202530354550 5560年龄年龄510152025303540y脂肪含量脂肪含量4065 下面我们以年龄为横轴下面我们以年龄为横轴,

4、 脂肪含量为纵轴建立脂肪含量为纵轴建立直角坐标系直角坐标系, 作出各个点作出各个点, 称该图为称该图为散点图散点图。年年龄龄23273941454950脂肪9.517.821.225.927.526.328.25354565758606129.630.231.430.833.535.234.6年龄越大年龄越大,体内脂体内脂肪含量越高,点肪含量越高,点的位置散布在的位置散布在从从左下角到右上角左下角到右上角的区域。称它们的区域。称它们成成正相关正相关误差理论与数据处理 通过散点图发现,通过散点图发现,海平面以上,海拔高海平面以上,海拔高度越高,含氧量越少。度越高,含氧量越少。而且这些点而且这些点

5、散布在从散布在从左上角到右下角的区左上角到右下角的区域内,域内,称它们成称它们成负相负相关关.实例2:人体高原含氧量与海拔高度的相关关系海拔高度海拔高度含含氧氧量量误差理论与数据处理思考:当人的年龄增大时,体内脂肪含量到底思考:当人的年龄增大时,体内脂肪含量到底是增加多少呢?是增加多少呢?0202530354550 5560 x年龄年龄510152025303540y脂肪含量脂肪含量4065 这些点大致分这些点大致分布在一条直线附近布在一条直线附近, 此时我们就称这两此时我们就称这两个变量之间具有个变量之间具有线线性相关性相关关系关系, 这条直这条直线叫做线叫做回归直线回归直线,, 这条直线的

6、方程叫这条直线的方程叫做做回归方程。回归方程。误差理论与数据处理0202530354550 5560 x年龄年龄510152025303540y脂肪含量脂肪含量4065怎么求回归直线方程呢怎么求回归直线方程呢误差理论与数据处理二、回归分析的含义二、回归分析的含义 回归分析:回归分析:处理变量间相关关系的一种数理统计方法。也就处理变量间相关关系的一种数理统计方法。也就是找出一个能够反映变量间变化关系的函数关系式,并据此进是找出一个能够反映变量间变化关系的函数关系式,并据此进行估计和推算。行估计和推算。 分析过程分析过程 :建立在大量的实验数据基础上,运用数理统计建立在大量的实验数据基础上,运用数

7、理统计方法,寻找一个数学模型来描述变量间的相关关系,根据最小方法,寻找一个数学模型来描述变量间的相关关系,根据最小二乘法原理,确定一个相应的数学表达式(回归方程),然后二乘法原理,确定一个相应的数学表达式(回归方程),然后再进行方差分析和显著性检验。再进行方差分析和显著性检验。样本数据数学模型回归一词的由来回归一词的由来回归方程最小二乘法原理最小二乘法原理显著性检验误差理论与数据处理三、回归分析类型三、回归分析类型按自变量的个数分按自变量的幂次分回回归归分分析析多元回归多元回归一元回归一元回归一元线性回归一元线性回归一元非线性回归一元非线性回归多元线性回归多元线性回归多元非线性回归多元非线性回

8、归一元线性回归一元线性回归非线性回归非线性回归线性回归线性回归误差理论与数据处理第二节一元线性回归第二节一元线性回归研究某大容量电容位移传感器输入量与输出量间的关系1.抽取样本数据抽取样本数据表1 试验数据序号12345678(位移)01234567(输出电压)00.080.190.290.450.520.590.71mmxi/Vyi/对该位移传感器的输入和输出进行实际测量,测得8组试验数据如下表:一元线性回归:一元线性回归:确定两个变量之间的线性关系。直线拟合。直线拟合。误差理论与数据处理第二节一元线性回归第二节一元线性回归 2.建立数学模型建立数学模型ii0ixy 因变量(输出电压) 自变

9、量(位移)随机误差设测量数据有如下结构形式:x02468y0.20.40.60.8bxby0iiyx,iqiibxbx0,)(0iiiiibxbyyyq误差理论与数据处理第二节一元线性回归第二节一元线性回归 3.确定估计回归方程确定估计回归方程x02468y0.20.40.60.8 的最佳估计值。采用最小二乘法求解。思路:求电压y与位移x的关系,即根据测量数据要求出0和点到直线距离的平方和最小点到直线距离的平方和最小误差理论与数据处理第二节一元线性回归第二节一元线性回归nininiiiiininiiiyxbxbxybxnb11120110nibxbyyyviiiii, 2 , 10应用最小二乘

10、法原理可得正规方程为:应用最小二乘法原理可得正规方程为:残余误差方程:残余误差方程:误差理论与数据处理第二节一元线性回归第二节一元线性回归估计回归方程:解得:xbyb0bxby0 xxxyniniiininiiiniiillxnxyxnyxb121211111xbyb0误差理论与数据处理求回归直线方程的步骤求回归直线方程的步骤2、列表、列表1、设回归方程、设回归方程bxby0误差理论与数据处理3、计算、计算4、代入公式、代入公式 求求 的值的值5、写出回归方程、写出回归方程bb 和0?)(1?)(1?1?1111211211niiniiniiixyniiniixxniiniiyxnyxlxnx

11、lynyxnx?0 xbybllbxxxy?0bxby误差理论与数据处理第二节一元线性回归第二节一元线性回归表1 试验数据序号12345678(位移)01234567(输出电压)00.080.190.290.450.520.590.71mmxi/Vyi/对该位移传感器的输入和输出进行实际测量,测得8组试验数据如下表:实例实例1计算计算误差理论与数据处理解:解:2、列表、列表1、设回归方程、设回归方程bxby0误差理论与数据处理3、计算、计算则回归方程为:则回归方程为:335. 4)(8142)(81354. 0815 . 3818181812818128181iiiiiiixyiiiixxii

12、iiyxyxlxxlyyxx016. 0103. 00 xbybllbxxxyxbxby103. 0016. 00误差理论与数据处理实例实例2 有一个同学家开了一个小卖部,他为了研究有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:热饮杯数与当天气温的对比表:摄氏温度摄氏温度-504712151923273136热饮杯数156 150 132 128 130 116 10489937654第二节一元线性回归第二节一元线性回归求(求(1)回归方程)回归方程 (2)如果某天的气温是)如果某天

13、的气温是2摄氏度,预测这天卖出的热饮杯数。摄氏度,预测这天卖出的热饮杯数。误差理论与数据处理 从散点图从散点图中发现气温与中发现气温与热饮销售杯数热饮销售杯数之间成线性负之间成线性负相关关系,即相关关系,即气温越高,卖气温越高,卖出去的热饮杯出去的热饮杯数越少。数越少。 摄氏温度摄氏温度-504712151923273136热饮杯数156 150 132 128 130 116 10489937654020406080100120140160180-10 -50510152025303540热饮杯数热饮杯数xy误差理论与数据处理第二节一元线性回归第二节一元线性回归1、列表、列表 误差理论与数据

14、处理3、当、当x=2时,时,y=143.068, 因此,某天的气温为因此,某天的气温为2摄氏度时,这天大约可以卖出摄氏度时,这天大约可以卖出143杯热饮。杯热饮。 第二节一元线性回归第二节一元线性回归2、求回归方程、求回归方程 4088)(1111738)(111636.111111364.1511111111111121111112111111iiiiiiixyiiiixxiiiiyxyxlxxlyyxx772.147352. 20 xbybllbxxxyxbxby352. 2772.1470误差理论与数据处理二、回归方程的方差分析及显著性检验二、回归方程的方差分析及显著性检验第二节一元线性

15、回归第二节一元线性回归问题:这条回归直线是否符合y 与x之间的客观规律?回归直线的精度如何?u对n个观测值与其算术平均值之差的平方和进行分解;u用F检验法对所求回归方程进行显著性检验。方差分析法误差理论与数据处理第二节一元线性回归第二节一元线性回归(一)回归方程的方差分析总的离差平方和(即n个观测值之间的变差)niyyilyyS12)(1 nS 可以证明: S=U+Q其中nixyiblyyU12)(xyyyniiibllyyQ12)(1U2 nQ U回归平方和,反映总变差中由于回归平方和,反映总变差中由于x和和y的线性关的线性关 系而引起系而引起 y变化的部分。变化的部分。Q Q残余平方和,反

16、映所有观测点到回归直线的残残余平方和,反映所有观测点到回归直线的残 余误差,即其它因素对余误差,即其它因素对y y变差的影响。变差的影响。误差理论与数据处理第二节一元线性回归第二节一元线性回归(二)回归方程显著性检验 F检验法基本思路:方程是否显著取决于U和Q的大小,U越大,Q越小,说明y与x的线性关系愈密切。计算统计量FQUQUF/对一元线性回归,应为)2/(1/nQUF误差理论与数据处理若 回归在0.01的水平上高度显著。第二节一元线性回归第二节一元线性回归),2, 1 (01. 0nFF),2, 1 ()2, 1 (01. 005. 0nFFnF回归在0.05的水平上显著。),2, 1

17、()2, 1 (05. 010. 0nFFnF回归在0.1的水平上显著。),2, 1 (10. 0nFF回归不显著。查F分布表,根据给定的显著性水平 和已知的自由度1和n-2进行检验:误差理论与数据处理(三)残余方差与残余标准差第二节一元线性回归第二节一元线性回归残余方差:排除了x 对y的线性影响后,衡量y 随机波动的特征量。22NQ残余标准差:2NQ含义: 越小,回归直线的精度越高。误差理论与数据处理第二节一元线性回归第二节一元线性回归(四)方差分析表来源平方和自由度方差 F显著性回归残余 1 n-2 总计 n-1 2 xyblU xyyybllQyylS )2/(1/nQUF)2, 1 (

18、nF 误差理论与数据处理第二节一元线性回归第二节一元线性回归正应力x/Pa26.825.428.923.627.723.924.728.126.927.422.625.6抗剪强度y/Pa26.527.324.227.123.625.926.322.521.721.42.824.9误差理论与数据处理126.826.5718.24702.25710.2225.427.3645.16745.29693.421225.624.9655.36620.01637.44311.6297.28134.37407.87687.8第二节一元线性回归第二节一元线性回归iixiy2ix2iyiiyx误差理论与数据处理

19、第二节一元线性回归第二节一元线性回归97.256 .3111211ixnx77.242 .2971211iyny53.29121iiiixyyxyxl05.43)(12122iixxxxl误差理论与数据处理第二节一元线性回归第二节一元线性回归69. 0 xxxyllb58.420 xbybxxbby69. 058.420则当x=24.5Pa时Pay08.255 .24*69. 058.42误差理论与数据处理第二节一元线性回归第二节一元线性回归11115.47nlSsyy 方差分析15.47)(12122iyyyyli126.20UxyblU 10289.26nbllUSQQxyyy 显著性检验

20、54. 71089.2626.20QUQUF 误差理论与数据处理第二节一元线性回归第二节一元线性回归查表04.10)10, 1 (01. 0F96. 4)10, 1 (05. 0F05. 005. 0FFF则回归方程在0.05水平上显著。69. 222nQ 方差方差分析表来源平方和自由度方差 F显著性回归残余 1 10 总计 11 69. 226.20U89.26Q15.47S54. 705. 0 由于误差理论与数据处理第二节一元线性回归第二节一元线性回归分组法平均值法 将自变量按由小到大次序排列,分成个数相等或近于相 等的两个组(分组数等于未知数个数),则可建立相应的两 组观测方程:kkbx

21、bybxby0101NNkkbxbybxby0101将两组观测方程分别相加,得NktNktttktktttxbbkNyxbkby110110)(b和b0四、回归直线的简便求法四、回归直线的简便求法误差理论与数据处理第三节一元非线性回归第三节一元非线性回归2、求解未知参数。可化曲线回归为直线回归,用最小二乘法求解;可化曲线回归为多项式回归。1、确定函数类型。一、求解思路一、求解思路二、回归曲线函数类型的选取和检验二、回归曲线函数类型的选取和检验1、直接判断法2、作图观察法,与典型曲线比较,确定其属于何种类型,然后检验。误差理论与数据处理第三节一元非线性回归第三节一元非线性回归3、直线检验法(适用

22、于待求参数不多的情况)a、预选回归曲线b、c、求出几对与x,y相对应的Z1,Z2值d、以Z1,Z2为坐标作图,若为直线,则说明原选定的曲线类型是合适的,否则重新考虑。0),(bayxf0),(bayxf21BZAZ误差理论与数据处理第三节一元非线性回归第三节一元非线性回归三、化曲线回归为直线回归问题三、化曲线回归为直线回归问题 用直线检验法检验的曲线回归方程可以通过变量代换转为直线回归方程,再利用线性回归 分 析 方 法 可 求 得 相 应 的 参 数 估 计 值 。误差理论与数据处理第三节一元非线性回归第三节一元非线性回归回归曲线方程的效果与精度:NtttyyQ12)(2NQ残余平方和残余标

23、准差相关指数NtttyyQR122)(1衡量回归曲线效果好坏的指标可以作为根据回归方程预报y值的精度指标误差理论与数据处理误差理论与数据处理幂函数曲线检验:误差理论与数据处理对数曲线检验:误差理论与数据处理误差理论与数据处理误差理论与数据处理误差理论与数据处理误差理论与数据处理误差理论与数据处理误差理论与数据处理对数曲线幂函数曲线误差理论与数据处理题1:某含锡合金的熔点温度与含锡量有关,实验获得如下数据:设锡含量的数据无误差,求:熔点温度与含锡量之间的关系。预测含锡量为60%时,合金的熔点温度。误差理论与数据处理误差理论与数据处理题2:对一温度测量仪进行标定,被测温度x 由标准场提供,其误差可忽略不计。通过试验得到的被测温度x 与测温仪的输出电压y 的数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论