版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、多元线性回归多元线性回归模型 (multiple linear regression model)一个因变量与两个及两个以上自变量的回归描述因变量 y 如何依赖于自变量 x1 , x2 , xp 和误差项 的方程,称为多元回归模型涉及 p 个自变量的多元回归模型可表示为 b0 ,b1,b2 ,bp是参数 是被称为误差项的随机变量 y 是x1,,x2 , ,xp 的线性函数加上误差项 包含在y里面但不能被p个自变量的线性关系所解释的变异性多元线性回归模型(基本假定) 1. 解释变量x1,x2,xp是确定性变量不是随机变量,且要求样本容量的个数应大于解释变量的个数。2. 误差项是一个期望值为0的随
2、机变量,即E()=03. 对于自变量x1,x2,xp的所有值,的方差 2都相同4.误差项是一个服从正态分布的随机变量,即N(0,2),且相互独立多元线性回归方程 (multiple linear regression equation)描述因变量 y 的平均值或期望值如何依赖于自变量 x1, x2 ,xp的方程多元线性回归方程的形式为 E( y ) = 0+ 1 x1 + 2 x2 + k xp b1,b2,bp称为偏回归系数 bi 表示假定其他变量不变,当 xi 每变动一个单位时,y 的平均变动值二元线性回归方程1. 表示 保持不变时, 每变动一个单位时的相应变化量.2. 表示 保持不变时,
3、 每变动一个单位时的相应变化量.考虑二元线性回归模型二元线性回归方程的直观解释二元线性回归模型(观察到的y)回归面0ix1yx2(x1,x2)回归参数的估计估计的多元线性回归的方程(estimated multiple linear regression equation) 是 估计值 是 y 的估计值用样本统计量 估计回归方程中的 参数 时得到的方程由最小二乘法求得一般形式为参数的最小二乘法求解各回归参数的标准方程如下使因变量的观察值与估计值之间的离差平方和达到最小来求得 。即参数的最小二乘法(例题分析)例1 生产总值是衡量一个国家地区经济发展的重要指标,影响一个国家或地区生产总值的因素包括
4、资本、资源、科技、劳动力、进出口、国家基础设施建设等方面的因素。本例研究财政支出对生产总值的影响。 中国统计年鉴把财政支出划分为31个组成部分,本例只选取其中的13个重要支出项。回归系数表用spss软件计算的回归系数如下:参数的最小二乘法 需要注意的是,这一回归方程并不理想,回归系数的意义不好解释,这里只是作为多元线性回归参数估计的一例,后边我们还要进一步完善这一模型的建立线性回归方程的某些注意点1 样本决定系数2 估计标准误差一、多重样本决定系数(multiple coefficient of determination) 对多元回归,总方差同样可分解成如下形式则决定系数为(12.6)(12
5、.7) 多重决定系数反映样本回归方程的拟合好坏程度,R 愈大,说明样本回归方程拟合得愈好。显然, . 而称 y 关于 的样本复相关系数,R 的大小可以反映作为一个整体的与 y 的线性相关的密切程度.修正多重决定系数(adjusted multiple coefficient of determination) 由于样本多重判定系数的分母 SST 对给定的样本数据是不变的,而 SSR 与引进回归方程的自变量个数有关.因此,应对 R 作调整,调整的样本多重判定系数为(12.8)估计标准误差 Sy对误差项的标准差 的一个估计值衡量多元回归方程的拟合优度计算公式为回归方程显著性检验线性关系检验(回归方
6、程显著性检验)检验因变量与所有自变量之间的线性关系是否显著也被称为总体的显著性检验检验方法是将回归均方(MSR)同残差均方(MSE)加以比较,应用 F 检验来分析二者之间的差别是否显著如果是显著的,因变量与自变量之间存在线性关系如果不显著,因变量与自变量之间不存在线性关系线性关系检验提出假设H0:12p=0 线性关系不显著H1:1,2, p至少有一个不等于02. 计算检验统计量F确定显著性水平和分子自由度p、分母自由度n-p-1找出临界值F 4. 作出决策:若FF ,拒绝H0方差分析表前面的这些计算结果可以列成表格的形式,称为方差分析表. 方差分析表方差来源平方和自由度方差F 值回归SSRpS
7、SR / p残差SSEn - p - 1SSE /(n - p - 1)总和SSTn - 1表中的Sig即为显著性P值,由P值0.000(近似值)可知回归方程十分显著。即可以以99.9以上的概率断言所有自变量全体对因变量产生显著线性影响。对例1回归方程的检验:回归系数显著性检验线性关系检验通过后,对各个回归系数有选择地进行一次或多次检验对每一个自变量都要单独进行检验应用 t 检验统计量回归系数的检验(步骤)提出假设H0: bi = 0 (自变量 xi 与 因变量 y 没有线性关系) H1: bi 0 (自变量 xi 与 因变量 y有线性关系) 计算检验的统计量 t 确定显著性水平,并进行决策
8、tt,拒绝H0; tregression-linear(2)选择一个变量为因变量进入dependent框(3)选择一个或多个变量为自变量进入independent框(4)选择多元回归分析的自变量筛选方法:enter:所选变量全部进入回归方程(默认方法)remove:从回归方程中剔除变量stepwise:逐步筛选;backward:向后筛选;forward:向前筛选(5)对样本进行筛选(selection variable)利用满足一定条件的样本数据进行回归分析(6)指定作图时各数据点的标志变量(case labels)多元线性回归分析操作(二) statistics选项(1)基本统计量输出Pa
9、rt and partial correlation:与Y的简单相关、偏相关和部分相关R square change:每个自变量进入方程后R2及F值的变化量Collinearity dignostics:共线性诊断.非线性回归 水文研究中X和Y的数量关系常常不是线性的,如洪峰流量与流域面积之间。如果用线性描述将丢失大量信息,甚至得出错误结论。这时可以用曲线估计(Curve estimation)或非线性回归(Nonlinear regression) 方法分析。 本部分仅就一元非线性回归问题,讨论其参数估计。1,线性化方法2,直接最小二乘法3,二步法一元非线性回归方程参数估计的常用方法:线性化
10、方法1,最简单最常用的方法2,通过对变量作适当变换,将原变量的非线性关 系转化为新变量的线性关系,建立起线性回归方程,然后再还原为原变量,这样建立曲线回归方程的方法称为线性化法。3,首先,要确定非线性函数的类型,然后再考虑能否通过变量变换的方法使之线性化。4,如何确定非线性函数的类型? 专业知识和经验 数学方法:散点图一、非线性模型的线性化 下面列出一些常用的非线性函数的线性化变换,如果实测数据的散点图大致围绕下列的某一曲线散布,就可采用与之相应的变换,使其转化为线性问题。双曲线型指数曲线型幂函数型对数曲线型S曲线型 绘制散点图,根据图形和专业知识选取曲线类型(可同时选取几类)按曲线类型,作曲
11、线直线化变换建立直线化的直线回归方程;作假设检验,计算决定系数将变量还原,写出用原变量表达的曲线方程比较决定系数选取“最佳”曲线方程 曲线直线化估计的步骤利用线性回归拟合曲线例 上海医科大学微生物学教研室以已知浓度X的免疫球蛋白A(IgA, g/ml)作火箭电泳, 测得火箭高度Y(mm)如表所示。试拟合Y关于X的非线性回归方程。 X Y XlnX (lnX)2 Y2 (lnX)Y 残差平方 0.2 7.6 -1.6094 0.4 12.3 -0.9163 0.6 15.7 -0.5108 0.8 18.2 -0.2231 1.0 18.7 0 1.2 21.4 0.1823 1.4 22.6
12、0.3365 1.6 23.8 0.4700合计140.3 -2.2708 2.5902 57.76 -12.2314 0.8396 151.29 -11.2705 0.2609 246.49 -8.0196 0.0498 331.24 -4.0604 0.0000 349.69 0.0000 0.0332 457.96 3.9012 0.1132 510.76 7.6049 0.2209 566.44 11.1860 4.1078 2671.63 -12.8898 7.23 12.62 15.77 18.01 19.75 21.16 22.36 23.40 0.1380 0.1017 0.0
13、053 0.0361 1.0921 0.0563 0.0566 0.1597 1.6458(一)绘制散点图,决定曲线类型(对数曲线)(二)曲线直线化变换 =a+blnX (三)建立线性回归方程 回归方程为: =19.7451+7.7771lnX方差分析有统计学意义,P0.0000,F763.50,表明回归方程有意义。确定系数为0.99,表明回归拟合原资料很好。直接最小二乘法类似于建立线性回归方程的方法,根据x,y的原始观测资料,依据最小二乘法原理,直接寻求方程中未知参数的最小二乘估计。对于非线性回归,由于回归方程是非线性函数,其正规方程组一般是超越方程(非代数方程),不能用代数方法求解,只能用
14、数值解法,迭代计算出其近似解。用线性回归拟合曲线(例2)表 25名重伤病人的住院天数X与预后指数Y编号123456789101112131415X257101419263134384552536065Y54504537352520161813811846(一)绘制散点图,决定曲线类型指数曲线(二)曲线直线化变换(三)建立线性回归方程 回归方程为: 4.037-0.038X方差分析有统计学意义,P0.0000,F276.38,表明回归方程有贡献。确定系数为0.9551,表明回归拟合原资料较好。转换为原方程的另一种形式: 比较两个回归方程可见,对同一份样本采用不同估计方法得到的结果并不相同。主要因为曲线直线化以后的回归只对变换后的Y*( lnY)负责, 得到的线性方程可使Y*与其估计值 之间的残差平方和最小,并不保证原变量Y与其估计值 之间的残差平方和也是最小。曲线直线化 非线性最小二乘法二步法1,线性化方法与直接最小二乘法是建立曲线回归方程的基本方法。2,线性化方法:优点:计算方便缺点:误差较大。只能保证对变换后的回归方程满足总误差平方和最小,而不能保证还原后的回归方程的误差平方和最小。3,直接最小二乘法
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 生活垃圾焚烧发电项目冬期专项施工方案
- 企业法人变更说明
- 2024-2025学年山东省潍坊市昌乐县统编版五年级上册期中考试道德与法治试卷(无答案)
- 珠宝行业保理业务规范
- 商业综合体单元门安装协议
- 矿产资源电梯租赁协议范本
- 水利工程现场管理指南
- 建筑工程授权合同范本
- 豆制品加工场地租赁合同
- 通信工程HSE施工安全协议
- 公司博士后工作站年度工作总结
- 技工院校电子商务专业人才培养方案
- 五年级上学期家长会课件
- 《旅游线路设计》课程大纲
- 询比采购文件模板
- 培训学习确认单样板
- 二年级安全教育课件
- 铜梁区自然灾害类风险评估等级表
- 99S203 消防水泵接合器安装图集
- 幼儿园大班科学领域《种子的旅行》课件
- 标准田字格带拼音模板空白A4直接打印
评论
0/150
提交评论