h多重线性回归与相关学习教案_第1页
h多重线性回归与相关学习教案_第2页
h多重线性回归与相关学习教案_第3页
h多重线性回归与相关学习教案_第4页
h多重线性回归与相关学习教案_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、会计学1h多重线性回归多重线性回归(hugu)与相关与相关第一页,共43页。第1页/共43页第二页,共43页。第2页/共43页第三页,共43页。第一节第一节多重线性回归的概念多重线性回归的概念(ginin)与统计推断与统计推断第3页/共43页第四页,共43页。上式表示数据中应变量 Y 可以近似地表示为自变量12,kXXX的线性函数。 0为常数项,12,k 为偏回归系数,表示在其它自变量保持不变时,jX增加或减少一个单位时 Y 的平均变化量,e 是去除 k 个自变量对 Y 影响后的随机误差(残差) 。 一、数据与多元线性回归一、数据与多元线性回归(hugu)模型模型ikikiiixxxY.221

2、10第4页/共43页第五页,共43页。例号 X1 X2 Xk Y 1 X11 X12 X1k Y1 2 X21 X22 X2k Y2 n Xn1 Xn2 Xnk Yn 多元回归分析(fnx)数据格式 (1)Y与12,kXXX之间具有线性关系。 (2)各例观测值)21(n ,iYi相互独立。 (3) 残差 eN (0,2) 且各自变量与应变量 Y 具有相同方差,并服从正态分布。 条件条件(tiojin)第5页/共43页第六页,共43页。车流(X1)气温(X2)气湿(X3)风速(X4)一氧化氮(Y)车流(X1)气温(X2)气湿(X3)风速(X4)一氧化氮(Y)130020.0800.450.066

3、94822.5692.000.005144423.0570.500.076144021.5792.400.01178626.5641.500.001108428.5593.000.003165223.0840.400.170184426.0731.000.140175629.5720.900.156111635.0922.800.039175430.0760.800.120165620.0831.450.059120022.5691.800.040153623.0571.500.087150021.8770.600.12096024.8671.500.039120027.0581.700.10

4、0178423.3830.900.222147627.0650.650.129149627.0650.650.145182022.0830.400.135106026.0581.830.029143628.0682.000.099143628.0682.000.099第6页/共43页第七页,共43页。一般一般(ybn)步步骤骤(1)求偏回归系数012,kb b bb 01122kkYbb Xb Xb X建立(jinl)回归方程(样本)(2)检验并评价回归方程检验并评价回归方程及各自及各自(gz)变量的作用变量的作用大小大小第7页/共43页第八页,共43页。 二、多元(du yun)线性回归方程

5、的建立样本估计而得的多重线性回归方程(fngchng)bj为自变量Xj 的偏回归系数(partial regression coefficient),是j的估计值,表示当方程(fngchng)中其他自变量保持常量时,自变量Xj变化一个计量单位,反应变量Y的平均值变化的单位数。 kkxbxbxbby.22110第8页/共43页第九页,共43页。2201122()()kkQYYYbb Xb Xb X11 11221121 1222221 122kkYkkYkkkkkkYl bl bl bll bl bl bll bl bl bl01122()kkbYb Xb Xb X求偏导数(do sh)(一阶)

6、()() , , j=1,2,k()(), 1,2,ijijiijjijjjYjjjXXlXXXXX XinXYlXXYYX Yjkn12340 14166 0 000116190 004490 000006550 03468Y.X.X.X.X 原 理最小二乘法(chngf)统计统计(tngj)软件包软件包第9页/共43页第十页,共43页。012:0kH, 1:jH各 (j=1,2, ,k)不全为 0, 0.05 1. 方差分析法:方差分析法:残回总SSSSSS/1)SSkMSFSSnkMS回回残残(一)对回归方程 ( ,1)F F k nk第10页/共43页第十一页,共43页。变异来源 自由

7、度 SS MS F P 总变异 n-1 SS总 回 归 k SS回 SS回 /k MS回/MS残 残 差 n-k-1 SS残 SS残 /(n-k-1) 多元(du yun)线性回归方差分析表(0.05)第11页/共43页第十二页,共43页。变异来源自由度SSMSFP回归模型4 40.063960.063960.015990.0159917.5917.59.0001.0001残差19190.017270.017270.000909030.00090903总变异23230.081230.08123表13-2显示,P 0.0001,拒绝H0。说明从整体(zhngt)上而言,用这四个自变量构成的回归方

8、程解释空气中NO浓度的变化是有统计学意义的。第12页/共43页第十三页,共43页。biibiSbt第13页/共43页第十四页,共43页。变量自由度回归系数标准误t值P值标准化偏回归系数截距1-0.141660.06916-2.050.05460X110.000116190.000027484.230.00050.59249X210.004490.001902.360.02890.27274X31-0.000006550.00069083-0.010.9925-0.00110X41-0.034680.01081-3.210.0046-0.44770第14页/共43页第十五页,共43页。102 R

9、,说明自变量12,kXXX能够解释Y变化的百分比,其值愈接近于 1,说明模型对数据的拟合程度愈好。 21SSSSRSSSS回残总总第三节第三节 复相关系数与偏相关系数复相关系数与偏相关系数 确定(qudng)系数、复相关系数与调整确定(qudng)系数复相关系数的平方称为确定系数(coefficient of determination), 或决定系数,记为R2,用以反映线性回归模型能在多大程度上解释(jish)反应变量Y的变异性。其定义为 第15页/共43页第十六页,共43页。复相关系数复相关系数(xsh):确定系数:确定系数(xsh)的算术平的算术平方根方根 对例13-1,由方差分析表可得

10、:SSR=0.06396 SSE=0.01727 SST=0.081237874. 008123. 001727. 0108123. 006396. 02RSSTSSRR表示变量(binling)Y与k个自变量(binling)(X1,X2,Xk)的线性相关的密切程度。说明,用包含(bohn)气车流量、气温、气湿与风速这四个自变量的回归方程可解释交通点空气NO浓度变异性的78.74%。第16页/共43页第十七页,共43页。8703. 07574. 0R表示交通点空气NO浓度与气车流量、气温、气湿与风速(fn s)等四个变量的复相关系数为0.8703 第17页/共43页第十八页,共43页。1)1

11、 (222knRkRRa7426. 004475789. 07874. 01424)7874. 01 (47874. 02aR第18页/共43页第十九页,共43页。冷饮销售量(元)X1游泳人数(人)X2气温 (oC)X32672677227222929397397814814303045145192492431315285281066106632326186181253125333336556551369136934346906901593159335357407401761176136367807801931193137378898892231223138389969962749274939

12、39第19页/共43页第二十页,共43页。第20页/共43页第二十一页,共43页。表13-5 空气(kngq)中NO浓度与各自变量的相关系数和偏相关系数自变量相关系数偏相关系数偏相关系数P值车流X10.808000.808000.696200.696200.00050.0005气温X20.017240.017240.476700.476700.02890.0289气湿X30.278540.27854-0.00218-0.002180.99250.9925风速X4-0.67957-0.67957-0.59275-0.592750.00460.0046第21页/共43页第二十二页,共43页。汽车流

13、量(X1)4002000-200-400-600一氧化氮浓度(Y).2.10.0-.1气温(一氧化氮浓度()气 湿 ()一氧化氮浓度()风速(X4)1.51.0.50.0-.5-1.0一氧化氮浓度(Y).10.08.06.04.020.00-.02-.04-.06-.08第22页/共43页第二十三页,共43页。(二)对各自变量 指明方程(fngchng)中的每一个自变量对Y的影响(即方差分析和决定系数检验整体)。含义 回归方程中某一自变量jX的偏回归平方和表示模型中含有其它 k-1 个自变量的条件下该自变量对 Y 的回归贡献, 相当于从回归方程中剔除jX后所引起的回归平方和的减少量,或在 k-

14、1 个自变量的基础上新增加jX引起的回归平方和的增加量。 1. 偏回归(hugu)平方和 第23页/共43页第二十四页,共43页。)(jXSS回表示偏回归平方和,其值愈大说明相应的自变量愈重要。 ()/1/(1)jjSSXFSSnk回残一般情况下, k-1 个自变量对 Y 的回归平方和由重新建立的新方程得到,而不是简单地把jjXb从有 k 个自变量的方程中剔出后算得。 12 1, 1nk第24页/共43页第二十五页,共43页。平方和(变异) 回归方程中 包含的自变量 SS回 SS残 4321X,X,X,X 133.7107 88.8412 432X,X,X 133.0978 89.4540 4

15、31XX,X 121.7480 100.8038 421XX,X 113.6472 108.9047 321XX,X 105.9168 116.6351 各自变量的偏回归平方和可以通过拟合包含不同自变量的回归方程计算(j sun)得到第25页/共43页第二十六页,共43页。 11234234()(,)(,) 133.7107-133.0978=0.6129SSXSSXXXXSSX XX回回回 21234134()(,)(,) 133.7107-121.748011.9627SSXSSXXXXSSX XX回回回 31234124()(,)(,) 133.7107-113.647220.0635S

16、SXSSXXXXSSX XX回回回 41234123()(,)(,) 133.7107-105.916827.7939SSXSSXXXXSSX XX回回回 152. 0) 1427( /8412.881 /6129. 01F, 962. 2) 1427/(8412.881/9627.112F 968. 4) 1427/(8412.881/0635.203F , 883. 6) 1427/(8412.881/7939.274F 结结果果第26页/共43页第二十七页,共43页。2. t 检验(jinyn)法 是一种与偏回归平方和检验(jinyn)完全等价的一种方法。计算公式为jbjjSbt检验假设

17、: H0:0j,jt服从自由度为1nk的 t 分布。如果/2,1|jn ktt ,则在(0.05)水平上拒绝 H0,接受 H1,说明jX与Y有线性回归关系。 jb为偏回归系数的估计值,jbS是jb的标准误。 第27页/共43页第二十八页,共43页。结结论论P 值均小于 0.05,说明3b和4b有统计学意义, 而1b和2b则没有统计学意义。 第28页/共43页第二十九页,共43页。()jjjjXXXS 计算得到(d do)的回归方程称作标准化回归方程,相应的回归系数即为标准化回归系数。 YjjYYjjjjSSbllbb标准化回归系数没有单位,可以用来比较各个自变量jX对Y的影响强度,通常在有统计

18、学意义的前提下,标准化回归系数的绝对值愈大说明相应自变量对 Y 的作用愈大。 第29页/共43页第三十页,共43页。jXjbjXYjbjXY第30页/共43页第三十一页,共43页。目的:使得预报目的:使得预报(ybo)和(或)解释效果好和(或)解释效果好第31页/共43页第三十二页,共43页。SSTSSER121pnSSEMSEnqSSECqp22第32页/共43页第三十三页,共43页。全局(qunj)择优法目的(md):预报效果好意义:对自变量各种不同的组合所建立 的回归方程进行比较 择优。选择方法:1 校正决定系数2cR选择法 2pC选择法 第33页/共43页第三十四页,共43页。1调整决

19、定系数2aR选择法,其计算公式为 2211 (1)11aMSnRRnpMS 残总 n 为样本含量,2R为包含)(mpp个自变量的回归方程的决定系数。2aR的变化规律是:当2R相同时,自变量个数越多2aR越小。所谓“最优”回归方程是指2aR最大者。 第34页/共43页第三十五页,共43页。2. pC选择法 )1(2)()(pnMSSSCmpp残残 pSS)(残是由)(mpp个自变量作回归 的误差平方和,mMS)(残是从全部 m 个自 变量的回归模型中得到的残差均方。 当由 p 个自变量拟合的方程理论上为最优时,pC的期望值是 p+1,因此应选择pC最接近 p+1 的回归方程为最优方程。 如果全部自变量中没有包含对 Y有主要作用的变量,则不宜用pC方法选择自变量。 第35页/共43页第三十六页,共43页。逐步(zhb)选择法1. 1.前进法,回归方程中的自变量从无到有、从少到多逐个引入回归方程。这种选择自变量的方法基于残差均方缩小的准则,不一定能保证“最优” . 此法已基本淘汰。 2. 后退法,先将全部自变量选入方程,然后逐步剔除无统计学意义的自变量。 剔除自变量的方法是在方程中选一个偏回归平方和最小的变量,作F检验决定它是否剔除,若无统计学意义则将其剔除,然后对剩余的自变量建立新

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论