




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2.1 一元线性回归模型有哪些基本假定?答:1.解释变量X1 , X2,X p,是非随机变量,观测值Xi1,Xi2,,Xp是常数。2. 等方差及不相关的假定条件为EGi) =0,i =1,2,,n厂2-CT ,1 = JcovGi)(i,J =1,2,,n)0,i 工 J这个条件称为高斯-马尔柯夫(Gauss-Markov)条件,简称G-M条件。在此条 件下,便可以得到关于回归系数的最小二乘估计及误差项方差 b2估计的一些重 要性质,如回归系数的最小二乘估计是回归系数的最小方差线性无偏估计等。3.正态分布的假定条件为卜N(0,b2),i =1,2,nk,届相互独立在此条件下便可得到关于回归系数
2、的最小二乘估计及 b2估计的进一步结果,如它们分别是回归系数的最及 b2的最小方差无偏估计等,并且可以作回归的显著性检验及区间估计。4. 通常为了便于数学上的处理,还要求n P,及样本容量的个数要多于解 释变量的个数。在整个回归分析中,线性回归的统计模型最为重要。一方面是因为线性回归 的应用最广泛;另一方面是只有在回归模型为线性的假设下,才能的到比较深入和一般的结果;再就是有许多非线性的回归模型可以通过适当的转化变为线性回 归问题进行处理。因此,线性回归模型的理论和应用是本书研究的重点。1. 如何根据样本(Xi,Xi2,,Xi p;yi)(i =1,2,n)求出p及方差2的估计;2. 对回归方
3、程及回归系数的种种假设进行检验;3. 如何根据回归方程进行预测和控制,以及如何进行实际问题的结构分析。2.2考虑过原点的线性回归模型% =臥+角,i =1,2,n误差习,2,,En仍满足基本假定。求Pi的最小乘估计。n答: Q(p1)=送(yi -E(yi)2 二送(yi-陥)2i zii =innn詁%(y_M=%Xiyi+2PZnPiS X2 =0i 二nS xyi解得f?=迟,即?的最小二乘估计为网Z Xi2n送 XiYiynZ2Xii丄i 42.3证明:Q (兀,3 1)=刀(yi-卩1 Xi)2A AB BBP因为 Q (尸 0, J)=min Q (P P 而Q (0,1 )非负且
4、在A A即-2刀(y* B 0- 3i Xi)=0A A又e = % -( 30+31 Xi)=0, 1 )_2R上可导,当Q取得最小值时,卜、 A-2 刀(yi-p0-p1Xi) Xi =0A Ap x0 -1 XicQ有iF0cQ叮0Po.JXix =o,刀 eXi =0(即残差的期望为0,残差以变量X的加权平均值为零) iN(O, 2 )2.4解:参数8 0, 8 1的最小二乘估计与最大似然估计在 i=1,2 ,n的条件下等价。2 证明:因为衣 i N(0,b), =1,2,.n2所以Yi0+p1X1pN(p0+p1X庄)nZ Yi (p0 + p 几,Xi)2其最大似然函数为彳 nLn
5、L( p0, PiQ) 知(2心)-22。 i L(%,Z2)=nSE=a2)/2ex p*_P 4的最大似然估计值。Y,-(P0+Pi%,Xi)2已知使得Ln (L)最大的?0, f?就是P 0,Q=:S (Yi -Y?)Z (Yi -(?0+f?1Xi)2即使得下式最小:11因为恰好就是最小二乘估计的目标函数相同。2所以,在客iN(0Q ),1 2.n的条件下,参数P 0,8 1的最小乘估计与最大似然估计等价。2.5.证明Po是卩0的无偏估计。证明:若要证明P。是P。的无偏估计,则只需证明E( 3。)= 3。 I 反=Lxy / LXXr,宀宀卩1的最小二乘估计为疋0 = y -卩1X其中
6、Lxy =送(Xi x)(yi乞 xnx-正 yiLxx =送(Xi X)2 =2 Xi2 nX2Xi)2E( r)=E(?yiy -円X)=E( n yn-XZxjiLXX=E-X 严(PoLxx+ PiXi +幽)=E(其中-X宁冬)p0Lxx)+E(-x 宁)PiXiLxx)+E(x)Ei)LxxZ (lXXi y nLoXX応(1-xX-Xy np0(n一2 (Xi X)n Lxx i 二n送(Xi由于y-X)=0,7。pXX厂0n-X 牛一)0必 pf (生一X 牛一Xi) p1(X-T2 (Xi-X)N)Lxx一 i nLxx_Lxx iLXXX n臥XdVXT)(Xi-X)/(x
7、-x)=0又因为一元线性回归模型为”1=3。+ Sxi ri各si独立同分布,其分布为 N(0,b2)所以eL)=0所以xP。z r1E( i# nLxx) + E( U n(节仏(丄nLxx) + E( i# nLxxy (1 x= E(p0)+E(O) + i4 nXX)Ei)Lxx=P0所以*是3。的无偏估计。2.6 解:因为 nyi,AAPo=yfx,A n p严 idXi _XT-yiLxx联立式,得到-V - xx: ViLxx 。弄n 1- Xi - XVar(P0)=VarI: (x ) yj y n Lxxn 1 - Xi - XY (丄_x3) Var(yi) i T nL
8、xxn 1 一+(x y n2XiX)Lxx-Xi - X 2 -2x bnLxxn 2因为Lxx弋(xi-x)n_无(Xi -X)=0,所以AnVar(P 0)=2y1 -n2+(x)n2无i =1(xi - X)2Lxxn_艺(Xix) 2 + 2x7nLxxf21 +(X_2 =cnXL XX-+n 2:2(Xi-x)丿2(xL2 zrSST=SSE+SSRn2.7证明平方和分解公式:证明:SST = Z (yyf =Z 山-?)+ (0 -y】2i壬i nnn(?i -y f +门(yi -yi)(?i -y )+2 (yi -?i) fi丑i三irnnn=Z (:? -y 2 +2
9、(yi -yjY =SSR+SSEi#y2.8验证三种检验的关系,即验证:c % 21 + (xiX)-2cr 21 + (Xix)nLxx1nLxx222J(n-2)rSSR/1Lxx?12SSR=SSE/(n-2)SSEc?2=t2证明:(1)因为xxn -2,所以xxP LxxjsSE-2SSR(n-2) SSR(n-2)SSRSsTSSESSEsstSST-SSR SSE又因为SST,所以SSTSST(2)J(n -2)rT1 -r2得证。ssR=s (g -y)2 =送(f?0 + f?1Xi-y)2(y + f?(Xi x) V)2 =送(f?(Xi-x)2 = (?jLxxSSR
10、/1SSEZ( n-2)=t22.9 验证(2.63 )式:var() =(crL xx证明:var (e) = varvar (y.) + var (y ) -2cov (yi) + var(p +p0Xi)-2cov (yi,yXi-x)Xi-X(cr121Lxx其中:covyj,(Xi-X)=coVy.,)+ cov y j,Xi-Xyixi-X CoV y.,i=1(Xi-x)LxXyi=OOL XXXicrLxX注:各个因变量ywyn是独立的随机变量var( X +Y = var( X)+var(Y 忙 2 cov(X, Y)2.10用第9题证明0-ein-2的无偏估计量证明:En-
11、2i=1yiyin-2(e:n-2i=1n-2var(ei)1-1Jxi-x(CTL XX112=C7注:var( X )= E (x?) +E ( X 卩2.11验证rF +n -2SSE (n-2)JSSRy( n_2)所以有碌ISSE 丿证明:L SSRF =SSE .(n -2)2SSR SSR11FrSSTSSR+SSE1+(SSESsr)“(n-2)訂F+n-2以上表达式说明r 2与 F等价,但我们要分别引入这两个统计量,而不是只 引入其中一个。理由如下: r 2与 F,n都有关,且当n较小时,r较大,尤其当n趋向于2时,|r| 趋向于1,说明X与y的相关程度很高;但当n趋向于2或
12、等于2时,可能回归 方程并不能通过F的显著性检验,即可能X与y都不存在显著的线性关系。所以, 仅凭r较大并不能断定X与y之间有密切的相关关系,只有当样本量n较大时才 可以用样本相关系数r判定两变量间的相关程度的强弱。 F检验检验是否存在显著的线性关系,相关系数的显著性检验是判断回归直线与回归模型拟合的优劣,只有二者结合起来,才可以更好的回归结果的好坏。2.12如果把自变量观测值都乘以2,回归参数的最小二乘法估计 区和冈会发生 什么变化?如果把自变量观测值都加上 2,回归参数的最小二乘估计 区和氏会发 生什么变化?解:解法(一):我们知道当计的?0和?分别为Iyi = P0 +p1Xi +Ei
13、, E(yi) = P0 + Ax时,用最小二乘法估A =y-xAn兀(舌-和X-刃i-1tl当xi =2x时舟二-辛畀/ s尿一巧例一刃 牯idj.lfj Zj 有(二必+珂d1 ? = 一232珂=2a“II MI k卜a7=-Z?#=-25+讷2歹+忒m 3.1於9 一押nS (珂-初仞-刃1-1将带入得到n2-1当xr=Xi时壯 il?二-工曙二-Z(2 +吗)二 2+无i Xa卜、二-ZX二-Oi+2A)=y+2A1AI有(小” +纠将带入得到h1-刃5-刃I 乂 !-1Z(理-刃 V!.1解法(二):当 yio+PiXi+i , E(yi) = p0 + PiX时,有nnQ(Po,
14、01)=S (yi E(yi)2 =送(yi 00 01X)2i4i 4当 Xi=2Xi 时 yi = Po +2瞅 +Ei = y. + 盼 E(y; 兀+鸟必nnnQ( Po,P1)=2 (y/ -E(yi)2(y p1X Po 2臥)2 =2:(屮一 Po -眼)2i 1i 4i 4当Xi=Xj +2= p0 + P1X. +2P1 +j = yi +2优E(y;) = P 0 + fx +2(nnnp)=2 (yjEM)2 =2 (yi+2p1-Pop1Xi2p1)2 =2 (yi_Po 一 p1Xi)2i 1i 4y由最小二乘法可知,离差平方和Q(p0,Pi)=Q(p0,Pi)=Q(
15、p0,PJ时,其估计值应 当有(菇肆。即回归参数的最小二乘估计 氐和冈在自变量观测值变化时不会变。NNA2.13如果回归方程 尸ft +你 相应的相关系数r很大,贝U用它预测时,预测误差一定较小。这一结论能成立吗?对你的回答说明理由。解:这一结论不成立。因为相关系数r表示x与y线性关系的密切程度,而它接 近1的程度与数据组数有关。n越小,r越接近1。n=2时,|r|=1。因此仅凭相 关系数说明x与y?有密切关系是不正确的。只有在样本量较大时,用相关系数r判定两变量之间的相关程度才可以信服,这样预测的误差才会较小。2.14解:(1)散点图为:4&=J5-4巒1沪nr(2) x与y大致在一条直线上
16、,所以x与y大致呈线性关系。(3) 得到计算表:XY(Xi X)2(Yi -Y)2(Xi -X)(Yi -Y)Y?(Y?-Y)2(Y?-Yi)21104100206(-14) 2(-4) 221011001013(-7) 2(3) 2320000200042010027727254044004034142(-6) 2和15100和Lxx=10Lyy=600和 Lxy=70和100SSR=490SSE=110均3均20均20?1 = 土 二70, =Y _(?x =20 3咒7 = 1.XXLxx 10所以回归方程为:V?=f?0 + f?X =-4 +7X2= -w(yV)丄ssE0 n-2
17、i=1=n2E J733O 止 6.1所以, 3(5)因为红N(Po,(6件戸2)nLxx0的置信区间为进)xx2红 N(p1,m)同理,因为Lxx,所以,1的置信区间为查表知,ta/2(n-2) =to.o25(3) =3.182A所以,3 0的置信区间为(-21.21,19.21),AP1的置信区间为(0.91,13.09 )。(6)决定系数 R2 =SSR = SSR=490SST Lyy600.817(7)计算得出,方差分析表如下:方差来源平方和自由度均方F值SSR490149013.364SSE110336.667SST6004查表知,F0.05(1,3)=10.13 ,F值F0.0
18、5(1,3),故拒绝原假设,说明回归 方程显著。t = 2计算t统计量:J/Lxx查表知/,2(n-2) 0.025(3) = 3.182说明x和丫有显著的线性关系。(9)做相关系数r的显著性检验:因为RA Q-7x71021=S: 3.66/330 丁333,所以,tt0.05/2(3),所以接受原假设,所以,相关系数r 7R0.9512=空=空=49?=0.817SSTLyy600(8)做回归系数P 1的显著性检验因为查表知,n-2等于3时,a二1%勺值为0.959,=5%勺值为0.878。所以,a =5%v|r|v a =1%故x与y有显著的线性关系。(10)残差表为:G.X-DSZ K
19、-I.JDZW wIW序号xyA y残差e111064221013-33320200442027-75540346残差图为:(11)当 X0=4.2 时,、 A A其95%勺置信区间近似为 近似为y2b,即为:(17.1,39.7 )。2.15 解:(1)画散点图;图形-旧对话框-散点图,得到散点图(表 1)如下:5.0-4-Cr21.D-2501250MlftEht5MTEQlOm每極发的新保单数目贸(2)x与y之间是否大致呈线性关系? 由上面(1)散点图可以看出,x与y之间大致呈线性关系。用最小二乘估计求出回归方程;分析-回归-线性,得到“回归系数显著性检验表(表 2)如 下:Coeffi
20、cie ntsaModelUn sta ndardizedCoefficie ntsSta ndardizedCoefficie ntstBStd. ErrorBeta1(Co nsta nt).118.355.333每周签发的新保单数目x.004.000.9498.509a. Dependent Variable:每周加班工作时间y由上表可知:AP0=0.118AP1 =0.004A所以可得回归方程为:y =0.118+0.004x(4)求回归标准误差b ;分析-回归-线性,得到“方析分析表(表 3)”如下:ANOVAbModelSum of SquaresdfMean SquareFSig
21、.1Regression16.682116.68272.396.000aResidual1.8438.230Total18.5259a. P redictors: (Co nsta nt),每周签发的新保单数目xb. Dependent Variable:每周加班工作时间y由上表可得,SSE=1.843 n=10故回归标准误差为:人 2SSE 1.843(yi yi) =n-2 = 10-2=0.23AI A2CT 二 Vb =0.48(5)给出3 0与3 1的置信度为95%勺区间估计;由表2可以看出,当置信度为95%寸,AP0的预测区间为:-0.701 ,0.937P1的预测区间为:0.00
22、3,0.005(6)计算x与y的决定系数; 分析-回归-线性,得到“模型概要表(表 4)”如下:Model SummarybModelRR SquareStd. Error of theAdjusted R Square) Estimate1.949a.900.88848001a. P redictors: (Con sta nt),b. Dependent Variable:,每周签发的新保单数目x每周加班工作时间y由上表可知,x与y的决定系数为0.9,可以看到很接近于1,这就说明此 模型的拟合度很好。(7)对回归方程作方差分析;由“方差分析表(表3)”可得,F-值=72.396,我们知道,
23、当原假设H0: =0成立时,F服从自由度为(1, n-2)的F分布(见 P38),临界值 Fa( 1,n-2)=F0.05( 1,8)=5.32 因为 F-值=72.3965.32,所以拒绝原假设,说明回归方程显著,即x与y有显著的线性关系。(8)做回归系数h显著性的检验;由“回归系数显著性检验表(表2)可得,卩1的t检验统计量为t=8.509,对应p-值近似为0, pv。,说明每周签发的新报单数目x对每周加班工作时间y有显著的影响。(9)做相关系数的显著性检验;分析-相关-双变量,得到“相关分析表(表 5)”如下:Correlati ons每周签发的新 保单数目x每周加班工作 时间y每周签发
24、的新保单数目P ears onCorrelati on1.949*Sig. (2-tailed).000N1010每周加班工作时间yP ears onCorrelati on.949*1Sig. (2-tailed).000N1010*. Correlation is sig nifica nt at the 0.01 level (2-tailed).由上表可知,相关系数为0.949,说明x与y显著线性相关。 (10)对回归方程作残差图并作相应的分析;1 .Or.e- &-Q.4- .2-DO1.0Normal P-P Plot of Rcgressiorh Standardized Res
25、idualDependent Variable:每周力【田上工作汗r才间yIDIJ20 40-60.0Ob&rved Cum Probqad Enlp 吕zwdlg从上图可以看出,残差是围绕e=0随即波动的,满足模型的基本假设。(11)该公司预计下一周签发新保单xo=iooo张,需要的加班时间是多少?当 x0=1000 张时,y。=0.118+0.004 X 1000=4.118 小时。(12)给出y0的置信水平为95%勺精确预测区间和近似预测区间。(13)给出E ( y0 )置信水平为95%勺区间估计。 最后两问一起解答:在计算回归之前,把自变量新值x0输入样本数据中,因变量的相应值空缺,然
26、后在Save对话框中点选Individul和Mean计算因变量单个新值y0和因变量平均值E(y0)的置信区间。结果显示在原始数据表中,如下图所示(由于排版问题,中间部分图省略):每周讎的新1保鞘目乂每周姬工作时间yLWUMCIJLICI_1UICI_1S253.52.720513.431221.13291.238442151.0.252531.525342.16577107014.013.49364.414752.755315.1.31455012.01.683afl2.49611.9108S3.269054801.01.39U62.283533.(131859203.03.034323798692.245384.aB?b213&04.54.288023.56413G.2.1993251.5733C101.B335&.M712!2.55巾3.02158892.B814i1.35577164b712155.D13.91169.036443.2324G5715671000-I3.283734.122792.51949iaB?03y0的精确预测区间为:2.5
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年人工智能与自动化考试试卷及答案
- 2025年建筑设计师执业资格考试试卷及答案
- 2025年汉语言文学专业毕业考试试卷及答案
- 打造研究生实践育人新模式的策略及实施路径
- 初中诗词名句记忆方法
- 2021学年上海嘉定一中高一(下)期中数学试题及答案
- 晨练的故事记事类话题作文(12篇)
- 游艇活动策划方案
- 中华古诗词之美:高一语文阅读课教案
- 从课本人物中看成长写人作文8篇范文
- 2024年天翼云从业者认证考试题库(判断题)
- 2022北京朝阳区高二下学期期末英语试题和答案
- (高清版)JTGT 6420-2024 公路交通应急装备物资储备中心技术规范
- 水果采摘机器人视觉系统与机械手研究进展
- QBT 2198-1996手电筒行业标准
- SYT 0452-2021 石油天然气金属管道焊接工艺评定-PDF解密
- 外国近现代建筑史智慧树知到期末考试答案2024年
- 2024年贵州省粮食储备集团有限公司招聘笔试参考题库附带答案详解
- 《消费者行为学》期末试卷B(含答案与评分标准)
- 校园网络升级改造解决方案
- 选人用人专项检查培训课件
评论
0/150
提交评论