下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2.1一元线性回归模型有哪些基本假定?答:1.解释变量XX2,上Xp,是非随机变量,观测值Xi!,Xi2,上,Xp是常数。2. 等方差及不相关的假定条件为日叨=0,i =1,2,A ,nk2,i = jcov(ij) h(i, j =1,2A , n)0,i幻这个条件称为高斯-马尔柯夫(Gauss-Markov)条件,简称G-M条件。在此条 件下,便可以得到关于回归系数的最小二乘估计及误差项方差 二2估计的一些重 要性质,如回归系数的最小二乘估计是回归系数的最小方差线性无偏估计等。3. 正态分布的假定条件为厂2(N(0卫),i=1,2A,n3, %,A , %相互独立在此条件下便可得到关于回归
2、系数的最小二乘估计及-2估计的进一步结果,如它们分别是回归系数的最及 匚2的最小方差无偏估计等,并且可以作回归的显著性检验及区间估计。4. 通常为了便于数学上的处理,还要求n p,及样本容量的个数要多于解 释变量的个数。在整个回归分析中,线性回归的统计模型最为重要。一方面是因为线性回归的应用最广泛;另一方面是只有在回归模型为线性的假设下,才能的到比较深入和一般的结果;再就是有许多非线性的回归模型可以通过适当的转化变为线性回 归问题进行处理。因此,线性回归模型的理论和应用是本书研究的重点。1. 如何根据样本(Xi,xi2,上,xip; yj(i =1,2,上,n)求出:0, “ :2,上厂p及方
3、差匚2的估计;2. 对回归方程及回归系数的种种假设进行检验;3. 如何根据回归方程进行预测和控制,以及如何进行实际问题的结构分析。2.2考虑过原点的线性回归模型% =1氷 ;i, i =1,2,n误差;!,;2,上,;n仍满足基本假定。求的最小二 乘估计。nn答:Q( 1)八( -E(yJ)2 八-讥)2i =1i =i.:Q一(y - -iXi)Xii丄xyi 2 '-a x2i di Jn=0,即 v Xi yii 4n'Xiyii 4n、Xi2i丄n送xw解得,即!?的最小二乘估计为f?2i 4I-l.:.y2.3 证明:Q ( ' 0 ,1)=刀(yi-0-1
4、Xi )2fBP因为 Q (0,1)=min Q (0,1 )-Q:?2:Q而Q ( o,1 )非负且在R上可导,当Q取得最小值时,有0A AA呱即-2 刀(yi- 0- 1 Xi )=0-2刀(yi - : 0- 1 Xi) Xi =0A Aa A又e = yi -( °0+°1 x )= yi - B 0 -卩1 Xi.” e =o,刀 e x =0(即残差的期望为0,残差以变量X的加权平均值为零)2.4解:参数B 0,B 1的最小二乘估计与最大似然估计在&iN(0,2 )i=1,2,n的条件下等价。2 .证明:因为;i N(* ),i "2.
5、6;2 所以Yi 八 01X1N(: 01X1,1) 其最大似然函数为nL(:0, r卢2)=二:/i(Yi) =(2=2)/2exp-2' M -(:0 T0,X2Ln山札戸®2)=才1 n( 2心2)-1 n2、 1 、2 J2-id22 imYi -( r 0,Xi)2已知使得Ln (L)最大的氏,翼就是B , P的最大似然估计值。0 1nnQ=E (Yi -YV =迟(Y 偲 +%Xi)2即使得下式最小:11因为恰好就是最小二乘估计的目标函数相同。2所以,在;iN(0f ),i胡,2,.n的条件下,参数b 0,b 1的最小二乘估计与最大似然估计等价2.5.证明:0是:
6、0的无偏估计。证明:若要证明:0是:0的无偏估计,则只需证明E( :0)= :0。X-M = Lxy / Lxx因为:0,:1的最小二乘估计为y 一 -x其中Lxy八(Xi -x)(yi y)二為 Xiyi nxy 二為 Xi yiXi 二 yinLxx八(Xi X)2 二亠 Xi22-nx=112XiXi)2E( 0)=E(一 ?x %y 一 ?-X ) = E(门 i 4-X'Xj -x yi )=E y n-x£)yiLxx=E_ XjXxLxx-L-XiJ=E(其中(-i生n_ Xi -XxLxx)+E( v(丄一 X) -XiLxx)+E( v n(吕Lxx)Xi
7、_X) '0Lxx(丄-x”) ,(n-n LnLxx产、(Xi X)Lxx iT迟(Xi由于y-X)=0,所以 7 n Lxx = 0Lxx-XXi)'-( (Xi -X)Xi)Lxx i 吕Lxx:i(XLxx i d(Xi-X)(Xi-X) 一 _)=1(X - x) =0yi ='o-Xi;又因为一元线性回归模型为各r独立同分布,其分布为 N(0f2)所以E(;i)=0所以LXX、.(卡XX):-XiX3):0=e( e(o) -4(n_xLxx-'o所以:o是:o的无偏估计。八* yi2.6解:因为 n v,育yx,y Lxx yi联立式,得到1 y
8、x八(x nL )y1i - XVar(:)二Var( x 0y n'xx)yn 1 Xi - X八(X*)Var(yi)i 胡 n Lxxn=xA &xL)LxxnLxx因为Lxx±(Xi-X),沙十。xxi生,所以1 叽。)监(X)2y(XiX)2x'(X x)i=1LxxnLxx21 (X)_ n Lxx2(Xi x)丿(X)2.7证明平方和分解公式:SST=SSE+SSR一nn证明:sst=e(yyf =x (%-?)+(? -y2i =1i dnnn八?i -y 2 2、yi -?i)(?i -y ' yi -?)2i 1i di dnn八
9、V-、2、yi _?) 2 =SSR SSEi =1i =12.8验证三种检验的关系,即验证:(1) (n- 2)rtJ -r2;7(2)SSR/1Lxx 弭2SSE/(n»SSR 二:证明:(1)因为Lxx 和二SSEn -2,所以(n - 2)SSR(n-2)SSRssTSSEn-2SSESSESST2又因为rSSRSST,所以1 _rSST - SSR SSE(n -2)rSSTSST故(2)/-r2得证。SSR八(y?. -y)i吕n(彳?Xji生-y)2 八-x)-y)2n=送(f?(Xi _x)2 =l?2Lxxi 4l SSR/1F =SSE/(n -2)2.9 验证(
10、2.63 )r式:var (e)=仁丄.xi-xnL xx证明:var (e) = var(y.-y.)= var (y.) - var (y.)-2cov (y.,y.)A.var (y.)var (0 °+A.p x.)1 x.-2cov (y.,y +- -2- 2a沁21 +(Xi-X)2b 21 + (xr x)nLxxInLxx1(Xi-x)-丄nLxx-02其中: covye Xix12= cov y j ,y covyi,(Xi-X)1 丿= cov(Xi-X)yi yiXX1 n ) -y,' y- x covin v i i22 xr x 2 十CJL x
11、x一 2、+ *i-X)nLxx注:各个因变量yi, y2 y是独立的随机变量var(X Y)二 var(X) var(Y)_2cov(X,Y)2.10用第9题证明A2CJ2'巳曰n-2 是二2的无偏估计量证明:E(Jn z n - 2 i =1Eyyi丄Jn - 2 i =1丄Jn - 2 i =1var ein-2 id2送1-幺二xlCTn Lxx(n - 2 b n-22=ff注:var(X)= E(x2)E(X )2 _ F2.11 验证 r F n 2证明:SSRF 二 SSE(n -2)SSE_ (n-2)二 *(n_2)所以有 SSL FSSE2_SSR_ SSR _1
12、_1_ Fr 二苛二 SSR SSE = 1 SSE .(n-2)= F n-2/SSR i J /f 丿以上表达式说明r 2与 F等价,但我们要分别引入这两个统计量,而不是只 引入其中一个。理由如下: r 2与 F,n都有关,且当n较小时,r较大,尤其当n趋向于2时,|r| 趋向于1,说明x与y的相关程度很高;但当n趋向于2或等于2时,可能回归 方程并不能通过F的显著性检验,即可能x与y都不存在显著的线性关系。所以, 仅凭r较大并不能断定x与y之间有密切的相关关系,只有当样本量n较大时才 可以用样本相关系数r判定两变量间的相关程度的强弱。 F检验检验是否存在显著的线性关系,相关系数的显著性检
13、验是判断回归直线与回归模型拟合的优劣,只有二者结合起来,才可以更好的回归结果的好坏。2.12如果把自变量观测值都乘以2,回归参数的最小二乘法估计 氏和冈会发生 什么变化?如果把自变量观测值都加上 2,回归参数的最小二乘估计 区和氏会发 生什么变化?解:解法(一):我们知道当一必;i,E(yi)=时,用最小二乘法估1邑s刃-i-iA =山计的?和?分别为U当x: = 2xi时有错误!未找到引用源壬二一232丙=2x科1-1尹=丄士丈壬5+兀点)=戸+死直 « i-L冲 i-l将带入得到炉y稲n£(年刃5刃2-1-窃i-1当Xj =2 Xj时 源。輕 2-1错误!未找到引用有错
14、误!未找到引用源。 错误!未找到引用源 将带入得到隽=y-An另(阳-耳3 -刃 U1另(獰-初3-1解法(二):当%=札+咕+遇,E(yJ=Po+0iX时,有nnQ(氏,片)二(y -E(yJ)2 =迟札眼)2i=1i =1当 x=2Xi 时 yi = :0 2 :iXj ;i 二 yi ix E(y)= :o,2 ixinnnQ(B°,跆二迟(y-E(yy (yi+RiXi02毗=迟(y九 _Bix)2ii 4i当 Xi"=Xi +2y= Bo +加 +2當 +Bi = yi +21E(y;) = + 盼 +2为当nnnQ( , J 八 A -E(yJ)2 八(yi 2
15、 r-一:。-一:必 - 2 J 八卜。_非)2i Ai Airh由最小二乘法可知,离差平方和Q( :0 , :1)=Q( :0 , :1) =Q( :0, :1)时,其估计值应 当有错误!未找到引用源。即回归参数的最小二乘估计 氐和网在自变量观测值变化时不会变。2.13如果回归方程错误!未找到引用源。相应的相关系数r很大,则用它预测时, 预测误差一定较小。这一结论能成立吗?对你的回答说明理由。解:这一结论不成立。因为相关系数 r表示x与错误!未找到引用源。线性关系 的密切程度,而它接近1的程度与数据组数有关。n越小,r越接近1。n=2时, |r|=1。因此仅凭相关系数说明x与?有密切关系是不
16、正确的。只有在样本量较 大时,用相关系数r判定两变量之间的相关程度才可以信服, 这样预测的误差才 会较小。2.14解:(1)散点图为:(2) x与y大致在一条直线上,所以x与y大致呈线性关系(3)得:到计算表:XY2(Xi -X)2(Yi -Y)(Xi -X)(Yi -Y)Y?&-Y)2(Y?-Yi)21104100206(-14)2(-4)2210Ifl-1aa1001013(-7)2(3)2320000200042010027727254044004034142(-6) 2和15100和Lxx=10Lyy=600和 Lxy=70和100SSR=490SSE=110均3均20均201
17、 n 2磴 Wn2sse 二空3所以回归方程为:W = %十国X = -1 + 7X A2CF(4)J、330 6.1所以, 3时:N(00,+学声2)0的置信区间为匕(x2;7丹k 21 : N(_1,)xx同理,因为Lxx,所以,查表知,GL辭給磁(班3陆AP1的置信区间为=20-3 7 - -1.xx0(5) 因为n LxxAA.所以,卩0的置信区间为(-21.21,19.21 ),卩1的置信区间为(0.91,13.09 )。2 SSR SSR 490(6) 决疋系数R20.817SST Lyy 600(7) 计算得出,方差分析表如下:方差来源平方和自由度均方F值SSR490149013
18、.364SSE110336.667SST6004查表知,F0.05(1,3)=10.13 , F值>F0.05(1,3),故拒绝原假设,说明回归 方程显著。1的显著性检验(8) 做回归系数B计算t统计量:查表知,n -2)说明x和Y有显著的线性关系(9)做相关系数r的显著性检验:因为:2所以,相关系数R : 0.951=鮎曲=3.182。1匚7帀213.66 £/330 履3所以,t>t0.05/2(3),所以接受原假设,只2严Si?SST Lyy 600因为查表知,n-2等于3时 =1%勺值为0.959 =5%勺值为0.878。所以,a =5%v|r|v 口 =故x与y
19、有显著的线性关系。(10) 残差表为:序号xyA y残差e111064221013-33320200442027-75540346残差图为:(11) 当 X0=4.2 时苦A A其95%勺置信区间可近似为 近似为y±2口,即为:(17.1,392.15 解:(1) 画散点图;散点图,得到散点图(表 1)如下:图形一旧对话框-fi X-7 5C-I1(2) x与y之间是否大致呈线性关系? 由上面(1)散点图可以看出,x与y之间大致呈线性关系。用最小二乘估计求出回归方程;分析一回归一线性,得到“回归系数显著性检验表(表 2)如 下:Coefficie ntsaModelUn sta nd
20、ardized Coefficie ntsSta ndardizedCoefficie ntstBStd. ErrorBeta1(Co nsta nt).118.355.333每周签发的新保单数目x.004.000.9498.509a. Dependent Variable:每周加班工作时间y由上表可知:AAnJWulETii喘1.D-0=0.1181=0.004所以可得回归方程为:y =0.118+0.004x(4)求回归标准误差二;分析一回归一线性,得到“方析分析表(表 3)”如下:ANOVAbModelSum ofSquaresdfMean SquareFSig.1Regressi on
21、16.682116.68272.396.000aResidual1.8438.230Total18.5259a. Predictors: (Co nsta nt),每周签发的新保单数目xb. Dependent Variable:每周加班工作时间y2=n -2v(yLyi)SSE 1.843=n - 2 =10 -2 =0.23=0.48由上表可得,SSE=1.843 n=10故回归标准误差为:P P(5)给出0与1的置信度为95%勺区间估计; 由表2可以看出,当置信度为95%寸,AP0的预测区间为:-0.701 , 0.937 1的预测区间为:0.003 , 0.005(6)计算x与y的决定
22、系数;分析一回归一线性,得到“模型概要表(表 4)”如下:Model SummarybModelRR SquareAdjusted R SquareStd. Error of theEstimate1.949a.900.888.4800a. Predictors: (Co nsta nt),每周签发的新保单数目xb. Dependent Variable:每周加班工作时间y由上表可知,x与y的决定系数为0.9,可以看到很接近于1,这就说明此 模型的拟合度很好。(7)对回归方程作方差分析;由“方差分析表(表3)”可得,F-值=72.396,, B我们知道,当原假设H0: 1=0成立时,F服从自由
23、度为(1, n-2)的F分布(见 P38 ),临界值 Fa ( 1,n-2) =F0.05 (1,8) =5.32因为 F-值=72.396>5.32 ,所以拒绝原假设,说明回归方程显著,即x与y有显著的线性关系。(8)做回归系数:1显著性的检验;由“回归系数显著性检验表(表 2)”可得,A1的t检验统计量为t=8.509,对应p-值近似为0, pc, 说明每周签发的新报单数目x对每周加班工作时间y有显著的影响(9)做相关系数的显著性检验;分析一相关一双变量,得到“相关分析表(表 5)”如下:Correlati ons每周签发的新保单数目x每周加班工作 时间y每周签发的新保单数目xPea
24、rs onCorrelati on1.949*Sig. (2-tailed).000N1010每周加班工作时间yPears onCorrelati on.949*1Sig. (2-tailed).000N1010*. Correlation is significant at the 0.01 level (2-tailed).由上表可知,相关系数为0.949,说明x与y显著线性相关。 (10)对回归方程作残差图并作相应的分析;Normal P-P 尸lot of Regression Standardized ResidualDependent Variable:毎周加闵士-r1 作时问*U
25、.U0.2CJ.4口用.日1 .OObs rved Cu m ProbqEd E30 pfiMdlll从上图可以看出,残差是围绕e=0随即波动的,满足模型的基本假设。(11) 该公司预计下一周签发新保单 xo=iooo张,需要的加班时间是多少?当 x0=1000 张时,yo =0.118+0.004 X 1000=4.118 小时。(12) 给出y0的置信水平为95%勺精确预测区间和近似预测区间。(13) 给出E ( y0 )置信水平为95%勺区间估计。最后两问一起解答:在计算回归之前,把自变量新值x0输入样本数据中,因变量的相应值空 缺,然后在Save对话框中点选Individul 和Mean计算因变量单个新值y。和因 变量平均值E( y0)的置信区间。结果显示在原始数据表中,如下图所示(由于排版问题,中间部分图省略):y°的精确预测区间为:2.519 , 4.887E ( y° )的区间估计为:3.284, 4.123而y°的近似预测区间则根据y°-2二手动计算,结
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 人教版八年级物理上册《2.3声的利用》同步测试题及答案
- 教科版小学科学复习资料(3-6年级)
- 高一化学成长训练:第二单元微粒之间的相互作用力
- 2024高中地理第二章自然环境中的物质运动和能量交换4水循环和洋流学案湘教版必修1
- 2024高中语文第三单元因声求气吟咏诗韵虞美人训练含解析新人教版选修中国古代诗歌散文欣赏
- 2024高考地理一轮复习第二部分人文地理-重在运用第五章交通运输布局及其影响第24讲交通运输方式和布局学案新人教版
- 2024高考地理一轮复习专练75欧洲西部地区含解析新人教版
- 2025高考数学考点剖析精创专题卷二-函数与导数【含答案】
- 运动会入场词
- 物流运营管理与外包合作合同范例
- 2024-2025学年成都高新区七上数学期末考试试卷【含答案】
- 定额〔2025〕1号文-关于发布2018版电力建设工程概预算定额2024年度价格水平调整的通知
- 2025年浙江杭州市西湖区专职社区招聘85人历年高频重点提升(共500题)附带答案详解
- 《数学广角-优化》说课稿-2024-2025学年四年级上册数学人教版
- “懂你”(原题+解题+范文+话题+技巧+阅读类素材)-2025年中考语文一轮复习之写作
- 2025年景观照明项目可行性分析报告
- 2025年江苏南京地铁集团招聘笔试参考题库含答案解析
- 2025年度爱读书学长参与的读书项目投资合同
- 一种基于STM32的智能门锁系统的设计-毕业论文
- 华为经营管理-华为经营管理华为的IPD(6版)
- 小学四年级奥数教程30讲(经典讲解)
评论
0/150
提交评论