版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
应用回归分析试题(一)1、对于一元线性回归y.=B0+B/i+£i(i=1,2,…,n),EGi)=0,var(£i)=o2,cov(£i,£j)=0(i丰j),下列说法错误的是gA(A),的最小二乘估计Po,P1都是无偏估计;(B),的最小二乘估计P,P对,,。。。,是线性的;01(C),的最小二乘估计P0,P1之间是相关的;(D)若误差服从正态分布,,的最小二乘估计和极大似然估计是不一样的.2、在回归分析中若诊断出异方差,常通过方差稳定化变化对因变量进行变换.如果误差方差与因变量的期望成正比,则可通过下列哪种变换将方差常数化1(A)-;(B)yy;(C)ln(y+1);(D)lny。3、下列说法错误的是(A)强影响点不一定是异常值;(B)在多元回归中,回归系数显著性的t检验与回归方程显著性的F检验是等价的;(C)一般情况下,一个定性变量有k类可能的取值时,需要引入卜一1个0—1型自变量;(D)异常值的识别与特定的模型有关。4、下面给出了4个残差图,哪个图形表示误差序列是自相关的(A)(B)
(A)(B)(C)(D)5、下列哪个岭迹图表示在某一具体实例中最小二乘估计是适用的(A)(B)(C)(D)(C)(D)5、下列哪个岭迹图表示在某一具体实例中最小二乘估计是适用的(A)(B)(C)(D)二、填空题(每空2分,共20分)1、考虑模型y=XP+e,var(£)=a21,其中X:nxp',秩为,a2>0不一定n已知,则P=,var(P已知,则P=,var(P)=,若服从正态分布,则(n-p')d2a2,其中是的无偏估计.2、下表给出了四变量模型的回归结果:来源平方和自由度均方回归65965残差总的6604214则残差平方和= ,总的观察值个数= ,回归平方和的自由度二—
3、已知因变量与自变量,,,,下表给出了所有可能回归模型的AIC值,则最优子集是.模型中的变量AIC模型中的变量AIC202。55,,3。50,2。68一,5.00142.49,,7。34,62。44,138.23,,3.04,,2。12,198。10315.16,5.50138。734、在诊断自相关现象时,若DW0.66,则误差序列的自相关系数的估计值=,若存在自相关现象,常用的处理方法有迭代法、、科克伦-奥克特迭代法.5、设因变量与自变量的观察值分别为y1,y2,...,yn和工1户尸..,x“,则以为折点的折线模型可表示为。三、(共45分)研究货运总量(万吨)与工业总产值(亿元)、农业总产值(亿元)、居民非商品支出(亿元)的线性回归关系。观察数据及残差值、学生化残差SKq、删除学生化残差SRE、库克距离、杠杆值见表一(i)表编号SREiSRE(i)116070351。0一 15.474-0O894-0o8760.1660.454226075402。412。8250o6280.5930o0310.240321065402.05。3440o2650o2430o0060o261426574423。0-0.091-0.004—0o0041o168E-60o199524072381.233。2251.7542.2940o4090.347622068451。5-25.198-2.116—3.8323.2160。742727578424.0—17。5-1o2200.5010.59541.1733816066362.0-20.007一1。163-1。2060.2890。461927570443。28.2340。4090。3790.0150。2641025065423.018.6951。0651.0790。2220.439表二参数估计表变量系数标准误Intercept一348。2803.7547。10112.447176。4591.9332.88010。569总平方和SST=16953残差平方和SSE=3297已知10侬(6)=2447,10侬°)=2365,F005(3,6)=4.76,F005(4,7)=4.12,根据上述结果,解答如下问题:1、计算误差方差的无偏估计及判定系数.(8分)2、对,,的回归系数进行显著性检验。(显著性水平a=0.05)(12分)3、对回归方程进行显著性检验.(显著性水平a=0.05)(8分)4、诊断数据是否存在异常值,若存在,是关于自变量还是关于因变量的异常值?(10分)5、写出关于,,的回归方程,并结合实际对问题作一些基本分析(7分)四、(共8分)某种合金中的主要成分为金属A与金属8,研究者经过13次试验,发现这两种金属成分之和与膨胀系数之间有一定的数量关系,但对这两种金属成分之和是否对膨胀系数有二次效应没有把握,经计算得与的回归的残差平方和为3。7,与、的回归的残差平方和为0。252,试在0。05的显著性水平下检验对是否有二次效应?(参考数据F005(1,10)=4.96,F005(2,10)=4.1)五、(共12分)(1)简单描述一下自变量x/X2,...,xp之间存在多重共线性的定义;(2分)(2)多重共线性的诊断方法主要有哪两种?(4分)(3)消除多重共线性的方法主要有哪几种?(6分)应用回归分析试题(二)一、选择题1。某同学由与之间的一组数据求得两个变量间的线性回归方程为y=bx+a,已知:数据的平均值为2,数据的平均值为3,则(A)A.回归直线必过点(2,3) B.回归直线一定不过点(2,3)C.点(2,3)在回归直线上方 D.点(2,3)在回归直线下方2。在一次试验中,测得(x,y)的四组值分别是A(1,2)出(2,3),C(3,4),D(4,5) ,则Y与X之间的回归直线方程为(A)a.y=x+1b.y=x+2c.y=2x+1 d.y=x-13. 在对两个变量,进行线性回归分析时,有下列步骤:①对所求出的回归直线方程作出解释; ②收集数据、),i=1,2,…,;③求线性回归方程;④求未知参数;⑤根据所搜集的数据绘制散点图如果根据可行性要求能够作出变量x,y具有线性相关结论,则在下列操作中正确的是(d)A.①②⑤③④ B.③②④⑤① C.②④③①⑤D.②⑤④③①4。下列说法中正确的是(B )A.任何两个变量都具有相关关系 B.人的知识与其年龄具有相关关系C.散点图中的各点是分散的没有规律D.根据散点图求得的回归直线方程都是有意义的给出下列结论:(1)在回归分析中,可用指数系数的值判断模型的拟合效果越大,模型的拟合效果越好;(2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好;(3)在回归分析中,可用相关系数的值判断模型的拟合效果,越小,模型的拟合效果越好;(4)在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适带状区域的宽度越窄,说明模型的拟合精度越高.TOC\o"1-5"\h\z以上结论中,正确的有(B )个.A.1 B.2 C.3D.46.已知直线回归方程为y=2-1.5x,则变量增加一个单位时(C )A。平均增加个单位B。平均增加个单位C。平均减少个单位D.平均减少个单位7.下面的各图中,散点图与相关系数r不符合的是(B )一位母亲记录了儿子3〜9岁的身高,由此建立的身高与年龄的回归直线方程为Q=7.19x+73.93,据此可以预测这个孩子10岁时的身高,则正确的叙述是(D)A.身高一定是145。83cm B.身高超过146.00cmC.身高低于145.00cm D.身高在145。83cm左右在画两个变量的散点图时,下面哪个叙述是正确的(B)(A)预报变量在轴上,解释变量在轴上(B)解释变量在轴上,预报变量在轴上(C)可以选择两个变量中任意一个变量在轴上(D)可以选择两个变量中任意一个变量在轴上10。两个变量与的回归模型中,通常用来刻画回归的效果,则正确的叙述是(D)A.越小,残差平方和小B.越大,残差平方和大C.于残差平方和无关 D.越小,残差平方和大11。两个变量与的回归模型中,分别选择了4个不同模型,它们的相关指数如下,其中拟合效果最好的模型是(A)A.模型1的相关指数为0。98 8。模型2的相关指数为0.80C.模型3的相关指数为0.500。模型4的相关指数为0。2512.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是(B)A。总偏差平方和 B。残差平方和C.回归平方和 D。相关指数R213。工人月工资(元)依劳动生产率(千元)变化的回归直线方程为j=60+90x,下列判断正确的是(C)A.劳动生产率为1000元时,工资为50元 B.劳动生产率提高1000元时,工资提高150元C.劳动生产率提高1000元时,工资提高90元D.劳动生产率为1000元时,工资为90元14。下列结论正确的是(C )①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A.①②B①②③。C.①②④D.①②③④15。已知回归直线的斜率的估计值为1。23,样本点的中心为(4,5),则回归直线方程为(C)A.j=1.23x+4型j=1.23x+5C.j=1.23x+0.08D.j=0.08x+1.23
二、填空题TOC\o"1-5"\h\z16。在比较两个模型的拟合效果时,甲、乙两个模型的相关指数的值分别约为0。96和0o85,则拟合效果好的模型是 甲.17。在回归分析中残差的计算公式为列联表、三维柱形图、二维条形图.18.线性回归模型y=bx+a+e(和为模型的未知参数)中,称为随机误差 .19。若一组观测值(x1,y1)(x2,y?)…(xn,yn)之间满足yjbxi+a+ei (i=1、20・・・n)若e恒为0,则R2为 1恒为0,,说明随机误差对y贡献为0.' 'i i i 三、解答题20.调查某市出租车使用年限和该年支出维修费用(万元),得到数据如下:(2)由(1)中结论预测第10年所支出的维修费用.(yz(2)由(1)中结论预测第10年所支出的维修费用.(yz一、, -(x(x.—x)•(y.—y)i7=1y,一、(x—x)2i20.解析:(1)i1220.解析:(1)i12345234562238556570xiyi4411422032542049162536x=4,y=5,2x2=90,2xy=112.3i ii i=1 i=1 列表如下:_i=1a=y—bx于是b=£于是b=£5xyii—5xyi=1 £x2—5x2
i112.3—5x4x5 =1.23,90—5x42使用年限23456维修费用2.23.85.56.57.0(1)求线性回归方程;_ i=1a=y—bx=5—1.23x4=0.08・•・线性回归方程为:y=bx+a=1.23x+0.08 (2)当x=10时,y=1.23x10+0.08=12.38(万元)即估计使用10年时维修费用是1238万元回归方程为:y=1.23x+0.08(2)预计第10年需要支出维修费用12.38万元.21。以下是某地搜集到的新房屋的销售价格和房屋的面积的数据:
层屋面租11511□ED135105销售侪格1万元口24.821.eIS.429.222(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;(3)据(2)的结果估计当房屋面积为150m2时的销售价格.(4)求第2个点的残差。21。解析:21。解析:(1)数据对应的散点图如图所示:⑵X=⑵X=-寸X=109,l=Z(x—X)2=1570,5i xx ii=1 i=1y=23.2,l=2(xi-X)(yi-y)=308i=1设所求回归直线方程为y=bx+a,l则b=l则b=广xx3081570x0.1962a=y—a=y—bx=23.2-109x3081570x1.8166故所求回归直线方程为y=0.1962x+1.8166(3)据(2),当x=150m2时,销售价格的估计值为:y=0.1962x150+1.8166=31.2466(万元)必看经典例题Io从20的样本中得到的有关回归结果是:sSR=60,SSE=40.要检验x与y之间的线性关系是否显著,即检验假设:H0:B1=0o(1)线性关系检验的统计量F值是多少?(2)给定显著性水平a=0.05,F•是多少?a(3)是拒绝原假设还是不拒绝原假设?(4)假定x与y之间是负相关,计算相关系数r。(5)检验x与y之间的线性关系是否显著?解:(1)55区的自由度为卜=1;55£的自由度为n-k—1=18;SSR60因此田=SSE=40=27n一k一118(2)。(1[8)=。05(1/8)=4.41(3)拒绝原假设,线性关系显著.⑷r=1C厂=尿=0-7746,由于是负相关,因此r=—0。7746\SSR+SSE(5)从F检验看线性关系显著。2o某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据.通过计算得到下面的有关结果:方差分析表变差来源dfSSMSFSignificanceF回归2.17E—09残差40158.07一一总计111642866。67一一一参数估计表
Coefficients标准误差tStatP-valueIntercept363.689162.455295。8231910.000168XVariablei1。4202110.07109119。977492。17E—09要求:(1)完成上面的方差分析表。(2)汽车销售量的变差中有多少是由于广告费用的变动引起的?(3)销售量与广告费用之间的相关系数是多少?(4)写出估计的回归方程并解释回归系数的实际意义.(5)检验线性关系的显著性(a=0.05)。解:变差来源dfSSMSFSignificanceF回归11602708.61602708.6399.10000652.17E—09残差1040158.074015.807-一总计111642866.67一一-(2)R2=0O9756,汽车销售量的变差中有97。56%是由于广告费用的变动引起的。(3)r=0。9877。(4)回归系数的意义:广告费用每增加一个单位,汽车销量就增加1。42个单位。(5)回归系数的检验:p=2。17E—09Va,回归系数不等于0,显著。回归直线的检验:p=2.17E—09Va,回归直线显著。3.根据两个自变量得到的多元回归方程为y=—18.4+2.0k+4.74X,并且已知口=10,SST=6724。125,SSR12=6216.375/瓦=0.0813,s6=0。0567.要求:(1)在a=0.05的显著性水平下,7x2与y的线性关系是否显著?⑵在a=0。05的显著性水平下J(3)在a=0.05的显著性水平下,解(1)回归方程的显著性检验:假设:H0:==0 珥:,不全等于0SSE=SST—SSR=6724.125-6216.375=507。75F=SSRp=6724.1252=42.85SSEn-p-1507.7510-2-1勺(2,7)=4。74,F>.(2,7),认为线性关系显著。(2)回归系数的显著性检验:假设:H0:=o H]:W0t=区=2.01=24.72S0.08130)2(n-p-1)=2.36,H>(2(7),认为y与X1线性关系显著。(3)回归系数的显著性检验:假设:Ho:=0 H1:^0t='=4.74=83。6S0.0567(Jn-p-1)=2。36,H〉/2(7),认为y与x2线性关系显著。4.根据下面Excel输出的回归结果,说明模型中涉及多少个自变量、少个观
察值?写出回归方程,并根据F,se,R2及调整的的值对模型进行讨论.SUMMARYOUTPUT回归统计MultipleRRSquareAdjustedRSquar
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论