线性模型考试题目_第1页
线性模型考试题目_第2页
线性模型考试题目_第3页
线性模型考试题目_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一、(40分,每题8分)简答题1. 什么是多重共线性?如何识别多重共线性?多重共线性(Multicollinearity )是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相 关关系而使模型估计失真或难以估计准确。多重共线性可能会使回归的结果造成混乱,甚至会把分析引入 歧途;可能对参数估计值的正负号产生影响,特别是各回归系数的正负号有可能同我们预期的正负号相反。检测多重共线性的最简单的一种办法是计算模型中各对自变量之间的相关系数,并对各相关系数进 行显著性检验。若有一个或多个相关系数显著,就表示模型中所用的自变量之间相关,存在着多重共线性。另外,如果出现下列情况,则同样暗示存在多重共

2、线性:模型中各对自变量之间显著相关;当模型 的线性关系检验(F检验)显著时,几乎所有回归系数的t检验都不显著;回归系数的正负号与预期的相反。2. 线性模型中的F检验统计量和t检验统计量的区别和联系是什么?F检验用于检验自变量与因变量之间的线性关系是否显著,即对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。其检验统计量为t检验用于检验自变量 x对因变量y的影响是否显著,即对模型中被解释变量与某个解释变量之间 的线性关系在总体上是否显著成立作出推断。/ = 2)s 其检验统计量为t统计量与F统计量的构造原理及其概率分布都是不一致的,前者直接考虑参数的估计量是否“足 够”接近

3、于0,服从t分布;后者则是从总离差平方和分解式出发,以回归平方与残差平方和的比值来推 断解释变量整体对被解释变量的线性影响是否显著,服从F分布。就一般而言,t检验与F检验不等相互替代。对于一元线性回归模型,F检验与t检验是等价的;而对于二元以上的多元回归模型,解释变量的整体对被解释变量的影响是显著的,并不表明每一个解释变量对它的影响都显著,因此在做完F检验后还须进行t检验。3. 简述线性模型对模型的假定。线性回归模型的基本假设是:解释变量是确定性变量,而且解释变量之间互不相关;随机误差项具 有0均值和同方差;随机误差项在不同样本点之间是独立的,不存在序列相关;随机误差项与解释变量之 间不相关;

4、随机误差项服从 0均值、同方差的正态分布。4. 对两个变量的相关分析和回归分析有什么区别和联系?相关分析中,变量 x变量y处于平等的地位;回归分析中,变量y称为因变量,处在被解释的地位,x称为自变量,用于预测因变量的变化;相关分析中所涉及的变量x和y都是随机变量;回归分析中,因变量y是随机变量,自变量x可以是随机变量,也可以是非随机的确定变量;相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制。5. 简述向前选择、向后剔除和逐步回归法。向前选择:将所有自变量分别与因变量建立一元线性回归方程,比较F统计量的值,将 F统计

5、量的值最大的变量引入回归方程; 再分别将引入的变量,和每一个剩余变量与因变量 y建立二元线性回归方程, 再比较F统计量的值,选择 F统计量的值最大的变量引入方程;直至增加自变量不能导致SSR显著增加。向后剔除:用全部变量建立一个回归方程;考察去掉一个自变量的模型,剔除使模型的SSR减少最多的变量;对剩余变量再作回归,再检验;直至剔除一个自变量不会使SSR显著减少为止。逐步回归法:前两步与向前选择法相同;在增加了一个自变量之后,对模型的所有变量进行考察, 看看有没有可能剔除某个自变量;直至增加变量不能导致SSE显著减少(30分)为研究人均国内生产总值( GDP )与人均消费水平之间的关系,在全国

6、范围内随机抽取 个地区,得到2000年的人均国内生产总值(GDP )和人均消费水平的统计数据如下:地区人均GDP (元)人均消费水平(元)北京224607326辽宁112264490上海3454711546江西48512396河南54442208贵州26621608陕西45492035经初步计算,用最小二乘法得到下面的回归结果(0.05)方程的截距b0734.6928截距的标准差Sb0139.5403回归平方和SSR 814449686800回归系数b 0.30868回归系数的标准差 $0.0085残差平方和SSE 305795.03431.写出一元线性回归模型,并指出回归模型的基本假定。y

7、=凤 + O + £一元线性回归模型可表示为线性回归模型的基本假设是:解释变量是确定性变量,而且解释变量之间互不相关;随机误差项具 有0均值和同方差;随机误差项在不同样本点之间是独立的,不存在序列相关;随机误差项与解释变量之 间不相关;随机误差项服从 0均值、同方差的正态分布。2.以人均GDP作自变量(x),人均消费水平作因变量(y),写出估计的回归方程,并解释回归系数的头际意义。?= 734.69 + 0.31?b。 734.69是截距,没具体的经济意义;回归系数b, 0.31是斜率,表示人均GDP每增加1单位, 人均消费水平平均增加0.31单位。23.计算判定系数R,并说明它的实

8、际意义。? SSR=0.9963SSR+ SSE说明在人均消费水平的变动中,有99.63%可以由人均GDP和人均消费水平之间的线性关系来解释。4. 计算估计标准误差 Sy,并说明它的实际意义。标准误差 ?=247.3说明根据人均 GDP来估计人均消费水平时,平均的估计误差为247.3元。5. 写出检验回归系数的原假设和备择假设,计算检验的统计量,并根据显著性水平=0.05检验回归系数的显著性(注:当0.05时,t 2 2.4469 )原假设?: ?=0 ;备择假设?:?工0统计量t =?0.30868?1= 0.0085 = 61.736 > t2 2.4469,拒绝原假设?,表明人均消

9、费水平和人均GDP之间的线性关系是显著的(30分)一家出租汽车公司为确定合理的管理费用,需要研究出租车司机每天的收入(元)与他的行 使时间(小时)行驶的里程(公里)之间的关系,为此随机调查了20个出租车司机,根据每天的收入(y )、行使时间(Xi)和行驶的里程(X2)的有关数据进行回归,得到下面的有关结果(0.05):方程的截距?42.38截距的标准差S?36.59'0回归平方和SSR 29882回归系数?9.16回归系数的标准差 S 4.781残差平方和SSE 5205回归系数?20.46回归系数的标准差 s?0.142一(1) 写出每天的收入(y )与行使时间(x1)和行驶的里程(

10、x2)的线性回归方程。(2)解释各回归系数的实际意义。(3)计算多重判定系数R2,并说明它的实际意义。(4)计算估计标准误差Sy,并说明它的实际意义。(5) 以显著性水平 =0.05,检验回归方程的线性关系是否显著?(注:F0.05(2,17) 3.59 )(6) 以显著性水平 =0.05,检验回归系数是否显著? (t0.025(17) 2.1 1 )53.(1)回归方程为* A滋宪"16可+ 046乃.(2)A = 5.16表刁孔在行驶里程不变的情况下,行驶时间每增加1小时,每天的收入平谢增加9.16元:应=0 46衣示在行駛时间不变的情况下,行驶虽程毎增加】公里,毎天的收入平均增加0.46元.2?882298B2 + 5205=®5 17%表明在每天收入的总变差屮,被估计的多元线性回归方程所解释的比例为騎”17%,说明回归方程的拟合程度较高(4)表明用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论