




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章K元线性回归模型一、填空题1 .对于模型 Yi =久 +BiXi1 +2Xi2+PkXik +Ui , 1,2,,一般经验认为,满足模型估计的基本要求的样本容量为 2 .对于总体线性回归模型 Yi=Po+PiXii+?2Xi2+P3Xi3+Ui,运用最小二乘法欲得到参数估计量,所要求的最小样本容量n应满足 或至少。3 .多元线性计量经济学模型的矩阵形式 ,对 应的样本线性回归模型的矩阵形式 ,模型的最小 二乘参数估计量 及其方差估计量 O4 . 总平方和可以分解为 回归平方和 和残差平方 和,可决系数为 。5 .多元回归方程中每个解释变量的系数 B (偏回归系数), 指解释变量变化一个单
2、位引起的被解释变量平均变化 b 一个 单位。6 .线性模型的含义,就变量而言,指的是回归模型变量 的;就参数而言,指的是回归模型中参数的 。 通常线性回归模型指的是 。二、问答题1 .什么是多元回归模型?它与一元、二元回归模型有何区别?2 .极大似然法()的原理是什么?3 .什么是拟合优度(R2)检验?有什么作用?指对样本回归直线与样本观测值之间的拟合程度的检验。1 / 144 .可决系数R2低的可能的原因是什么?5 .多元回归的判断系数R2具有什么性质?运用R2时应注意什么问题?6 .多元线性回归模型的基本假设是什么?试说明在证明最小二乘估计量的无偏性和有效性的过程中,哪些基本假设起了作用?
3、7 .说明区间估计的含义。三、实践题1.下表给出三变量模型的回归结果:方差来源平方和()自由度()土F 差()1 /。 1 1 /11 111" /回归平方和()65965321988.33残差平方和()77117总平方和()66042144717.48要求:(1)样本容量是多少?(2)求?(3)和的自由度各是多少?(4)求 R2和 R2?(5)检验假设:Xi和X2对y无影响。你用什么假设检验?为什么?(6)根据以上信息,你能否确定 Xi和X2各自对丫的贡献吗?2 / 142.下面给出依据15个观察值计算得到的数据,其中小写字母代表了各值与其样本均值的离差。2Y =367.693 ,
4、 Xi =402.760 , X2 =8.0 , 工 y =66042.269 22、xii =84855.096 , 、 x2 =280.0 ,'、 y xii =74778.346“ yx2i =4250.9 ,'、 乂仆功=4796.0要求:(1)估计三个多元回归系数;(2)估计它们的标准差; 弁求出R2与R2? (3)估计良、隹95%勺置信区间;(4)在口=5%下, 检验估计的每个回归系数的统计显著性(双尾检验);(5)给出方差分析表。(1)3 .考虑以下方程(括号内为估计标准差):n = 19, R2 = 0.873W =8.562 0.364F 0.004: _1
5、- 2.560Ut(0.080)(0.072)(0.658)其中:W t年的每位雇员的工资和薪水;P 一 t年的物价水平;ut年的失业率。要求:(1)对个人收入估计的斜率系数进行假设检验;(2)讨论p1在理论上的正确性,对本模型的正确性进行 讨论;*是否应从方程中删除?为什么?4 .克莱因和戈德伯格曾用1921-1941年与1945-1950年(1942-1944年战争期间略去)美国国内消费C和工资收入 W3 / 14非工资一非农业收入P、农业收入A的共27年时间序列资料,利用普通最小二乘法估计得出了下列回归方程:Ct =8.1 3 1.3) Wt 9 0.4 Pt 20.1 At 1 R2
6、= 0 95 F =107 37(8. (902. )1( 70 ). 4( 51 2, 0" . , 一式中括号中的数字为相应参数估计量的标准误。试对该模型进行评价,指出其中存在的问题。(显著性水平 a =5%,已知F0.05(3,23) =3.03, t0.025(23)= 2.069)5 .某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为2edu =10.360.094sibs 十 0.131medu 十 0.210 fedu , R=0.214式中,为劳动力受教育年数,为该劳动力家庭中兄弟姐妹的 个数,与分别为母亲与父亲受到教育的年数。问(1)是否具有
7、预期的影响?为什么?若与保持不变,为了使预测的受教育水平减少一年,需要增加多少?(2)请对的系数给予适当的解释。(3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数为12年,另一个的父母受教育的年数为16年,则两人受教育的年数预期相差多少?6.以企业研发支出()占销售额的比重为被解释变量(Y),以企业销售额(X1)与利润占销售额的比重(X2)为解释变量, 一个有32个企业的样本估计结果如下:Y =0.472 0.3210g(X1) 0.05X2 _2 (1.37) (0.22)(0.046) ,R2 =0.0994 / 14其中括号中为系数估计值的标准差。(1)解释(X1)的系数。
8、如果X1增加10%估计Y会变化多 少个百分点?这在经济上是一个很大的影响吗?(2)针对强度随销售额的增加而提高这一备择假设,检验 它不虽X1而变化的假设。分别在 5%口 10%勺显著性水平上进行 这个检验。(3)利润占销售额的比重 X2对强度Y是否在统计上有显著 的影响?(3)对X2,参数估计值的t统计值为0.05/0.46=1,087 , 它比在10%勺显著性水平下的临界值还小,因此可以认为它对Y在统计上没有显著的影响。7.下表为有关经批准的私人住房单位及其决定因素的4个模型的估计量和相关统计值(括号内为值)(如果某项为空,则意味着模型中没有此变量)。数据为美国40个城市的数据。模型 如下:
9、housing = 0 density 2value 3income : 4 popchang5unemp 6localtax7statetax 式中一一实际颁发的建筑许可证数量,一一每平方英里的人口密度,一一自由房屋的均值(单位:百美元),一一平均家庭的收 入(单位:千美元),式一19801992年的人口增长百分比, 一一 失业率,一一人均交纳的地方税,一一人均缴纳的州税5 / 14变量模型A模型B模型C模型DC813 (0.74)-392-1279-973(0.81)(0.34)(0.44)0.0750.0620.042(0.43)(0.32)(0.47)-0.855-0.873-0.99
10、4-0.778(0.13)(0.11)(0.06)(0.07)110.41133.03125.71116.60(0.14)(0.04)(0.05)(0.06)26.7729.1929.4124.86(0.11)(0.06)(0.001)(0.08)-76.55(0.48)-0.061(0.95)-1.006-1.004(0.40)(0.37)4.76374.84374.96275.0387R20.3490.3380.3220.312Se1.48861.42461.41861.39961.77661.63461.59361.53866 / 14(1)检验模型A中的每一个回归系数在 10琳平下是否
11、为 零(括号中的值为双边备择值)。根据检验结果,你认为应该把 变量保留在模型中还是去掉?(2)在模型A中,在10琳平下检验联合假设 H): i =0(1,5,6,7) o说明被择假设,计算检验统计值,说明其在零假 设条件下的分布,拒绝或接受零假设的标准。说明你的结论。(3)哪个模型是“最优的”?解释你的选择标准。(4)说明最优模型中有哪些系数的符号是“错误的”。说 明你的预期符号弁解释原因。确认其是否为正确符号。参考答案 一、填空题1 )30 或至少 n>3 (1) ; 2. n)30 或至少 n>24; 3. y=xF+u, Y=Xb+e, b=(xX)"xY, Var
12、(b) no"X X)ii " ; 4.回归平方和;残差平 方和;回归平方和与残差平方和之比。5. B ; 6.非线性;非线性;变量非线性而参数为线性。二、问答题1 .答:回归模型与一元线性回归模型的区别表现在如下几 方面:一是解释变量的个数不同;二是模型的经典假设不同,多 元线性回归模型比一元线性回归模型多了“解释变量之间不存在线性相关关系”的假定;三是多元线性回归模型的参数估计式的7 / 14 表达更复杂。2 .答:极大似然法()是不同于法的另一种模型参数估计 方法。方法需要利用有关模型随机扰动项分布的知识构建似然函 数,然后利用使似然函数最大的方法得出参数估计。其基本
13、思路是确定观察到的样本数据最可能来自某个分布,该分布的参数值即为总体参数的估计量。3 .答:所谓拟合优度检验,指对样本回归直线与样本观测 值之间拟合程度的检验。如果所有的观测值都落在回归线上,称为“完全拟合”。这种情况很少发生。一般情况下,总会出现围 绕在回归直线周围的正或负的残差。通过对残差的分析,有助于衡量回归直线与样本观察值的拟合程度。 反映回归模型拟合优劣 的一个数量指标是样本可决系数 R,也称判定系数。另一个是对 回归模型的F统计检验。估计方程的目的常常不是为了获得高 R,而是要得到可靠的参数估计,以便利用估计结果进行统计推 断。注意不要将判断系数作为评价模型优劣的唯一标准。4 .答
14、:可能由于:X不是Y的良好解释变量;模型形式设定 有误。一般地,利用时间序列数据估计的模型 R值较高,而利用 截面数据估计的模型 R值较低。5 .答:R的取值取决在01之间。若Y的全部变异都得到 了解释,则R=1,若解释变量没有如何解释能力,有 R2=0o在模 型中不包含常数项的情况下,R的值可能超出01范围;是解8 / 14 释变量的非减函数,即增加解释变量不会降低 R2,在大多数情况 下,R会增大。在实际工作中,我们可以借助于R2的增减,判断回归模型不同表达形式的优劣。需要注意的是,对于不同因变量的回归模 型,比较R2的大小没有任何意义。用同一变量的不同数学表达式 作为因变量,R2也是不可
15、比的。时间序列数据建模中如果考虑了 滞后的行为反应,导致样本区间发生变动,R2也不可比。6 .答:回归模型的基本假定有:零均值假定、随机项独立 同方差假定、解释变量的非随机性假定、 解释变量之间不存在线 性相关关系假定、随机误差项Ui服从均值为0方差为。2的正态分 布假定。在证明最小二乘估计量的无偏性中,利用了解释变量与随机误差项不相关的假定; 在有效性的证明中,利用了随机项独 立同方差假定。7 .答:区间估计是指研究用未知参数的点估计值(从一组 样本观测值算得的)作为近似值的精确程度和误差范围。三、实践题2.解:9 / 142(1)'、:yiXii< X2i 4yiX2i<
16、;Xi i X2ib1 : 72-2_X1iX2i - 'nX1iX2iX1i X2i74778.346 280 -4250.9 4796.084855.096 280 -4796.02550620757810=0.7266,.,.2,.,.yi X2i v X1i yiX1X1iX2ib2 =二. 2-2- LL'X1X2i -、X1iX2X1iX2i42509 84855096-74778346 47960Z_Z _ 284855096 280-479602073580 =2.7363757810b0 =Y 41X1 -b2X2=367.693 -0.7266 402.76
17、0 -2.7363 8.0=53.15722ei2" yi2 -b1x yiX-b2“ yiX2i(2): u =n -315-366042.269-0.7266 74778.346-2.7363 4250.9一12=6.3821s(b0)=“Var(b0)= 看父八父仃2 =12.768其中:X2 % x2 X2 % x2 -2XXX1 X2i' X1i " X2i 一"X1iX2i' X1i X2i同理,可得:se(b1)=0.0486 , se(b2) = 0.84542 bJ yiX1i b2X yiX2i 拟合优度为:R2=0.99881
18、0 / 14R2 =1-(1 _R2)nl =0.9986n - k d.f.=12, 口=5%,查表得 P(t <2.179) = 0.95-2.179 < 0.7266"b1 < 2.179 ,得至U 0.6207 M b1M 0.83250.04861-2.179 < 2.7363b2 <2.179 ,得至U 0.8942 M b2 M 4.5784 0.8454b1 的 95%勺置信区间:0.6207 <b1 < 0.8325b2 的 95%勺置信区间:0.8942 <b2 <4.5784 Ho: Pi =0 (i=1,
19、2, 3),H 1 :00(=5% , d.f.=15-3=12 , 查表得临界值为:-2.179 <t <2.179则:W=53.:薰0=4.0963 - 2.179,则拒绝原假设:瓦=0 12.97680.7266 -0% = c- =14.9509 >2.179,拒绝原假设:民=00.0486电二餐3/=3.2367 >2.179,拒绝原假设:为=。0.8454(5)方差分析表平方和yj " ja iz<j> 回归平方和1 /J,TH65963.01811 )文232981.509残差平方和79.2507126.6042总,平方和66042.
20、269“3:4994.0203, -22, F 临界值为3.8911 / 14丁 F值是显著的,所以拒绝零假设。5.解:(1)预期对劳动者受教育的年数有影响。因此在收入 及支出预算约束一定的条件下,子女越多的家庭,每个孩子接受教育的时间会越短。根据多元回归模型偏回归系数的含义,前的参数估计值-0.094表明,在其他条件不变的情况下,每增加 1个兄弟姐妹, 受教育年数会减少0.094年,因此,要减少1年受教育的时间, 兄弟姐妹需增加1/0.094=10.6 个。(2)的系数表示当兄弟姐妹数与父亲受教育的年数保持不 变时,母亲每增加1年受教育的机会,其子女作为劳动者就会预 期增加0.131年的教育
21、机会。(3)首先计算两人受教育的年数分别为10.36+0.13112+0.210 12=14.45210.36+0.13116+0.210 16=15.816因此,两人的受教育年限的差别为15.816-14.452=1.3646.解:(1) (x1)的系数表明在其他条件不变时,(x1)变化1 个单位,Y 变化的单位数,即 0.32(X1)0.32(X11)=0.32100% 换言之,当企业销售X1增长100%寸,企业研发支出占销售额的比重Y会增加0.32个百分点。由此,如果X1增加10% Y会增加0.032个百分点。这 在经济上不是一个较大的影响。(2)针对备择假设 T: Pi>0,检验原假设H): 3=0。易知计算的t统计量的值为 12 / 140.32/0.22=1.468 。在5%勺显著性水平下,自由度为 32-3=29的 t分布的临界值为1.699 (单侧),计算的t值小于该临界值, 所以不拒绝原假设。意味着强度不随销售额的增加而变化。在 10%勺显著性水平下,t分布的临界值为1.311 ,计算的t值小 于该值,拒绝原假设,意味着强度随销售额的增加而增加。7.解:(1)直接给出了值,所以没有必要计算统计值以及 查t分布表。根据题意,如果值0.10,则我们拒绝参数为零的原 假设。由于表中所有参数的值都
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年七台河货运从业资格证考试模拟
- 盐城幼儿师范高等专科学校《工程流体力学Ⅲ》2023-2024学年第二学期期末试卷
- 2025年龙岩道路货运驾驶员从业资格证考试题库完整
- 2025年合肥货车从业资格证考试题目答案
- 儿童期精神障碍及精神发育迟缓的临床护理
- 颅内畸胎瘤的临床护理
- 阳江市重点中学2024-2025学年下学期高三年级期末教学质量检测试题(一模)物理试题含解析
- 2025年初级会计职称考试试题及答案
- 《兵工企业常用焊接方法与设备使》课件-等离子弧切割
- 2025年电影编剧专业考题及答案汇编
- 新加坡sm214th面经44踏水行歌
- 《教育心理学》教材
- 绥满公路大庆黄牛场至齐齐哈尔宛屯段扩建项目B4合同段施工组织设计
- 身体红绿灯课件
- 国家职业技能标准 (2021年版) 公共营养师
- Pentacam白内障应用(第二版)
- 抗精神病药物的选择与联合应用
- JJF1059.1测量不确定度评定与表示(培训讲稿)
- 中国电工技术学会科技成果鉴定管理办法
- 钢箱梁的制作及安装方案
- 工程测量毕业设计毕业论文
评论
0/150
提交评论