2023年计量经济学第三章经典单方程计量经济学模型多元线性回归模型_第1页
2023年计量经济学第三章经典单方程计量经济学模型多元线性回归模型_第2页
2023年计量经济学第三章经典单方程计量经济学模型多元线性回归模型_第3页
2023年计量经济学第三章经典单方程计量经济学模型多元线性回归模型_第4页
2023年计量经济学第三章经典单方程计量经济学模型多元线性回归模型_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章、经典单方程计量经济学模型:多元线性回归模型

一、内容提要

本章将一元回归模型拓展到了多元回归模型,其基本的建模思想与建模方法与一元的

情形相同。主要内容仍然包括模型的基本假定、模型的估计、模型的检验以及模型在预测方

面的应用等方面。只不过为了多元建模的需要,在基本假设方面以及检验方面有所扩充。

本章仍重点介绍了多元线性回归模型的基本假设、估计方法以及检验程序。与一元回

归分析相比,多元回归分析的基本假设中引入了多个解释变量间不存在(完全)多重共线性

这一假设;在检验部分,一方面引入了修正的可决系数,另•方面引入了对多个解释变量是

否对被解释变量有显著线性影响关系的联合性F检验,并讨论了F检验与拟合优度检验的

内在联系。

本章的另一个重点是将线性回归模型拓展到非线性回归模型,主要学习非线性模型如

何转化为线性回归模型的常见类型与方法。这里需要注意各回归参数的具体经济含义。

本章第三个学习重点是关于模型的约束性检验问题,包括参数的线性约束与非线性约

束检验。参数的线性约束检验包括对参数线性约束的检验、对模型增加或减少解释变量的检

验以及参数的稳定性检验三方面的内容,其中参数稳定性检验又包括邹氏参数稳定性检验与

邹氏预测检验两种类型的检验。检验都是以F检验为主要检验工具,以受约束模型与无约

束模型是否有显著差异为检验基点。参数的非线性约束检验主要包括最大似然比检验、沃尔

德检验与拉格朗日乘数检捡。它们仍以估计无约束模型与受约束模型为基础,但以最大似然

原理进行估计,且都适用于大样本情形,都以约束条件个数为自由度的??分布为检验统计

量的分布特征。非线性约束检验中的拉格朗日乘数检验在后面的章节中多次使用。

二、典型例题分析

例1.某地区通过•个样本容量为722的调查数据得到劳动力受教育的一个回归方程为

edu=10.36-0.094s〃2s+0.13\medu+0.21Ofedu

R2=0.214

式中,edu为劳动力受教育年数,sibs为该劳动力家庭中兄弟姐妹的个数,medu与fedu分

别为母亲与父亲受到教育的年数。问

(l)sibs是否具有预期的影响?为什么?若medu与fedu保持不变,为了使预测的受教

育水平减少一年,需要sibs增加多少?

(2)请对medu的系数给予适当的解释。

(3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数为12年,另一

个的父母受教育的年数为16年,则两人受教育的年数预期相差多少?

解答:

(1)预期sibs对劳动者受教育的年数有影响。因此在收入及支出预算约束一定的条件

下,子女越多的家庭,每个孩子接受教育的时间会越短。

根据多元回归模型偏回归系数的含义,sibs前的参数估计值-0.094表明,在其他条件不

变的情况下,每增加1个兄弟姐妹,受教育年数会减少0.094年,因此,要减少1年受教育

的时间,兄弟姐妹需增加1/0.094=10.6个。

(2)medu的系数表示当兄弟妞妹数与父亲受教育的年数保持不变时,母亲每增加I

年受教育的机会,其子女作为劳动者就会预期增加0.131年的教育机会。

(3)首先计算两人受教育的年数分别为

10.36+0.131x12+0.210x12=14.452

10.36+0.131x16+0.210x16=15.816

因此,两人的受教育年限的差别为15.816-14.452=1.364

例2.以企业研发支出(R&D)占销售额的比重为被解释变量(Y),以企业销售额(XI)

与利润占销售额的比重(X2)为解释变量,一个有32容量的样本企业的估计结果如下:

Y=0.472+0.321og(X,)+0.05X2

(1.37)(0.22)(0.046)

R2=0.099

其中括号中为系数估计值的标准差。

(1)解释log(Xl)的系数。如果XI增加10%,估计Y会变化多少个百分点?这在经济

上是一个很大的影响吗?

(2)针对R&D强度城销售额的增加而提高这一备择假设,检验它不虽XI而变化的假

设。分别在5%和10%的显著性水平上进行这个检验。

(3)利润占销售额的比重X2对R&D强度Y是否在统计上有显著的影响?

解答:

(1)log(xl)的系数表明在其他条件不变时,log(xl)变化1个单位,Y变化的单位数,

即AY=0.32Ak)g(Xl卜0.32(AX1/XI)=0.32x100%,换言之,当企业销售XI增长100%时,企

业研发支出占销售额的比重Y会增加0.32个百分点。由此,如果XI增加1。%,Y会增加

0.032个百分点。这在经济上不是一个较大的影响。

(2)针对备择假设H1:1>0,检验原假设H0:1=0。易知计算的t统计量的值

为1=0.32/0.22=1.468。在5%的显著性水平下,自由度为32-3=29的I分布的临界值为1.699

(单侧),计算的t值小于该临界值,所以不拒绝原假设。意味着R&D强度不随销售额的增

加而变化。在10%的显著性水平下,t分布的临界值为1.311,计算的t值小于该值,拒绝

原假设,意味着R&D强度随销售额的增加而增加。

(3)对X2,参数估计值的t统计值为0.05/0.46=1.087,它比在10%的显著性水平卜的

临界值还小,因此可以认为它对Y在统计上没有显著的影响。

例3.下表为有关经批准的私人住房单位及其决定因素的4个模型的估计量和相关统计

值(括号内为“值)(如果某项为空,则意味着模型中没有此变量),数据为美国40个城市

的数据。模型如下:

hoI,sing=0()+^density+P2value+/3yincome+popchang

4-P5unemp-\-/3Jocaltax+用statetax+〃

式中housing实际颁发的建筑许可证数量,density每平方英里的人口密度,value—

一自由房屋的均值(单位:百美元),income平均家庭的收入(单位:千美元),popchang

-1980~1992年的人口增长百分比,unemp——失业率,locallax——人均交纳的地方税,

statetax---人均缴纳的州税

变量模型A模型B模型C模型D

C813(0.74)-392(0.81)-1279(0.34)-973(0.44)

Density0.075(0.43)0.062(0.32)0.042(0.47)

Value-0.855(0.13)-0.873(0.11)-0.994(0.06)-0.778(0.07)

Income110.41(0.14)133.03(0.04)125.71(0.05)116.60(0.06)

Popchang26.77(0.11)29.19(0.06)29.41(U.001)24.86(U.U8)

Unemp-76.55(0.48)

Localtax-0.061(0.95)

Statetax-1.006(0.40)-1.004(0.37)

RSS4.763e+74.843e+74.962e+75.038e+7

R20.3490.3380.3220.312

1.488c+61.424e+6L418c+61.399e+6

AIC1.776e+61.634e+6l.593e+61.538e+6

(1)检验模型A中的每一个回归系数在10%水平下是否为零(括号中的值为双边备择p-

值)。根据检验结果,你认为应该把变量保留在模型中还是去掉?

(2)在模型A中,在10%水平下检验联合假设Ho:Pi=0(i=l,5,6,7)o说明被择假设,计

算检验统计值,说明其在零假设条件下的分布,拒绝或接受零假设的标准。说明你的

结论。

(3)哪个模型是“最优的”?解释你的选择标准。

(4)说明最优模型中有哪些系数的符号是“错误的”。说明你的预期符号并解释原因。确认

其是否为正确符号.

解答:

(1)直接给出了P-值,所以没有必要计算年统计值以及查t分布表。根据题意,如果

P-值<0.10,则我们拒绝参数为零的原假设。

由于表中所有参数的P-值都超过了10%,所以没有系数是显著不为零的。但由此去掉所

有解释变量,则会得到非常奇怪的结果。其实正如我们所知道的,多元回去归中在省略变量

时一定要谨慎,要有所选择。本例中,valuesincome、popchang的p-值仅比0.1稍大一点,

在略掉unemp、localtax、slatetax的模型C中,这些变量的系数都是显著的。

(2)针对联合假设Ho:pi=0(i=l,5,6,7)的备择假设为Hl:d=0(i=l,5,6,7)

中至少有一个不为零。检验假设H0,熨际上就是参数的约束性检验,非约束模型为模里人,

约束模型为模型D,检验统计值为

F=(RSSR-RSSGAku-kQ=(5.038e+7-4.763e+7)/(7-3)=0也

RSSu/("即—I)一(4.763f+7)7(40-8)

显然,在H0假设下,上述统计量满足F分布,在10%的显著性水平下,自由度为(4,32)

的F分布的临界值位于2.09和2.14之间。显然,计算的F值小于临界值,我们不能拒绝

H0,所以Bi(i=l,5,6,7)是联合不显著的。

(3)模型D中的3个解释变量全部通过显著性检验。尽管R2与残差平方和较大,但相

对来说其AIC值最低,所以我们选择该模型为最优的模型。

(4)随着收入的增加,我们预期住房需要会随之增加。所以可以预期B3>(),事实上其

估计值确是大于零的。同样地,随着人口的增加,住房需求也会随之增加,所以我们预期B

4〉0,事实其估计值也是如此。随着房屋价格的上升,我们预期对住房的需求人数减少,即

我们预期B3估计值的符号为负,回归结果与直觉相符。出乎预料的是,地方税与州税为不

显著的。由于税收的增加将使可支配收入降低,所以我们预期住房的需求将下降。虽然模型

A是这种情况,但它们的影响却非常微弱。

4、在经典线性模型基本假定下,对含有三个自变量的多元回归模型:

Y=氏+必、+dX?+氏X3+N

你想检验的虚拟假设是H0:4-2分=1。

(1)用A,A的方差及其协方差求出

(2)写出检验H0:4-2方=1的t统计量。

(3)如果定义4-2为=0,写出一个涉及仇、8、仇和饱的回归方程,以便能直接得

到0估计值6及其标准误。

解答:

(1)由数理统计学知识易知

京—出-2月)=)-4C^v(3(,A)+4W/r(A)

(2)由数理统计学知识易知

A2反-1八八八〜

t="二/,,其中阳4-2分)为(4-24,)的标准差。

阳6-2/2)

(3)由四一2四知4=。+2人,代入原模型得

丫=0。+(。+2色必+fi2X2+.〃

=/3(HQX\+X?)+AX3+〃

这就是所需的模型,其中B估il值@及其标准误都能通过对该模型进行估订得到。

三、习题

(-)基本知识类题型

3-1.解释下列概念:

1)多元线性回归6)参数估计后的置信区间

2)虚变量7)被解释变量预测值的置信区间

3)正规方程组8)受约束问归

4)无偏性9)无约束回归

5)一致性10)参数稳定性检验

3-2.观察下列方程并判断其变量是否呈线性?系数是否呈线性?或都是?或都不是?

1)匕=0。+0闻+%

2)匕=为+夕/。gXj+6

3)log匕=&+用logX,+与

4)匕=为+四(凡XJ+J

5)匕=-^-+£;

6)匕=1+/?°(l—X3+£j

7)匕=凡+四X/+氏X2,/10+e,

3-3.多元线性回归模型与一元线性回归模型有哪些区别?

3-4.为什么说最小二乘估计量是最优的线性无偏估计量?多元线性回归最小二乘估计的正

规方程组,能解出唯一的参数估计的条件是什么?

3-5.多元线性回归模型的基本假设是什么?试说明在证明最小二乘估U量的无偏性和有效

性的过程中,哪些基本假设起了作用?

3-6.请说明区间估计的含义。

(二)基本证明与问答类题型

3-7.什么是正规方程组?分别用非矩阵形式和矩阵形式写出模型:

%=凤+夕内:+河马+…+夕卜%+%,i=1,2,…,〃的正规方程组,及其推导过程。

编号:

时间:2021年X月X日书山有路勤为径,学海无涯苦作舟页码:第6页共19页

3-8.对于多元线性回归模型,证明:

⑵Z油=£(乐+BR+…+黑场汹=o

3-9.为什么从计量经济学模型得到的预测值不是一个确定的值?预测值的置信区间和置信

度的含义是什么?在相同的置信度下如何才能缩小置信区间?为什么?

3-10.在多元线性回归分析中,,检验与尸检验有何不同?在一元线性回归分析中二者是否

有等价的作用?

3/1.设有模型:>,=&+/?内+夕42+〃,试在下设条件下:

(1)。廿%=\

(2)/?,=/?2

分别求出A和九的最小二乘估计量。

3-12.多元线性计量经济学模型

X=A+四人+用•%+…十4"+从i=L2「・,n(2.11.1)

的矩阵形式是什么?其中每个矩阵的含义是什么?熟练地写出用矩阵表示的该模型的普通

最小二乘参数估计量,并证明在满足基本假设的情况下该普通最小二乘参数估计量是无偏和

有效的估计量。

3-13.有如下生产函数:InX=1.37+0.632InXT+0.452InL

(0.257)(0.219)

R2=0.98CbvSx也)=0.055

其中括号内数值为参数标格差。请检验以下零假设:

(1)产出量的资本弹性和劳动弹性是等同的;

(2)存在不变规模收益,即4=1o

3-14.对模型川=凡+4凤…+/内,+%应用OLS法,得到回归方程如下:

y,=A-+P\X\i+PlX2iPkXki

第6页共19页

编号:

时间:2021年X月X日书山有路勤为径,学海无涯苦作舟页码:第7页共19页

要求:证明残差弓-%与%不相关,即:22与=0。

3-15.

3-16.考虑下列两个模型:

I、H=四+夕22+夕3%+%

II、(x-x2j)=+a2x2i+a3x3i+u\

要求:(1)证明:&2=AT,&\=3\,痣=氐

(2)证明:残差的最小二乘估计量相同,即:4=4

(3)在何种情况下,模型H的拟合优度咫会小于模型I拟合优度解。

3-17.假设要求你建立一个计量经济模型来说明在学校跑道上慢跑一英里或一英里以上的人

数,以便决定是否修建第二条跑道以满足所有的锻炼者。你通过整个学年收集数据,得到两

个可能的解释性方程:

2

方程A:Y=125.0-15.0X,-1.0X2+1.5X3灰=0.75

方程B:f=123.0-14.0X,+5.5X2-3.7X4=0.73

其中:V一一某天慢跑者的人数

X1——该天降雨的英寸数

x2——该天日照的小时数

x3一一该天的最高温度(按华氏温度)

x4一一第二天需交学期论文的班级数

请回答下列问题:(1)这两个方程你认为哪个更合理些,为什么?

(2)为什么用相同的数据去估计相同变显的系数得到不同的符号?

3-18.对下列模型:y=a+Aq+2z,+%(1;

y,=a+网-Pzi+u.(2)

求出B的最小二乘估计值;并将结果与下面的三变量回归方程的最小二乘估计值作比较:

(3)),:=。+/匕-汽+%,你认为哪一个估计值更好?

3-19.假定以校园内食堂每天卖出的盒饭数量作为被解释变量,盒饭价格、气温、附近餐厅

第7页共19页

编号:

时间:2021年X月X日书山有路勤为径,学海无涯苦作舟页码:第8页共19页

的盒饭价格、学校当日的学生数量(单位:千人)作为解释变量,进行回归分析;假设不管

是否有假期,食堂都营业。不幸的是,食堂内的计算机被一次病毒侵犯,所有的存储丢失,

无法恢复,你不能说出独立变量分别代表着哪一项!下面是回归结果(括号内为标准差):

R=10.6+28.4Xh+12.7X2/4-0.61X3.-5.9X4/

(2.6)(6.3)(0.61)(5.9)产=0.63〃=35

要求:

(1)试判定每项结果对应着哪一个变量?

(2)对你的判定结论做出说明。

(三)基本计算类题型

3-20.试对一元线性【可归模型:匕=凡+4丫“+万2丫〃+%,(,=12・一,〃)作回归分

析,要求:⑴求出未知参数戊),四,人的最小二乘估计量A,R,A:

(2)求出随机误差项〃的方差小的无偏估计量;

(3)对样本回归方程作拟合优度检验;

(4)对总体回归方程的显著性进行尸检验;

(5)对修,为的显著性进行,检验;

(6)当X。=(1,XQ,X2O)'时,写出E(y°IX。)和Yo的置信度为95%的预测区间。

3-21.下表给出三变量模型的回归结果:

方差来源平方和(SS)自由度(d.f.)平方和的均值(MSS)

来自回归65965——

来自残差——————

总离差(TSS)6604214

要求:(1)样本容量是多少?

(2)求RSS?

(3)ESS和RSS的自由度各是多少?

(4)求穴2和江?

(5)检验假设:X?和X3对丫无影响。你用什么慢设检验?为什么?

(6)根据以上信息,你能否确定X2和X3各自对y的贡献吗?

第8页共19页

编号:

时间:2021年X月X日书山有路勤为径,学海无涯苦作舟页码:第9页共19页

3-22.下面给出依据15个观察值计算得到的数据:

P=367.693,X2=402.760,又3=8.0,=66()42269

2名=84855.096,=280.0,y,.x2/=74778.346

Z.V/3,=4250.9,Z%,%=4796.0

其中小写字母代表了各值与其样本均值的离差。

要求:(1)估计三个多元回归系数;

(2)估计它们的标准差;并求出心与诃f

(3)估计4、B395%的置信区间;

(4)在0=5%下,检验估计的每个回归系数的统计显著性(双边检验);

(5)检验在a=5%下所有的部分系数都为零,并给出方差分析表。

3-23.考虑以下方程(括号内为估计标准差):

W=8.562+0.364P+0.004e।-2.56(乜

(0.080)(0.072)(0.658)〃=19R2=0.873

其中:W——r年的每位雇员的工资和薪水

P——1年的物价水平

U-----1年的失业率

要求:(1)对个人收入估计的斜率系数进行假设检验;(尽量在做本题之前不参考结果)

(2)讨论与_1在理论上的正确性,对本模型的正确性进行讨论:是否应从方程中

删除?为什么?

3-24.下表是某种商品的需求量、价格和消费者收入十年的时间序列资料:

年份12345678910

需求591965456236064700674006444068000724007571070680

价格23.5624.4432.0732.4631.1534.1435.3038.7039.6346.68

收入762091201067011160119001292014340159601800019300

要求:(I)己知商品需求量丫是其价格占和消费者收入X2的函数,试求y对看和X2的最

小二乘回归方程:+Ax2

(2)求y的总变差中未被X1和X2解释的部分,并对回归方程进行显著性检验;

第9页共19页

编号:

时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第1。页共19页

(3)对回归参数自,区进行显著性,检验。

3-25.参考习题2-28给出的数据,要求:

(1)建立一个多元回归模型,解释MBA毕业生的平均初职工资,并且求出回归结果;

(2)如果模型中包括了GPA和GMAT分数这两个解释变量,先验地,你可能会遇到什么

问题,为什么?

(3)如果学费这一变量的系数为正、并且在统计上是显著的,是否表示进入最昂贵的商业

学校是值得的。学费这个变量可用什么来代替?

3-26.经研究发现,学生用于购买书籍及课外读物的支出与本人受教育年限和其家庭收入水

平有关,对18名学生进行调查的统计资料如下表所示:

学生购买书籍及课外受教育年限家庭月可支配收

序号读物支出y(元/(年)入X2(元/月)

1450.54171.2

2507.74174.2

3613.95204.3

4563.44218.7

5501.54219.4

6781.57240.4

7541.84273.5

8611.15294.8

91222.110330.2

10793.27333.1

11660.85366.0

12792.76350.9

13580.84357.9

14612.75359.0

15890.87371.9

161121.09435.3

171094.28523.9

181253.010604.1

要求:

(1)试求出学生购买书籍及课外读物的支出丫与受教育年限X1和家庭收入水平X2的估计

的回归方程:9=6)+6/+Ax2

第10页共19页

编号:

时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第11页共19页

(2)对用,四的显著性进行t检验;计算心和4;

(3)假设有一学生的受教育年限占=10年,家庭收入水平X2=480元/月,试预测该学生全

年购买书籍及课外读物的支出,并求出相应的预测区间(a=0.05)。

3-27.根据100对(王,丁)的观察值计算出:

=12Z封=-9ZV=3()

要求:

(1)求出一元模型y=&+分内+〃中的用的最小二乘估计量及其相应的标准差估计量;

(2)后来发现y还受它的影响,于是将一元模型改为二元模型y=a°+a2x24-v,

收集/的相应观察值并计算出:

Z君=62七卞=8=2

求二元模型中的%,%的最小二乘估计量及其相应的标准差估计量:

(3)一元模型中的以与二元模型中的用是否相等?为什么?

3-28.考虑以下预测的回归方程:

Y1=-120+0.10G+5.33RS示’=0.50

其中:Y,---第t年的玉米产量(蒲式耳/亩)

F,——第t年的施肥强度(磅/亩)

RS,——第t年的降雨量(英寸)

要求归I答下列问题:

(1)从尸和RS对丫的影响方面,说出本方程中系数0.10和5.33的含义;

(2)常数项-120是否意味着玉米的负产量可能存在?

(3)假定〃厂的真实值为0.40,则估计值是否有偏?为叶么?

(4)假定该方程并不满足所有的占典模型假设,即并不是最佳线性无偏估计值,则是否意

味着历es的真实值绝对不等于5.33?为什么?

3-29.已知线性回归模型Y=X5+U式中U〜(0,cr2I),〃-13且〃一3(〃为样木

第11页共19页

编号:

时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第12页共19页

容量,攵为参数的个数),由二次型(Y-XB)'(Y-X8)的最小化得到如下线性方程组:

■+2氐+A=3

2或+5A+/3=9

方+A+6A=-8

要求:(1)把问题写成矩阵向量的形式;用求逆矩阵的方法求解之;

(2)如果Y'Y=53,求才\

(3)求出力的方差一协方差矩阵。

3-30.已知数据如下表:

YXiX?

1110

329

835

1541

285-6

要求:(1)先根据表中数据估计以下回归模型的方程(只估计参数不用估计标准差):

X=«(1+«k.

y(=4)+^2X2i“2i

■儿孙+%

(2)回答下列问题:%吗?为什么?友二为吗?为什么?

(四)自我综合练习类题型

3-31.自己选择研究对象(最好是一个实际经济问题),收集样本数据,应用计量经济学软件

(建议使用Eviews3.1),完成建立多元线性计量经济模型的全过程,并写出详细研究报告。

第12页共19页

编号:

时间:2021年X月X日书山有路勤为径,学海无涯苦作舟页码:第13页共19页

四、习题参考答案

(-)基本知识类题型

3-1.解释下列概念

(1)在现实经济活动中往往存在一个被解释变量受到多个解释变量的影响的现象,

表现为在线性回归模型中有多个解释变量,这样的模型被称为多元线性回归模型,多元

指多个解释变量。

(2)形如XY=XrXB的关于参数估计值的线性代数方程组称为正规方程组。

3-2.答:变量非线性、系数线性;变量、系数均线性;变量、系数均线性;变量线

性、系数非线性;变量、系数均为非线性;变量、系数均为非线性;变量、系数均为线

性。

3-3.答:多元线性回归模型与一元线性回归模型的区别表现在如下几方面.:一是解

释变量的个数不同:二是模型的经典假设不同,多元线性回归模型比一元线性回归模型

多了“解释变量之间不存在线性相关关系”的假定;三是多元线性回归模型的参数估计

式的表达更复杂;

3-4.在多元线性回归模型中,参数的最小二乘估计量具备线性、无偏性、最小方差

性,同时多元线性回归模型满足经典假定,所以此时的最小二乘估计量是最优的线性无

偏估计量,又称BLUE估计量。对于多元线性回归最小二乘估计的正规方程组,

3-5.答:多元线性回归模型的基本假定有:零均值假定、随机项独立同方差假定、

解释变量的非随机性假定、解释变量之间不存在线性相关关系假定、随机误差项叫服从

均值为0方差为b?的正态分布假定。在证明最小二乘估计量的无偏性中,利用了解释

变量与随机误差项不相关的假定:在有效性的证明中,利用了随机项独立同方差假定。

3-6.答:区间估计是指研究用未知参数的点估计值(从一组样本观测值算得的)作

为近似值的精确程度和误差范围。

(二)基本证明与问答类题型

3-7.答:含有待估关系估计量的方程组称为正规方程组。

正规方程组的非矩阵形式如下:

第13页共19页

编号:

时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第14页共19页

Z、一Z(6。+瓦"•+A%+…+A见)=。

Xy/厂Z(6。+AA+Az+…+BkX”=0

Ey/2,-E(A+6屈+"+•,•+pkxki)x2.=0

2%几-2(6。+B\&i+B6”+…+A与M产o

正规方程组的矩阵形式如下:

X'Y=XrXB

推导过程略。

3-16.解:

(1)证明:由参数估计公式可得下列参数估计值

Z,2i(%一上2i)Z*2/3i

苫/5-以)Z4

Z君Z±2#3i

Z、2/3iZ3li

Z4Z*2*3i

Z*2r*3i£文3

Z,

Z居Z*2/3i

Z比2i比3iZ痣Z比2/31z君

A人-i

._2*2/3,£心(»「心)

%一

Z居Z*2/3i

2*2/3,

z麓z月仆,Z-4

Z&*3,Zi

2以均Z*3』

Z居ZMZ土2&

Z*2j*3i

ZX2iX3iZ将

=A

第14页共19页

编号:

时间:2021年X月X日书山有路勤为径,学海无涯苦作舟页码:第15页共19页

=y-X-a2x2-匹3元3

=y-(1+d)x-

22ayx3

=AA&一而3

=A

证毕。

⑵证明:

4二必一々『一«一42々:一左3当,

=y,-a[-(\+a2)x2i-a3x3i

=y,~P\~PlX2i~^3X3i

A

=%

证毕。

⑶设:Zj=%f

I式的拟合优度为:

R2-黑£(x-J5)2

n式的拟合优度为:

R2]ESS、»中

2TSSZG-彳/

在⑵中已经证得e=可成立,即二式分子相同,若要模型II的拟合优度R;小于模型

i的拟合优度耳,必须满足:>2(马一刃2<»',一»。

3-17.答:

⑴方程B更合理些。原因是:方程B中的参数估计值的符号与现实更接近些,如与

日照的小时数同向变化,天长则慢跑的人会多些;与第二天需交学期论文的班级数成反

向变化,这一点在学校的跑道模型中是一个合理的解释变量。

⑵解释变量的系数表明该变量的单位变化在方程中其他解释变量不变的条件下对被

解释变量的影响,在方程A和方程B中由于选择了不同的解释变量,如方程A选择的

是“该天的最高温度”而方程B选择的是“第二天需交学期论文的班级数”,由此造成X2

与这两个变量之间的关系不同,所以用相同的数据估计相同的变量得到不同的符号。

第15页共19页

编号:

时间:2021年X月X日书山有路勤为径,学海无涯苦作舟页码:第16页共19页

3-18.答:

将模型⑴改写成(%-2zJ=a+您+%,则p的估计值为:

方一君(,一2zp

p~

将模型⑵改写成£=a+〃(七一zp+w-,则p的估计值为:

\?七一4一5+乞)2

这两个模型都是三变量回归模型⑶在某种限制条件卜.的变形。如果限制条件正确,则前

两个回归参数会更有效;如果限制条件不正确则前两个回归参数会有偏。

3-19.答:

⑴答案并不唯一,猜测为:X1为学生数量,X2为附近餐厅的盒饭价格,X3为气温,

X,为校园内食堂的盒饭价格;

⑵理由是被解释变量应与学生数量成正比,并且应该影响显著;与本食堂盒饭价格

成反比,这与需求理论相吻合;与附近餐厅的盒饭价格成正比,因为彼此是替代品;与

气温的变化关系不是十分显著,因为大多数学生不会因为气温升高不吃饭。

(三)基本计算类题型

3-22.解:⑴

A二Zy/2,Z舄一Z)'/3iZ//3>

Z4Z4-Z2/Z0/

74778.346x280-4250.9x4796.0

84855.096x280-4796.02

550620

=757810

=0.7266

第16页共19页

编号:

时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第17页共19页

A

A=

ZZ4-Z心/Z2/

4250.9x84855.096-74778.346x4796.0

84855.096x28()-4796.()2

2073580

-757810

=2.7363

=367.693-0.7266x402.760-2.7363x8.0

=53.1572

2)';—Ay0-AME,

o_Z〃_13_ZZ15-3Z

66042.269-0.7266x74778.346-2.7363x4250.9

~12

=6.3821

se(夕।)=加叭四)=—xAxer2=12.768

15

干xZKi+千xE&-2欢XWX/3i

其中:A=

Z名XX3i~ZX2iX3iZX2iX3i

同理,可得:5^(/?,)=0.0486,%(屈)=0.8454

拟合优度为:心』冢落".颊g

=1-(1-/?2)-^^=0.9986

n-k

⑶d.f.=12,a=5%,查表得P(|/|<2.179)=0.95

-2.179<-7266一分<2.179,得到0.6207<^<0.8325

0.0486~

-2.179<27363-/<2.179,得到0.8%2</3.<4.5784

0.8454

.•.用95%的置信区间为:0.6207</32<0.8325,

用95%的置信区间为:0.8942<又<4.5784

第17页共19页

编号:

时间:2021年X月X日书山有路勤为径,学海无涯苦作舟页码:第18页共19页

(4)”0:Bt=0,(/=1,2,3),乩:B尸0

a=5%(双边),c/.f=15-3=12查表得临界值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论