版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
应用回归分析(1-4章习题详解)
(21世纪统计学系列教材,第二(三)版,何晓群,
刘文卿编著中国人民大学出版社)
目录
1回归分析概述...................................................................6
1.1变量间统计关系和函数关系的区别是什么?................................6
1.2回归分析与相关分析的区别与联系是什么?................................7
1.3回归模型中随机误差项£的意义是什么?..................................7
1.4线性回归模型的基本假设是什么?.........................................7
1.5回归模型的设置理论根据是什么?在回归变量设置中应该注意哪些问题?....8
1.6收集,整理数据包括哪些内容?...........................................8
1.7构造回归理论模型的基本根据是什么?....................................9
1.8为什么要对回归模型进行检验?...........................................9
1.9回归模型有哪几个方面的应用?..........................................10
1.10为什么强调运用回归分析研究经济问题要定性分析和定量分析相结合?......10
2一元线性回归.................................................................10
2.1一元线性回归模型有哪些基本假定?......................................10
2.2考虑过原点的线性回归模型yr力*+=误差昂,心,..£,仍满
足基本假定,求尸।的最小二乘估计。.........................................11
2.3证明£x,e=o..............................................................................................ii
/=1t=l
2.4回归方程E(),)=/3+的参数AA的最小二乘估计与最大似然估计在什
么条件下等价?给出理由?...................................................12
2.5证明p是p的无偏估计。............................................12
一2
2.6证明丫2「(尸;)=(工+“/_2)/成立。...............................13
2.7证明平方和分解式SST=SSR+SSE......................................................................................13
2.8验证三种检验的关系,即证:...........................................14
—2
2.9验证式子:var(e)=(1-工一(二[-))..........................................................15
1n2
2.10用第9题证明是0?的无偏估计。...........16
2,F
2.11验证决定系数厂与F之间的关系式:厂-=---.....................17
'F+n-2
2.12如果把自变量观测值都乘以2,回归参数的最小二乘估计尸;和尸;会发生什么
变化?如果把自变量观测值都加上2,回归参数的最小二乘估计尸;和尸;会发生什么
变化?.....................................................................18
2.13如果回归方程:3=0。+万;x相应的相关系数r很大,则用它预测时预测误差
一定较小,这一结论能成立吗?对你的回答说明理由。.........................20
2
2.14为了调查某广告对销售收入的影响,某商店记录了5个月的销售收入y(万元)和
广告费用x(万元)..........................................................20
表2.6..........................................................................20
1)利用SPSS软件,散点图为:..........................................21
2)由图易知:x与y之间大致呈现线性关系。.............................22
3)最小二乘估计得到的回归方程为:.....................................22
4)求回归标准误差2;.................................................23
5)给出尸。与尸;的置信度为95%的区间估计;...........................23
6)x与y的决定系数;..................................................24
7)由SPSS软件可以得到回归方程作方差分析为:.........................24
8)对回归系数)।显著性的检验..........................................24
9)做相关系数的显著性检验.............................................24
10)对回归方程作残差图并作相应的分析;................................25
11)对当广告费用为4.2万元时,销售收入将达到多少,并给出置信度95%的置信
区间。.................................................................25
2.15一家保险公司十分关心其总公司营业部加班的程度,决定认真调查一次现状,经
过10周时间,收集了每周加班工作时间的数据和签发的新保单数目,x为每周签发的
新保单数目,Y为每周加班工作时间(小时)...................................26
1)画散点图;..........................................................26
2)x与y之间是否大致呈线性关系?.....................................27
3)用最小二乘估计求出回归方程;.......................................27
A
4)求回归标准误差0;.................................................27
5)给出口。与尸।的置信度为95%的区间估计;...........................28
6)计算x与y的决定系数;.............................................28
7)对回归方程作方差分析;.............................................28
8)对回归系数)।显著性的检验;........................................29
9)做相关系数的显著性检验;...........................................29
10)对回归方程作残差图并作相应的分析;................................29
11)该公司预计下一周签发新保单工。=100°张,需要加班的时间是多少?……30
12)给出>。的置信水平为95%精确预测区间和近似预测区间;..............30
13)给出E(丫。)置信水平95%的区间估计。..............................30
2.16,表2.8是1985年美国50个州和哥伦比业特区公立学校中教师的人均年工资y
(美元)和学生的人均经费收入x(美元)。....................................30
1)绘制y对x的散点图,可以用直线回归描述两者之间的关系吗?.........31
2)建立y对x的线性回归;.............................................32
3
3)用线性回归的Plots功能绘制标准残差的直方图和正态概率图,检验误差项的
正态性假设。...........................................................32
3多元线性回归..................................................................34
3.1写出多元线性回归模型的矩阵表示形式,并给出多元线性回归模型的基本假设。
............................................................................34
3.2讨论样本容量n与自变量个数p的关系,它们对模型的参数估计有何影响?……35
a=----SSE2
3.3证明n-p-\是误差项b的无偏估计。.......................35
2
3.4一个回归方程的复相关系数R=0.99,样本决定系数R=0.9801我们能判断这个回
归方程就很理想吗?........................................................35
3.5如何正确理解回归方程显著性检验拒绝Ho,接受Ho?...................36
3.6数据中心化和标准化在回归分析中的意义是什么?.........................36
八*用A
3.7验证(3.5)式〜...................................36
八2一八3匕3
r12,3
3.8利用(3.60)式证明(3.61)式成立,即..........37
3.9证明y与自变量电的偏决定系数与(3.42)偏F检验值厂,是等价的。.....37
R=--------------------
3.10验证决定系数R2与F值之间的关系式:F+Oz-p-l)p............38
3.11研究货运总量v(万吨)与工业总产值..................................38
1)计算出y,x1,x2,x3的相关系数矩阵.................................39
2)求y关于x1,x2,x3的三元线性回归方程............................40
3)对所求的的方程作拟合优度检验.......................................41
4)对回归方程做显著性检验.............................................41
5)对每个回归系数做显著性检验.........................................42
6)将x3剔除后,进行回归分析得........................................42
7)有上述系数表可知,常量的95%置信区间为(-821.547,-97.700).......43
8)求标准化回归方程...................................................43
9)求当Xoi=75,XO2=42,%03=土1时的〉。,给定置信水平为95%,用SPSS
软件计算精确置信区间,用手工计算近似预测区间;.......................44
10)结合回归方程对问题作一些基本分析。................................44
4违背基本假设的情况...........................................................45
4.1试举例说明产生异方差的原因。.........................................45
4.2异方差带来的后果有哪些?............................................45
4.3简述用加权最小二乘法消除一元线性回归中异方差性的思想与方法。......45
4.4简述用加权最小二乘法消除多元线性回归中异方差性的思想与方法。.......46
4
4.5(4.5)式一元加权最小二乘回归系数估计公式。............................47
4.6验证(4.8)式多元加权最小二乘回归系数估计公式。......................47
4.7有同学认为当数据存在异方差时,加权最小二乘回归方程与普通最小二乘回归方程
之间必然有很大的差异,异方差越严重,两者之间的差异就越大。你是否同意这位同学
的观点?说明原因。........................................................48
4.8对例4.3的数据,用公式‘加=匹弓”计算出加权变换残差e*,绘制加权变换残
差图,根据绘制出的图形说明加权最小二乘估计的效果。......................48
4.9表4.12是用电高峰期每小时用电量y与每月总用电量x的数据。...........49
1)用普通最小二乘法建立y与x的回归方程,并画出残差散点图;.........50
2)诊断该问题是否存在异方差...........................................51
3)如果存在异方差,用幕指数型的权函数建立加权最小二乘回归方程......52
4)用方差稳定变换V=6消除异方差....................................53
4.10试举一可能产生随机误差项序列相关的经济例子。........................55
4.11序列相关性带来的严重后果是什么?.....................................55
4.12结DW检验的优缺点。...................................................56
4.13表4.13为某软件公司月销售额数据,其中,x为总公司的月销售额(万元);y
为某分公司的月销售额(万元)。..............................................56
1)用普通最小二乘法建立y关于x的回归方程.............................57
2)用残差图及DW检验诊断序列的相关性..................................57
3)用迭代法处理序列相关,并建立回归方程...............................58
4)用一阶差分法处理数据,建立回归方程.................................60
5)比较普通最小二乘法所得回归方程和迭代法,一阶差分法所建立回归方程的优
良性....................................................................61
4.14某乐队经理研究其乐队CD盘的销售额(y),两个有关的影响变量是每周演出场次
............................................................................63
1)用普通最小二乘法建立y与1和的回归方程,用残差图及DW检验诊断序
列的自相性.............................................................64
2)用迭代法处理序列相关,建立回归方程.................................66
3)用一阶差分法处理序列相关,建立回归方程.............................66
4)用最大似然法处理序列相关,建立回归方程.............................67
5)用科克伦-奥克特迭代法处理序列相关,建立回归方程...................68
6)用普莱斯-温斯登迭代法处理序列相关,建立回归方程...................68
7)比较以上各方法所见回归方程的优良性。...............................69
4.15说明引起异常值的原因和消除异常值的方法。.............................70
5附注..........................................................................71
5
1回归分析概述
1.1变量间统计关系和函数关系的区别是什么?
答:变量间的统计关系指的是:在推断统计中,我们把变量间具有密切关联而又
不能由一个或某一些变量唯一确定另外一个变量的关系成为变量间的统计关系。
而函数关系指的是一个变量的变化能完全确定另一个变量的变化。
1.2回归分析与相关分析的区别与联系是什么?
答:区别:回归分析和相关分析相互结合,相互渗透但又有不同。他们之间的
区别见下表:设X,Y为变量,
回归分析相关分析
Y是因变量(被解释变量),X是自变X,Y地位平等
量(解释变量)
Y是随机变量,X可以是随机变量也可X,Y都是随机变量
以是普通变量
回归分析不仅可以揭示变量X对变量Y相关分析的研究主要是为刻画两类变
的影响大小,还可以由回归方程进行预量间线性相关的密切程度
测与控制。
联系:回归分析和相关分析都是相关关系(统计关系),即:两个变量间虽然有
密切的联系但他们的密切程度并没有到由一个可以完全确定另一个的程度。回归
分析和相关分析都是研究变量间关系的统计学课题。
1.3回归模型中随机误差项£的意义是什么?
答:回归模型的一般形式为:y=/(的,无,…,汨,)+£其中随机变量y称为被解释
变量(因变量);为,无,…与成为解释变量(自变量)。为一
般变量落,无,…无,的确定性关系,为随机误差。
回归模型中随机误差项£的意义是:正是因为随机误差项£的引入,才将变量之
间的关系描述为一个随机方程,使得我们可以借助随机数学方法研究y与
为,%2,…%的关系。
1.4线性回归模型的基本假设是什么?
答:线性回归模型的基本假设为:
1)解释变量为J2,…,匹,是确定性变量,不是随机变量,样本容量的个数应大于
解释变量的个数。
2)随机误差项具有0均值和等方差,即
<cov(g,巳)=b,(i=j)这个假定常称为高斯-马尔科夫条件。
cov(^.,£-.)=o,(j=j)i,j=1,2,...,M
E(&)=0,即假设观测值没有系统误差,随机误差&的平均值为零。随机误差
项2的协方差为零表明随机误差项在不同的样本点之间是不相关的(在正态假
定下即为独立的),不存在序列相关,并且有相同的精度。
3),正态分布的假定条件为:
2
Zj~N(O,b),1=1,2,...,〃
8,&,“&相互独立
4)通常为了便于数学上的处理,还要求n>p,即样本容量的个数要多于解释变量
的个数。
1.5回归模型的设置理论根据是什么?在回归变量设置中应该注意
哪些问题?
答:回归模型的设置理论依据是:要根据所研究问题的目的设置因变量y,然后
再选取与y有统计关系的一些变量作为自变量。
变量设置中应注意的问题:1)变量的正确选择关键在于能否正确把握所研究的
经济活动的经济学内涵。即药酒研究者对所研究的经济问题及背景要有足够的了
解。2)对于一些从经济关系角度考虑非常重要的需要引进,但在实际中并没有
这样的统计数据的变量,应该考虑用相近的变量代替,或者由其他儿个指标复合
成一个新指标。3)在选择变量时要注意与一些专门领域的专家合作。4)一个回
归模型中并不是所涉及的解释变量越多越好。
1.6收集,整理数据包括哪些内容?
答:1)回归模型的建立是基于回归变量的样本统计数据。当确定好回归模型的
8
变量之后,就要对这些变量收集,整理统计数据。
2)数据的收集是建立经济问题回归模型的重要一环,是一项基础性工作,样本
数据的质量如何,对回归模型的水平有至关重要的影响。
3)常用的样本数据分为时间序列数据和横截面数据。
①时间序列数据是按时间顺序排列的统计数据。研究宏观经济问题,这方面的时
间序列数据来自国家统计局或一些专业部委的统计年鉴。如果研究微观经济现
象,如研究某企业的产值与能耗,那么数据就要在这个企业的计划统计科获取。
对于收集到的时间序列资料要特别注意数据的可比性与数据的统计口径问题。对
于没有可比性和统计口径计算不一致的统计数据要作认真调整,这个调整过程就
是一个数据整理过程。
由于许多经济变量的前后期之间总是有关联的,因此时间序列数据容易产生模型
中随机误差项的序列相关。对于具有随机误差项序列相关的情况,就要通过对数
据的某种计算整理来消除序列相关性,最常用的处理方法是差分法。
②横截面数据是在同一时间截面上的统计数据。由于一个回归模型往往涉及众多
解释变量,如果其中某一因素或一些因素随着解释变量观测值的变化而对被解释
变量产生不同影响,就产生异方差。因此当用截面数据作样本时,容易产生异方
差。对于具有异方差性的建模问题,数据整理就是注意消除异方差性,这常与模
型参数估计方法结合起来考虑。
③不论是时间序列数据还是横截面数据的手机,样本容量的多少一般要与设置的
解释变量数目相配套。
4)统计数据的整理中不仅要把一些变量数据进行折算,差分,甚至把数据对数
化,标准化等,有时还须注意剔除个别特别大或特别小的“野值”,有时需要利
用差值的方法把空缺的数据补齐。
1.7构造回归理论模型的基本根据是什么?
答:1)经济回归模型的建立,通常要依据经济理论和一些数理经济学结果。例
如研究的模型有某些具体的函数形式。
2)对于根据所获信息无法确定模型的形式时,此时采用不同的形式进行计算机模
拟,对于不同的模拟结果,选择较好的一个作为理论模型。
1.8为什么要对回归模型进行检验?
9
答:当模型的未知参数估计出来后,便初步建立了一个回归模型,建立回归模
型的目的是为了应用它来研究经济问题,但不能马上就用这个模型去作预测,控
制和分析,因为这个模型是否真正解释了被解释变量与解释变量之间的关系,必
须通过对模型的检验才能决定。
1.9回归模型有哪几个方面的应用?
答:归分析的应用非常广泛,例如在经济领域有广泛应用。1)矩阵理论和计算
机技术的发展为回归分析模型在经济研究中的应用提供了极大的方便。2)模型技
术在经济问题研究中的应用也在盛行起来。3)近年来,新的研究方法不断出现,
如非参数统计,自助法,刀切法,经验贝叶斯估计等方法都对法回归分析起着渗
透和促进作用。
由此回归模型技术随着它本身的不断完善和发展以及应用领域的不断扩大,将在
统计学中占有更重要的位置,也必将为人类社会的发展起着它独到的作用。
1.10为什么强调运用回归分析研究经济问题要定性分析和定量分析
相结合?
答:因为数理统计方法只是从事物外在的数量表面上去研究问题,不涉及事物质
的规定性。单纯的表面上的数量关系是否反映事物的本质?这本质研究如何?必
须依靠专门学科的研究才能下定论。所以,在经济问题的研究中,我们不能仅凭
样本数据估计的结果就不加分析的说长道短,必须把参数估计的结果和具体经济
问题以及现实情况紧密结合,这样才能保证回归模型在经济问题研究中的正确运
用。
2一元线性回归
2.1一元线性回归模型有哪些基本假定?
答:1)解释变量为是确定性变量,不是随机变量。
2)随机误差项具有0均值和等方差,即
10
'E(&)=0,i=l,2,...,〃
-cov(g,£j)=b,a=))这个假定常称为高斯-马尔科夫条件。
、cov(g,£)=0,(i=j)z,j=1,2,...,n
E(&)=0,即假设观测值没有系统误差,随机误差&的平均值为零。随机误差
项&的协方差为零表明随机误差项在不同的样本点之间是不相关的(在正态假
定下即为独立的),不存在序列相关,并且有相同的精度。
3),正态分布的假定条件为:
口〜刈。,/),i=l,2,…,〃
£I,6*2,…相互独立
2.2考虑过原点的线性回归模型y=旦*y+£,,=1,2,...〃误差
&,&,…&,仍满足基本假定,求B、的最小二乘估计。
答:由题知离差平方和为:Q=Q(力)=X(y厂四*xj,则力的最小二乘估
/=!
计即是使得:。(夕:)=呼11。(笈)有:
A兽y*茏
■3";)=-2喏(y厂短兀解得:仇一善)
2.3证明£匕=。,£xe=o.
/=1i=l
心y,力力幻=。
证明:由正规方程:{7以及残差:
〔£(乂-尸;-夕;短升=°
1=1
由以上等式解得:£&=。,£乂匕=0・
/=1/=1
11
2.4回归方程次〉)=6+力]的参数国,力的最小二乘估计与最大似
然估计在什么条件下等价?给出理由?
答:回归方程E(y)=力,+力工的参数方。,力的最小二乘估计与最大似然估计
在2~N(o,b)的条件下等价。
证明:设获得的n组样本观测值为:(M,y),…,(x“,y“)则有:
y=p+力%+力=1,2,...〃则求讥平、的最小二乘估计就是满足使
。(民,刃这(y]20—达到最小时的尸;,尸;。即对
»=1
。(四£)=t(y]夕o-万而求极小值。
/=1
对于极大似然估计,当&~N(0,b")时,y~+/?]打0"2)
1(丫厂。
y的分布密度为:00-01*
.—〜(y厂力0一0工。一
似然函数为一嫉力,.=口/=(2»02)2e-一万一
/=1%
对数似然函数为
1=1吐(万0,",/)=三皿2万/)一占£(%一60-万内)
22b,=|
要求尸。,力的极大似然估计,即求/的极大值,等价于对尸
求极大值。
由以上可知,在假设g〜N(0,f)时,氏,力的最小二乘估计与最大似然估计
等价。
2.5证明我是氏的无偏估计。
12
A1Z5
/J=豆—121乂
lXXJCXT
证明:氏,目的最小二乘估计分别为:〃_
iZ(X「x)
因为X,为非随机变量,y=0。+)4%j+&,i=l,2,…〃,
E(G=QE(y)=0o+0]x.,i=1,2,...,n
解得:4月;)=四则:
E(瓦)=E1y_0;x)=E(y)-xE(p)=民
得证。
一2
2.6证明var(尸)=(+“X_)0■成工。
〃
证明:因为X为非随机变量,y=B。+0访+£『=',2,…〃,则,var(y)=(Jo
var(区)=var(£(:(工[%))y)
Z=1IAX
-2—2__
空(二+0立—1.
I〃Ixx〃乙
-2
_(〃+4_2)cr
沁r)
2.7证明平方和分解式SST=SSR+SSE.
证明:
13
s"4(%——y)2,
n2_2__
4((%—靖)+(靖—y)+2(y-y)(y:->))
唔37)苜(靖%+雪产)(-
n2n—2
2(%->;)+“D
=SSE+SSR
2.8验证三种检验的关系,即证:
t=£Jk=^L
1-尸
F_ssR,n
~SSE/(n-2)
证明:
(1)
14
_D\lxx_P\xx
~A2-1~
cry:
〃-2-e匕,
(〃-2)由Z
SST-SSR
(〃-2)四1
Li工;
(〃—2)夕z,九
,A2.I
因为:
由以上可证:
(2)
rSSR/\_(n-2)SSR
~SSE/(n-2)~-SSE
(”2)/j〃xx
iyyfjixx
IxxfjL
-^(lyy-lJ*2xx)
2
=t
——2
2.9验证式子:var(e,)=(l二-G^~~—^~)(y
XX
15
证明:
D(e)=o(y-y)
,
=D(y-y-^+/3]'X-y))
因为:$=8+px,D(X+r)=z)(x)+£>(y)+cov(x,y)
上式为:
D(e)=。(y~y)+D(夕:(x/x))-2cov(y-y/;(x/x))
2_2
=。一一友)+(y-*)彳-2cov(y-y,左(y-x))
CXX
因为:
一2
cov(y—y,尸](无-x))=
IXX
——2
代入得证:var(?)=(1」-(为尸))(f
nIXX
i”2
2.10用第9题证明:^叽力方⑵—靖)是b的无偏估计。
16
证明:
.1n2
=E(SSE)=EQSST-SSR)
下面分别计算E(SST)和E(SSR)
n—2
E(SST)=E(=(y厂y))
2—2
y;~nE(y)
Z=1
—2——2
E(y)=D(y)+(玖y))
=*为+府
E(SST)=(〃-1)4+夕Z
n—2
E(SSR)=Eg(y1_y))
=//(£:)
2
=1小券+仇)
CXX
将E(SST)和E(SSR)代入E(SSE)
得证:
0=口久一%)
2.11验证决定系数/,与F之间的关系式:d=」一
以上表达式说明,与F之间是等价的,那么我们为什么要分别引入这两个统计
量,而不是只使用其中一个?
17
2_SSR
T~SSE+SSR
SSR(〃—2)
"SSR(n-2)+SSE(n-2)
、丁口口SSR(n-2)/SSE
址明:=--------:——:--------
SSR(n-2)/SSE+(n-2)
SSR/1
SSE/n-2
SSR/l"
-4-H-2
SSE/n-2
F
F+n-2
2
(2)虽然厂与F之间是等价的,但我们不能只使用其中的一个,因为这两个统
计量研究的对象和目的均有所不同。
1)统计量F是用来进行F检验,即对线性回归方程显著性的一种检验,即其研究
的是引起总平方和SST的两个因素SSR和SSE所占必中的多少,也就是如果回归
平方和SSR越大回归的效果越好,回归方程便更显著,F的数值大于1.
2)决定系数,=型是研究的总体的离差平方和SST中回归平方和SSR所占的
比重,即如果尸=型接近于1,说明因变量不确定性的绝大部分能由回归方程
解释,回归方程拟合优度就越好。另外决定系数尸=0里的数值在0与1之间。
2.12如果把自变量观测值都乘以2,回归参数的最小二乘估计
尸;和尸;会发生什么变化?如果把自变量观测值都加上2,回归参数
的最小二乘估计色和尸;会发生什么变化?
答:设开始时的n组观测值为:离差平方和为:
。(尸。力)4(丁厂总-尸1方)
a2
万。,力的最小二乘估计就是满足使。(尸。,力)=Z(y—尸()一四加)一达到最小
/=1
18
时的区£。即对。(四0)=£(%一为一户w)2求极小值。
/=1
裁依吻)=-2“「优十.二0
即:*出=B、)=-22。「优-优X)Xi=。
解得:
以=5
IXX
1)当自变量的观测值均乘以2时,此时的观测值为:(2x「y),...,(2x“,y“)离
差平方和即为:
。(四,笈)=£。厂40一2四加)2此时的回归参数戊,
满足:量呢=P>-2"「缁—2砧J=0
修出=。:)=-2*2g厂瑞-2万;Xi)Xi=0
解得:
孰"呼
2)当自变量的观测值都加上2时,即此时的观测值为:
((玉+2),X),…,((七,+2),y“)离差平方和为:
19
。(民,»)=£(%-A)-四(七+2))2此时的回归参数值,依
i=\
满足:^(氏=P>苔(y厂缁一/(七+2))2=0
箫(乃产")=-2*22(>厂缁—2为①+2))(玉+2)=。
解得:
陪-吁2)
C(x+2)(x+2)
2.13如果回归方程:,=及+/产相应的相关系数r很大,则用它预测
时预测误差一定较小,这一结论能成立吗?对你的回答说明理由。
答:这一结论不一定能成立。原因如有:
1)当样本量较小时,与前面在讲述相关系数时所强调的一样,此时即使得到一
个大的决定系数,但是这个大的决定系数很可能是虚假现象。为此,可以结合样
本量和自变量个数对决定系数做调整,计算调整的决定系数。
2)即使样本量并不小,决定系数很大,例如是0.9,也并不能肯定自变量和因
变量之间的关系是线性的,这是因为有可能曲线回归的效果更好。尤其是当自变
量的取值范围很窄时,线性回归的效果通常是较好的,这样的回归方程是不能用
于外推预测的。模型失拟检验来判定因变量与自变量之间的真实函数关系,到底
是线性关系还是曲线关系,如果是曲线关系到底是哪一种曲线关系,这是可以用
残差分析方法来判断回归方程的正确性。
3)反之,当算出一个很小的决定系数尸,例如J』时,与相关系数的显著性
检验相似,这时如果样本量n不大,就会得到线性回归不显著的检验结论,而在
样本容量n很大时,检验结果仍然会得出线性回归显著的结论,不论检验结果是
否显著,这时都应该尝试改进回归的效果,例如增加自变量,改用曲线回归等。
2.14为了调查某广告对销售收入的影响,某商店记录了5个月的销
售收入y(万元)和广告费用x(万元),数据见表2.6,
表2.6
20
月12345
份
X12345
y10102020
40
1)画散点图;
2)x与y之间是否大致呈线性关系?
3)用最小二乘估计求出回归方程;
4)求回归标准误差
5)给出尸;与尸;的置信度为95%的区间估计;
6)计算x与y的决定系数;
7)对回归方程作方差分析;
8)对回归系数才显著性的检验;
9)做相关系数的显著性检验;
10)对回归方程作残差图并作相应的分析;
11)对当广告费用为4.2万元时,销售收入将达到多少,并给出置信度95%的置
信区间。
答:
1)利用SPSS软件,散点图为:
21
X
2)由图易知:x与y之间大致呈现线性关系。
3)最小二乘估计得到的回归方程为:
由:
系数.
非标准化系数标准系数B的95.0%置信区间
模型B标准误差试用版tSig.下限上限
1(常量)-1.0006.351-.157.885-21.21119.211
X7.0001.915.9043.656.035.90613.094
a.因变量:y
可以得到回归方程为:y=-l+7x
另外:设回归方程为y=bo+P\x
AZx,一〃xy
。,=号----"
22
0o=y~/?]X=20—7x3=—1
同样.•.可得回归方程为y=T+7x
4)求回归标准误差cr;
模型汇总b
模型RR方调整R方标准估计的误差
1.904」.817.7566.05530
a.预测变量:(常量),X。
b.因变量:y
由以上可以知道:回归标准误差b=6.00530,1=6.00530*6.00530=36.0636,
另外:
A21nA2
。=—;£(»一必)
n-2M
(-1+7x1))2+(10-(-1+7x2)>+(20-(-1+7x3))2
§[+(20-(-1+7x4)>+(40-(-1+7x5))2
=#16+9+0+49+36]
=110/3
同样可得。
5)给出戊与尸;的置信度为95%的区间估计;
系数,
模型非标准化系数标准系数B的95.0%置信区间
B标准误差试用版tSig.卜限上限
1(常量)-1.0006.351-.157.885-21.21119.211
X7.0001.915.9043.656.035.90613.094
a.因变量:y
由以上可以知道:给出尸:与尸:的置信度为95%的区间估计分别为:(0.906,
13.094)(-21.211,19.211)
23
6)x与y的决定系数;
模型汇总"
更改统计量
模型R方更改F更改dfldf2Sig.F更改
1.81713.36413.035
由SPSS软件,可以知道x与y的决定系数为:d=0817
7)由SPSS软件可以得到回归方程作方差分析为:
Anovab
模型平方和df均方FSig.
1回归490.0001490.00013364.035,
残差110.000336.66
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 报废车辆协议书大全
- 出租房子意外免责协议合同
- 2024年度电商行业发展战略合同
- 二零二四年度企业数字化转型战略规划合同
- 二零二四年度仪器设备租赁合同
- 店面分割协议书
- 二零二四年度品牌授权使用合同标的及相关权利义务
- 矸石运输路线规划合同2024版
- 二零二四年度诊所医疗废物回收处理服务合同
- 二零二四年度技术开发合作保密协议
- 《消防安全常识培训》课件
- 《汽车故障诊断技术》考试复习题库(含答案)
- 2024-2030年中国食品安全行业运营模式及发展战略规划分析报告
- 2024-2030年中国蓝宝石基片行业供需趋势及发展风险研究报告
- (统编版2024)语文七年级上册 第四单元 《阅读综合实践 》 课件(新教材)
- 2024粤东西粤北地区教师全员轮训培训心得总结
- 水厂运行质量控制管理规程
- 国外表面活性剂名称
- 水蒸汽热力学
- 旅行社低价竞争问题的分析与思考
- 国家免费艾滋病抗病毒治疗药品管理指导意见
评论
0/150
提交评论