应用回归分析-课后习题答案-何晓群_第1页
应用回归分析-课后习题答案-何晓群_第2页
应用回归分析-课后习题答案-何晓群_第3页
应用回归分析-课后习题答案-何晓群_第4页
应用回归分析-课后习题答案-何晓群_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章一元线性回归

2.14解答:(1)散点图为:

4000000-

35.00000-

30.00000-

2500000-

20.00000-

1500000-

1000000-

1.000002.000003.000004.000005.00000

(2)x与y之间大致呈线性关系。

(3)设回归方程为;=A+'x

------—=7

^A;2-n(x)2

i=l

0o=y-P\X=20-7x3=7

.•.可得回归方程为y=-1+7x

2

Az|nA

(4)。二商自"一工)

IAA

=/2(丫-(为+4切

1(10-(-1+7x1))24-(10-(-1+7x2))2+(2O-(-1+7X3))2

3[+(20-(-1+7x4))2+(40-(-1+7X5))2

1[16+9+0+49+36]

~3

=110/3

er=—J330x6.1

3

(5)由于/N(4早)

《一仇欣-伊国

卜/4CT

服从自由度为n-2的t分布。因而

PW巧国1<心(〃-2)=1-

也即:P(6]_%2-^=</<4+%2=\-a

\!Lxx

可得力的置信度为95%的置信区间为(7-2.353x;;7+2.353X』届)

3

即为:(2.49,11.5)

A1(vV

BoN(Bo,(一+—[)/)

〃4

[二凤一又二A-4

一"一衣

服从自由度为n-2的t分布。因而

可得力的置信度为95%的置信区间为(-7.77,5.77)

_〃A-

Z(x-y)2

(6)x与y的决定系数,=卓--------=490/600«0.817

£(22

»=i

(7)

ANOVA

平方和df均方F显着性

组间(组合)9.00024.5009.000.100

线性项加权的8.16718.16716.333.056

偏差.8331.8331.667.326

组内1.0002.500

总数10.00()4

由于尸〉心(1,3),拒绝“。,说明回归方程显着,x与y有显着的线性关系。

A21«1"A

其中八百¥六百小一》)

7xVio=21

*3.66

户一而

"2.353

/=3.66>ta/2

二.接受原假设H°:川=0,认为4显着不为0,因变量y对自变量x的一元线性回归成立。

n--

^(七一初丫一)')T

i=l________________________=f

(9)相关系数

Fft-n-JJ

i=lr=l

707

=-^=k0.904

710x600V60

r小于表中a=1%的相应值同时大于表中二=5%的相应值,x与y有显着的线性关系.

(10)

序号X)'/Xe

y

111064

221013-3

3320200

442027-7

5540346

残差图为:

X与y散点图

5.00-

4.00-

3.00-

2.00-

1.00-

250.00500.00750.001000.001250.00

X

(2)x与y之间大致呈线性关系。

⑶设回归方程为),力/

人Zx一3(26370-21717)

0尸耳------=0.0036

方为2_心了(7104300-5806440)

i=\

饱=y-/产2.85-0.0036x762=0.1068

可得回归方程为y=0.1068+0.0036A:

A2|nA2

⑷B=—

n-2M

n-2仁

=0.2305

<7=0,4801

⑸由于N凶,》

J

\1//4a

服从自由度为n-2的i分布。因而

P|('-,)向|<心(〃-2)=l-a

也即:〃(反「a2~^=<夕|<4+如2-a

VAuv

可得B、的置信度为95%的置信区间为

(0.0036-1.860x0.4801/J1297860,0.0036+1.860x0.4801/"297860)

即为:(0.0028,0.0044)

A

AN(%(—+

n

[二凤一氏二:)一4

服从自由度为n-2的t分布。因而

可得力的置信度为95%的置信区间为(-0.3567,0.5703)

八.

V(y—V)2

//〃I✓-QOH97

(6)x与y的决定系数产=个---------=--------=0.908

2

i(yf-y)1&525

1=1

ANOVA

平方和df均方F显着性

组间(组合)1231497.5007175928.2145.302.168

线性项加权的1168713.03611168713.03635.222.027

偏差62784.464610464.077.315.885

组内66362.500233181.250

总数1297860.0009

由于尸>乙(1,9),拒绝说明回归方程显着,x与y有显着的线性关系。

11A

其中。F牙2二不?pYf)

0.0036x71297860

=8.542

0.04801

如2“895

1=8.542>j/2

••・接受原假设Ho:B\=0,认为4显着不为0,因变量y对自变量x的一元线性回归成立。

.——

2(七-x)(y-y)

i=1____________________________j

(9)相关系数r

I"一〃y_)'[~T"7-”

i=li=l

4653

=0.9489

71297860x18.525

r小于表中a=1%的相应值同时大于表中。=5%的相应值,;x与y有显着的线性关系.

(10)

X

序号人e

y

18253.53.07680.4232

221510.88080.1192

3107043.95880.0412

455022.0868-0.0868

548011.8348-0.8348

692033.4188-0.4188

713504.54.9688-0.4668

(11)新保单*=1000时,需要加班的时间为■=3.7小时。

(12)%的置信概率为的置信区间精确为或±心(〃-2)71工履。,

即为(2.7,4.7)

近似置信区间为:1±2。,即(2.74,4.66)

(13)可得置信水平为的置信区间为■土%2(〃-2)匹。,即为(3.33,4.07).

2.16(1)散点图为:

4500000-

4000000-

3500000-

A3000000-

25000.00-

2000000-

1500000-

4000006000.00

可以用直线回归描述y与x之间的关系.

⑵回归方程为:(=I2l12.629+3.314%

直力图

困变量:y

均的=-5.01616

林小%:,=0.99

N=51

-10123

网用标准化残差

Ml标准化残差的标准P・P图

0因变量:y

S

{

6

的0

66-

率4-

2-

lc

0.00.20.40.€0.81.0

观测的累枳概率

从图上可看出,检验误差项服从正态分布。

第三章多元线性回归

3.11解:(1)用SPSS算出y,xl,x2,x3相关系数矩阵:

相关性

yxlx2x3

Pearson相关性y1.000.556.731.724

xl.5561.000.113.398

x2.731.1131.000.547

x3.724.398.5471.000

y.048.008.009

xl.048378.127

x2.008.378.051

x3.009,127.051

Ny10101010

xl1()1()101()

x210101010

x310101010

/1.0000.5560.7310.724\

0.5561.0000.1130.398

所以户=0.7310.1131.0000.547

\0.7240.3980.5471.000/

系数"

模型标准系

非标准化系数数B的95.0%置信区间相关性共线性统汁量

B标准误差试用版tSig.下限上限零阶偏部分容差VIF

(常量)-348.28176.459-1.974.096-780.0683.500

00

xl3.7541.933.3851.942.100-.9778.485.556.621.350.8251.211

x27.1012.880.5352.465.049.05314.149.731.709.444.6871.455

x312.44710.569.2771.178.284-13.41538.310.724.433.212.5861.708

a.因变量:y

(2)

所以三元线性回归方程为$=-348.28+3.754x1+7.101x2+12.447x3

模型汇总

模型标准估计的更改统计量

RR方调整R方误差R方更改F更改dfldf2Sig.F更改

I|.898;,

.806.70823.44188.8068.28336

a.预测变量:(常量),x3,xl.x2o

(3)

由于决定系数R方=0.708R=0.898较大所以认为拟合度较高

(4)

Anovab

模型平方和df均方FSig.

1回归13655.37034551.7908.283.015"

残差3297.1306549.522

总计16952.5009

a.预测变量:(常量),x3,xl,x2。

b.因变量:y

因为F=8.283P=0.015<0.05所以认为回归方程在整体上拟合的好

(5)

系数,

模型非标准化系数标准系数B的95.0%置信区间相关性共线性统计量

B标准误差试用版tSig.下限上限零阶偏部分容差VIF

1(常-348.280176.459-1.974.096-780.D6083.500

量)

xl3.7541.933.3851.942.100-.9778.485.556.621.350.8251.211

X?710178802465049rm1414Q,7/p>

x312.44710.569.2771.178.284-13.41538.310,724.433.212.5861.708

a.因变量:y

(6)可以看到P值最大的是X3为0.284,所以X3的回归系数没有通过显着检验,

应去除。

去除x3后作F检验,得:

Anovab

模型平方和df均方FSig.

1回归12893.19926446.60011.117.007°

残差4059.3017579.900

总计16952.5009

a.预测变量:(常量),x2,xl。

b.因变量:y

由表知通过F检验

继续做回归系数检验

系数"

模型共线性统计

非标准化系数标准系数B的95.0%置信区间相关性量

B标准误差试用版tSig.下限上限零阶偏部分容差VIF

(常量)-459.624153.058-3.003.020-821.547-97.700

X14.6761.816.4792.575.037.3818.970.556.697.476.9871.013

x28.9712.468.6763.634.0083.13414.808.731.808.672.9871.013

a.因变量:y

此时,我们发现Xl,X2的显着性大大提高。

(7)X1:(-0.997,8.485)x2:(0.053,l4.149)x3:(-13.415,38.310)

=0.385x1*+0.535x2,+0.277x3’

(9)

残差统计量H

极小值极大值均演标准偏差N

预测值175.4748292.5545231.500038.9520610

标准预测值-1.4381.567.0001.00010

预测值的标准误差10.46620.19114.5263.12710

调整的预测值188.3515318.1067240.183549.8391410

残差-25.1975933.22549.3000019.1402210

标准残差-1.0751.417.000.81610

Student化残差-2.1161.754-.1231.18810

己删除的残差-97.6152350.88274-8.6834843.4322010

Student化已删除的残差-3.8322.294-.2551.65810

Mahal«距离,8945.7772.7001.55510

Cook的距离.0003.216.486.97610

居中杠杆值.099.642.300.17310

a.因变量:y

所以置信区间为(175.4748,292.5545)

(10)由于x3的回归系数显着性检验未通过,所以居民非商品支出对货运总量

影响不大,但是回归方程整体对数据拟合较好

3.12解:在固定第二产业增加值,考虑第三产业增加值影响的情况下,第一产

'也每增加一个单位,GDP就增加0.607个单位。

在固定第一产业增加值,考虑第三产业增加值影响的情况下,第二产业每增

加一个单位,GDP就增加1.709个单位。

第四章违背基本假设的情况

4.9解:

系数,

模型非标准化系数标准系数

B标准误差试用版1Sig.

1(常量)-.831.442-1.882.065

X.004.000.83911.030.000

a.因变量:y

由SPSS计算得:y=-0.83l+0.004x

残差散点图为:

散点图

因变量:y

2-

1-

回o-

差-1-

-3-

0.002.004.006.008.0010.0012.0014.00

(2)由残差散点图可知存在异方差性

再用等级相关系数分析:

相关系数

X1

Spearman的rhox相关系数1.000.318*

Sig.(双侧)*.021

N5353

t相关系数.318*1.000

Sig.(双侧).021•

N5353

*.在置信度(双测)为0.05时,相关性是显着的。

P=0.021所以方差与自变量的相关性是显着的。

(3)

模型描书

因变量y

自变量1x

权重源x

品值1.500

模型:MOD」.

M=1.5时可以建立最优权函数,此时得到:

ANOVA

平方和df均方FSig.

回归.0061.00698.604,000

残差.00351.000

总计.00952

系数

未标准化系数标准(匕系数

B标潴误试用版标准误tSig.

(常数)-.683.298-2.296.026

X.004.000.812.0829.930.000

所以:R-0.683+0.004X

(4)

系数a

模型非标准化系数标准系数

B标准误差试用版1Sig.

1(常量).582.1304.481.000

X.0CI.000.8059.699.000

a.因变量:yy

散点图

(|标

\

!

/

系数

标准

系数

准化

非标

模型

误差

标准

试用

1

B

Sig.

.000

-5.930

.242

-1.435

(常量

1

.000

8

107.92

.999

.002

.176

X

:y

变量

a.因

x

0.176

.435+

y=-l

(2)

汇总b

模型

计的误

标准估

模型

son

n-Wat

Durbi

调整R

R方

R

.09744

.999"

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论