应用回归分析作业_第1页
应用回归分析作业_第2页
应用回归分析作业_第3页
应用回归分析作业_第4页
应用回归分析作业_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

应用回归分析课后答案

第二章一元线性回归

2.14解答:EXCEL结果:

SUMMARYOUTPUT

回归统计

MultipleR0.944911

RSquare0.892857

AdjustedRSquare0.857143

标准误差0.597614

观测值5

方差分析

dfSSMSFSignificanceF

回归分析18.9285718.928571250.015392

残差31,0714290.357143

总计410

Coefficients标准误差tStatP-valueLower95%Upper95%下限95.0%上限95.0%

Intercept-0.214290.6962-0.307790.778371-2.42992.001332-2.42992.001332

XVariable10.1785710.03571450.0153920.0649130.292230.0649130.29223

RESIDUALOUTPUT

观测值预测Y残差

11.571429-0.57143

21.5714290.428571

33.357143-0.35714

43.3571430.642857

55.142857-0.14286

SPSS结果:(1)散点图为:

4而大虏

CENTRALSOUTHUNIVERSITY

40.00000-

35.00000-

30.00000-

A25.00000-

20.00000-

15.00000-

10.00000-

1.000002.000003.000004.000005.00000

(2)x与y之间大致呈线性关系。

(3)设回归方程为y=/o+%x

AZx,/一〃xy

01=耳-------=7

JX,.2-A?(X)2

i=l

Bo-y~x=20—7x3=—1

.,.可得回归方程为y=-l+7x

A2]』tA2

⑷cr=-2L(y-y,)

n-2公;

1nAA2

=-SU-(A+Ax))

1(10-(-1+7x1))2+(10-(-1+7x2))2+(20-(-1+7X3))2

3+(20-(-1+7x4))2+(40-(-1+7X5))2

=#16+9+0+49+36]

=110/3

4而大虏

CENTRALSOUTHUNIVERSITY

A(J

(5)由于分iN1/3\,——)

Lxx

A

(J

服从自由度为n-2的t分布。因而

PI""可5"2)=l-«

a

A(JA

也即:P(尸i—%/2rp~<B\<Bi+1a/2

VL*

A1------1,-----

可得4的置信度为95%的置信区间为(7-2.353x§而,7+2.353x-V33)

即为:(2.49,11.5)

A

AN(A,(—+

n

饱=B0-Bo

服从自由度为n-2的t分布。因而

可得A的置信度为95%的置信区间为(-7.77,5.77)

2

4而大虏

CENTRALSOUTHUNIVERSITY

nA-

(6)X与y的决定系数/=(....-=490/600«0.817

i=\

(7)

ANOVA

x

平方和df均方F显著性

组间(组合)9.00024.5009.000.100

线性项加权的8.16718.16716.333.056

偏差.8331.8331.667.326

组内1.0002.500

总数10.0004

由于歹〉吃(1,3),拒绝“°,说明回归方程显著,x与y有显著的线性关系。

2

1n1nA

其中<y2(%-%)

n-2i=ln—2i=l

7xV10%y3.66

V33

3

ta/2=2.353

t=3.66>tan

••・接受原假设"0:以=0,认为片显著不为°,因变量y对自变量x的一元线性回归成立。

n--

£(七一%)(%—y)L

(9)相关系数r=「=

In-〃-TT

也(x「x)2£(y「y)—

Vi=li=l

707

=^=-0.904

V10x600V60

r小于表中a=l%的相应值同时大于表中a=5%的相应值,,x与y有显著的线性关系.

3

4而大虏

CENTRALSOUTHUNIVERSITY

(10)

序号XyAe

y

111064

221013-3

3320200

442027-7

5540346

残差图为:

残差图

5.00-

2.50-

o.oo-

-2.50-

-5.00-

从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。

(11)当广告费%=4.2万元时,销售收入%=28.4万元,置信度为95%的置信区间

近似为9±22,即(17.1,39.7)

2.15解答:

(1)散点图为:

4

4而大虏

CENTRALSOUTHUNIVERSITY

x与y散点图

5.00-

4.00-

3.00-

2.00-

1.00-

250.00500.00750.001000.001250.00

X

(2)x与y之间大致呈线性关系。

(3)设回归方程为y=/o+2]X

A(26370-21717)

B'=i=l=0.0036

(7104300-5806440)

i=l

4=y—/x=2.85—0.0036x762=0.1068

可得回归方程为y=0.1068+0.0036%

人2]J、A2

(4)o

n-2氢

1nAA21

=FX(%—(/O+6I%))

n-2仁

5

4而大虏

CENTRALSOUTHUNIVERSITY

=0.2305

b=0.4801

A<y

⑸由于4Wr—)

(A-伊仄

A

a

服从自由度为n-2的t分布。因而

PI立冬①<J/2(〃-2)=l-a

a

A(JA

也即:PlB\-tan-r=<B]+ta/2

\^xx

可得%的置信度为95%的置信区间为

(0.0036-1.860x0.4801/71297860,0.0036+1.860x0.4801/71297860)

即为:(0.0028,0.0044)

A

ANRJ+

n

B。—Bo=片一片

6

4而大虏

CENTRALSOUTHUNIVERSITY

可得自的置信度为95%的置信区间为(-0.3567,0.5703)

16.82027

(6)x与y的决定系数r~==0.908

18.525

(7)

ANOVA

平方和df均方F显著性

组间(组合)1231497.5007175928.2145.302.168

线性项加权的1168713.03611168713.03635.222.027

偏差62784.464610464.077.315.885

组内66362.500233181.250

总数1297860.0009

由于/〉心(1,9),拒绝8°,说明回归方程显著,x与y有显著的线性关系。

0.0036xJ1297860

=8.542

0.04801

垃〃=1.895

t=8.542>ta/2

:.接受原假设H0:1=0,认为用显著不为0,因变量y对自变量x的一元线性回归成立。

n--

—%)(3—y)

(9)相关系数i=l

i=li=l

4653

=0.9489

-71297860x18.525

7

4而大虏

CENTRALSOUTHUNIVERSITY

r小于表中«=1%的相应值同时大于表中a=5%的相应值,,x与y有显著的线性关系.

(10)

序号XyAe

y

18253.53.07680.4232

221510.88080.1192

3107043.95880.0412

455022.0868-0.0868

548011.8348-0.8348

692033.4188-0.4188

713504.54.9688-0.4668

83251.51.27680.2232

967032.51880.4812

10121554.48080.5192

从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。

(11)新保单/=1000时,需要加班的时间为■=3.7小时o

(12)%的置信概率为ba的置信区间精确为,0±*2(〃-2)"兀/

即为(2.7,4.7)

近似置信区间为:y0±2a,即(2.74,4.66)

(13)可得置信水平为『a的置信区间为J土a2(〃-2)匹2,即为(3.33,4.07).

2.16⑴散点图为:

8

4而大虏

CENTRALSOUTHUNIVERSITY

45000.

40000.00-

30000.00-

25000.00-

20000.00-

15000.00-

2000.004000.006000.008000.00

X

可以用直线回归描述y与x之间的关系.

(2)回归方程为:J=12112.629+3.314%

(3)

直方图

9

4而大摩

CENTRALSOUTHUNIVERSITY

回归标准化残差的标准P-P图

因变量:y

1.0-

0.8-

望0.6-

率0.4-

0.2-

IIIIII

0.00.20.40.60.81.0

观测的累积概率

从图上可看出,检验误差项服从正态分布。

第三章多元线性回归

3.11初始数据:

编号yxlx2x3

116070351

226075402.4

321065402

426574423

524072381.2

622068451.5

727578424

816066362

927570443.2

1025065423

10

4而大虏

CENTRALSOUTHUNIVERSITY

解:(1)用SPSS算出y,xl,x2,x3相关系数矩阵:

相关性

yxlx2x3

Pearson相关性y1.000.556.731.724

xl,5561.000.113.398

x2.731.1131.000.547

x3.724.398.5471.000

y.048.008.009

xl.048.378.127

x2.008.378.051

x3.009.127.051

Ny10101010

xl10101010

x210101010

x310101010

/1.0000.5560.7310.724\

0.5561.0000.1130.398

0.7310.1131.0000.547

所以,=\o.7240.3980.5471.000/

系数a

模型标准系

非标准化系数数B的95.0%置信区间)~日关性共线性统计量

B标准误差试用版tSig.卜限上限零阶偏部分容差VIF

(常量)-348.2176.459-1.974.096-780.083.500

8060

xl3.7541.933.3851.942.100-.9778.485.556.621.350.8251.211

x27.1012.880,5352.465.049.05314,149.731.709,444.6871.455

x312.44710.569.2771.178,284-13.4138.310.724.433,212,5861.708

5

a.因变量:y

(2)

所以三元线性回归方程为y=-348.28+3.754x1+7.101x2+12.447x3

11

4而大虏

CENTRALSOUTHUNIVERSITY

模型汇总

模型标准估计的更改统计量

RR方调整R方误差R方更改F更改dfldf2Sig.F更改

1.898a.806.70823,44188.8068.28336.015

a.预测变量:(常量),x3,xl,x2。

(3)

由于决定系数R方=0.708R=0.898较大所以认为拟合度较高

(4)

Anovab

模型平方和df均方FSig.

1回归13655.37034551.7908.283.015a

残差3297.1306549.522

总计16952.5009

a.预测变量:(常量),x3,xl,x2。

b.因变量:y

因为F=8.283P=0.015<0.05所以认为回归方程在整体上拟合的好

(5)

系数a

模型B的95.0%置信区

非标准化系数标准系数间相关性共线性统计量

B标准误差试用版tSig.下限上限零阶偏部分容差VIF

1(-348.280176.459-1.974.096-780.06083.500

)

X13.7541.933.3851.942.100-.9778.485.556.621.350.8251.211

x27.1012.880.5352.465,049.05314.149.731.709.444.6871.455

x312.44710.569.2771.178,284-13.41538.310.724,433.212.5861.708

a.因变量:y

(6)可以看到P值最大的是x3为0.284,所以x3的回归系数没有通过显著检

验,应去除。

12

4而大虏

CENTRALSOUTHUNIVERSITY

去除x3后作F检验,得:

Anovab

模型平方和df均方FSig.

1回归12893.19926446.60011.117.007

残差4059.3017579.900

总计16952.5009

a.预测变量:(常量),x2,xl°

b.因变量:y

由表知通过F检验

继续做回归系数检验

系数,

模型共线性统计

非标准化系数标准系数B的95.0%置信区间相关性量

B标准误差试用版tSig.下限上限零阶偏部分容差VIF

(常量)-459.624153.058-3.003.020-821.547-97.700

X14.6761.816.4792.575.037,3818.970.556.697.476.9871.013

x28.9712.468.6763.634.0083.13414.808,731.808.672.9871.013

a.因变量:y

此时,我们发现Xl,x2的显著性大大提高。

(7)xl:(-0.997,8.485)x2:(0.053,14.149)x3:(-13.415,38.310)

(8)y*=0.385x1*+0.535x2*+0.277x3*

(9)

残差统计量2

极小值极大值均值标准偏差N

预测值175.4748292.5545231.500038.9520610

标准预测值-1.4381.567.0001.00010

预测值的标准误差10.46620,19114.5263.12710

调整的预测值188.3515318.1067240.183549.8391410

残差-25.1975933.22549.0000019.1402210

标准残差-1.0751.417.000.81610

Student化残差-2.1161.754-.1231.18810

13

4而大虏

CENTRALSOUTHUNIVERSITY

已删除的残差-97.6152350.88274-8.6834843.4322010

Student化已删除的残差-3.8322.294-.2551.65810

Mahal°距离.8945.7772.7001.55510

Cook的距离.0003.216.486.97610

居中杠杆彳直.099,642.300.17310

a.因变量:y

所以置信区间为(175.4748,292,5545)

(10)由于x3的回归系数显著性检验未通过,所以居民非商品支出对货运总量

影响不大,但是回归方程整体对数据拟合较好

3.12解:在固定第二产业增加值,考虑第三产业增加值影响的情况下,第一产

业每增加一个单位,GDP就增加0.607个单位。

在固定第一产业增加值,考虑第三产业增加值影响的情况下,第二产业每

增加一个单位,GDP就增加1.709个单位。

第四章违背基本假设的情况

4.9初始数据:

用户序号Xy

16790.79

22920.44

310120.56

44930.79

55822.7

611563.64

79974.73

821899.5

910975.34

1020786.85

1118185.84

1217005.21

137473.25

1420304.43

1516433.16

164140.5

173540.17

14

4而大虏

CENTRALSOUTHUNIVERSITY

1812761.88

197450.77

204351.39

215400.56

228741.56

2315435.28

2410290.64

257104

2614340.31

278374.2

2817484.88

2913813.48

3014287.58

3112552.63

3217774.99

333700.59

3423168.19

3511304.79

364630.51

377701.74

387244.1

398083.94

407900.96

417833.29

424060.44

4312423.24

446582.14

4517465.71

464680.64

4711141.9

484130.51

4917878.33

50356014.94

5114955.11

5222213.85

5315263.93

解:

15

4而大虏

CENTRALSOUTHUNIVERSITY

系数’

模型非标准化系数标准系数

B标准误差试用版tSig.

1(常量)-.831.442-1.882.065

X.004.000.83911.030.000

a.因变量:y

由SPSS计算得:y=-0.831+0.004x

残差散点图为:

散点图

因变量:y

o

归0-

差-1-

-2-

-3-

IIIIIIII

0.002.004.006.008.0010.0012.0014.00

y

(2)由残差散点图可知存在异方差性

再用等级相关系数分析:

相关系数

Xt

Spearman的rhox相关系数1.000.318*

16

4而大虏

CENTRALSOUTHUNIVERSITY

Sig.(双侧),021

N5353

t相关系数.318*1.000

Sig.(双侧).021

N5353

*.在置信度(双测)为0.05时,相关性是显著的。

P=o.021所以方差与自变量的相关性是显著的。

(3)

模型描述

因变量y

自变量1X

权重源X

号值1.500

模型:MOD_1.

M=l.5时可以建立最优权函数,此时得到:

ANOVA

平方和df均方FSig.

回归,0061.00698.604.000

残差.00351,000

总计.00952

系数

未标准化系数标准彳匕系数

B标准误试用版标准误tSig.

(常数)-.683.298-2.296,026

X.004,000.812.0829.930.000

所以:y=-0.683+0.004x

(4)

系数1

17

4而大虏

CENTRALSOUTHUNIVERSITY

模型非标准化系数标准系数

B标准误差试用版tSig.

1(常量).582.1304.481.000

X.001.000.8059.699.000

a.因变量:yy

散点图

因变量:yy

标O

-3-O

IIIII

0.001.002.003.004.00

yy

4.13初始数据:

序号xy

1127.320.96

213021.4

3132.721.96

4129.421.52

513522.39

6137.122.76

7141.123.48

18

4而大虏

CENTRALSO

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论