




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章一元线性回归
2.14解答:(1)散点图为:
40.00000-
35.00000-
3000000-
A2500000-
2000000-
1500000-
1000000-
(2)x与y之间大致呈线性关系。
(3)设回归方程为;=友+2x
A工七%一〃xy
0尸一,一7
/70=y—/7tx=2O—7x3=—1
.,.可得回归方程为y=-l+7x
A2]、A2
(4)<T=
n-2汽
1nAA
1(10-(-1+7x1))2+(10-(-1+7x2))2+(20-(-1+7x3))2
3+(20-(-1+7x4)¥+(40-(-1+7x5))2
#16+9+0+49+36]
=110/3
*南大摩
CENTRALSOUTHUNIVERSITY
o-=->/330«6.1
3
2
(5)由于公Ng,》
S-伊国
A
(y
服从自由度为n-2的t分布。因而
/丘监<%式—]=〜
A
<01<B\+%2
也即:P(4F2a)="a
A1------1------
可得4的置信度为95%的置信区间为(7-2.353x(后,7+2.353x(回)
即为:(2.49,11.5)
2
A1(X\
2
A)N(B(),(—十:—)cr)
PI,'厂&l<%2("2)=1-a
AA1丘)2AA1(出2
即p(仆自力屋用出味+”油:〜
可得4的置信度为95%的置信区间为(-7.77,5.77)
*南大摩
CENTRALSOUTHUNIVERSITY
〃八一
E(x-y)2
(6)x与y的决定系数产=上--------=490/600«0.817
/=1
(7)
ANOVA
平方和df均方F显著性
组间(组合)9.00024.5009.000.10()
线性项加权的8.16718.16716.333.056
偏差.8331.8331.667.326
组内1.0002.500
总数10.0004
由于尸〉心(1,3),拒绝a。,说明回归方程显著,x与y有显著的线性关系。
A2]〃1«A2
其中一口学、口y—J
%2=2.353
t=3.66>ta/2
接受原假设H0:川=0,认为才显著不为0,因变量y对自变量x的元线性回归成立。
〃——
Z(x,-x)(%-y)L
(9)相关系数r=-0•=—
物(―y)
V1=1/=1
707
=-7=«0.904
710x600V60
r小于表中a=1%的相应值同时大于表中a=5%的相应值,x与y有显著的线性关系.
2
*南大摩
CENTRALSOUTHUNIVERSITY
(10)
V
序号XAe
y
111064
221013-3
3320200
442027-7
5540346
残差图为:
残差图
0.00-
-2.50-
-5.00-
从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。
(11)当广告费/=4.2万元时,销售收入%=28.4万元,置信度为95%的置信区间
近似为,±2。,即(17.1,39.7)
2.15解答:
(1)散点图为:
3
*南大摩
CENTRALSOUTHUNIVERSITY
x与y散点图
5.00-O
4.00-O
O
A3.00-OO
2.00-O
O
1.00-OO
IIIII
250.00500.00750.001000.001250.00
X
(2)x与y之间大致呈线性关系。
(3)设回归方程为y=/o+/Ix
--
ZE%一〃xy
A(26370-21717)
..........-=0.0036
^x,2-n(x)2(7104300-5806440)
(=1
凤=y—方x=2.85—0.0036x762=0.1068
.,.可得回归方程为y=0.1068+0.0036%
A2]nA2
⑷b=—
n-2仁
1nAA2
=X))
n-2M
4
*南大摩
CENTRALSOUTHUNIVERSITY
=0.2305
o-=0.4801
二八b
(5)由于/
A
(T
服从自由度为n-2的t分布。因而
“昼"J
CT
也即:-ta/2~^=<P\<P\+ta/2
\Lxx
可得R的置信度为95%的置信区间为
(0.0036-1.860x0.4801/71297860,0.0036+1.860x0.4801/71297860)
即为:(0.0028,0.0044)
2
A1(X\
Bo刈瓜卜+厂~)/)
BQ0。_A)
服从自由度为n-2的t分布。因而
a
'13A、।
«+V"2)
5
*南大摩
CENTRALSOUTHUNIVERSITY
可得3的置信度为95%的置信区间为(-0.3567,0.5703)
"A-
E(x--y)2
16.82027
(6)x与y的决定系数产=弋^--------=0.908
E(y,-y)218.525
i=l
(7)
ANOVA
平方和df均方F显著性
组间(组合)1231497.5007175928.2145.302.168
线性项加权的1168713.03611168713.03635.222.027
偏差62784.464610464.077.315.885
组内66362.500233181.250
总数1297860.0009
由于尸〉F0(l,9),拒绝"o,说明回归方程显著,x与y有显著的线性关系。
A21n1nA2
其中。=口自始=口[S,f)
0.0036xJ297860
=8.542
0.04801
%2=1用95
t=8.542>ta/2
••・接受原假设HGK=0,认为力显著不为0,因变量y对自变量x的一元线性回归成立。
Z(x,-x)(y-y)L
(9)相关系数r=一广班=/"
、忙(…)吃(y「y)
Vi=li=l
4653
=0.9489
J1297860x18.525
6
*南大摩
CENTRALSOUTHUNIVERSITY
r小于表中a=1%的相应值同时大于表中a=5%的相应值,x与y有显著的线性关系.
(10)
序号XyAe
y
18253.53.07680.4232
221510.88080.1192
3107043.95880.0412
455022.0868-0.0868
548011.8348-0.8348
692033.4188-0.4188
713504.54.9688-0.4668
83251.51.27680.2232
967032.51880.4812
10121554.48080.5192
从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。
(11)新保单X。=1000时,需要加班的时间为媒=3.7小时。
(12)儿的置信概率为ba的置信区间精确为y0±ta/2(n-2)^1+hmcr,
即为(2.7,4.7)
近似置信区间为:£±2;,即(2.74,4.66)
(13)可得置信水平为1-a的置信区间为0士%2(〃-2)师a,即为(3.33,4.07).
2.16(1)散点图为:
7
*南大摩
CENTRALSOUTHUNIVERSITY
45000.00-
40000.00-
35000.00-
O
A30000.00-O
O
。CO
25000.00-O
20000.00-Oo
。O
15000.00-
2000.004000.006000.008000.00
X
可以用直线回归描述y与x之间的关系.
(2)回归方程为:y=12112.629+3.314x
⑶
直方图
回归标准化残差
8
*南大摩
CENTRALSOUTHUNIVERSITY
回用标准化残差的标准P・P图
因变量:y
1.0-
0.8-
期
望0.&-
的
累
得
率
0.4-
0.2-
00IIIIII
0.00.20.40.60.81.0
观测的累积概率
从图上可看出,检验误差项服从正态分布。
第三章多元线性回归
3.11解:(1)用SPSS算出y,xl,x2,x3相关系数矩阵:
相关性
yxlx2x3
Pearson相关性y1.000.556.731.724
xl.5561.000.113.398
x2.731.1131.000.547
x3.724.398.5471.000
y.048.008.009
xl.048.378.127
x2.008.378.051
9
*南大摩
CENTRALSOUTHUNIVERSITY
x3.009.127.051
Ny10101010
xl10101010
x210101010
x3101010』
Z1.000055607310.724\
OSS6
所以y=(-1.0000JL130398I
\0.7310.1131,000Q547I
Vo.7340.3980.5471.000/
系数,
模型标准系
非标准化系数数B的95.0%置信区间相关性共线性统计量
B标准误差试用版tSig.下限上限零阶偏部分容差VIF
(常量)-348.2176.459-1.974.096-780.083.500
8060
xl3.7541.933.3851.942.100-.9778.485.556.621.350.8251.211
x27.1012.880.5352.465.049.05314.149.731.709.444.6871.455
x312.44710.569.2771.178.284-13.4138.310.724.433.212.5861.708
5
a.因变量:y
(2)
所以三元线性回归方程为y=-348.28+3.754x1+7.101x2+12.447x3
模型汇总
模型标准估计的更改统计量
RR方调整R方误差R方更改F更改dfldf2Sig.F更改
1.898,.806.70823.44188.8068.28336.015
a.预测变量:(常量),x3,xl,x2。
(3)
由于决定系数R方=0.708R=0.898较大所以认为拟合度较高
(4)
Anovab
1模型
平方和df均方FSig.
10
*南大摩
CENTRALSOUTHUNIVERSITY
1回归13655.37034551.7908.283.015:,
残差3297.1306549.522
总计16952.5009
a.预测变量:(常量),x3,xl,x2。
b.因变量:y
因为F=8.283P=o.015<0.05所以认为回归方程在整体上拟合的好
(5)
系数.
模型B的95.0%置信区
非标准化系数标准系数间相关性共线性统计量
B标准误差试用版tSig.下限上限零阶偏部分容差VIF
1(-348.280176.459-1.974.096-780.06083.500
常
量
)
X13.7541.933.3851.942.100-.9778.485.556,621.350.8251.211
x27.1012.880.5352.465,049.05314,149.731.709.444.6871.455
x312.44710.569.2771.178.284-13.41538.310.724.433.212.5861.708
a.因变量:y
(6)可以看到P值最大的是x3为0.284,所以x3的回归系数没有通过显著检
验,应去除。
去除x3后作F检验,得:
Anovab
模型平方和df均方FSig.
1回归12893.19926446.60011.117.007,
残差4059.3017579.900
总计16952.5009
a.预测变量:(常量),x2,xl0
b.因变量:y
由表知通过F检验
继续做回归系数检验
11
*南大摩
CENTRALSOUTHUNIVERSITY
系数”
模型共线性统计
非标准化系数标准系数B的95.0%置信区间相关性量
B标准误差试用版tSig.下限上限零阶偏部分容差VIF
(常量)-459.624153.058-3.003.020-821.547-97.700
X14.6761.816,4792.575.037.3818.970.556.697.476.9871.013
x28.9712.468.6763.634.0083.13414.808.731.808.672.9871.013
a.因变量:y
此时,我们发现Xl,x2的显著性大大提高。
(7)xl:(-0.997,8.485)x2:(0.053,14.149)x3:(-13.415,38.310)
(8)/=0.385x1*+0.535x2*+0.277x3*
(9)
残差统计量'
极小值极大值均值标准偏差N
预测值175.4748292.5545231.500038.9520610
标准预测值-1.4381.567.0001.00010
预测值的标准误差10.46620.19114.5263.12710
调整的预测值188.3515318.1067240.183549.8391410
残差-25.1975933.22549.0000019.1402210
标准残差-1.0751.417.000.81610
Student化残差-2.1161.754-.1231.18810
已删除的残差-97.6152350.88274-8.6834843.4322010
Student化已删除的残差-3.8322.294-.2551.65810
Mahal。距离.8945.7772.7001.55510
Cook的距离.0003.216.486,97610
居中杠杆值.099.642.30()"7310
a.因变量:y
所以置信区间为(175.4748,292,5545)
(10)由于x3的回归系数显著性检验未通过,所以居民非商品支出对货运总量
影响不大,但是回归方程整体对数据拟合较好
3.12解:在固定第二产业增加值,考虑第三产业增加值影响的情况下,第一产
12
*南大摩
CENTRALSOUTHUNIVERSITY
业每增加一个单位,GDP就增加0.607个单位。
在固定第一产业增加值,考虑第三产业增加值影响的情况下,第二产业每
增加一个单位,GDP就增加1.709个单位。
第四章违背基本假设的情况
4.9解:
系数"
模型非标准化系数标准系数
B标准误差试用版tSig.
1(常量)-.831.442-1.882.065
X.004.000.83911.030.000
a.因变量:y
由SPSS计算得:j=-0.831+0.004x
残差散点图为:
散点图
W变量:y
L
回
回
0+-
标
准
化
残
差Z
-3-
—
—
—
—
24&2
o.0000006.00000000.00
y
13
*南大摩
CENTRALSOUTHUNIVERSITY
(2)由残差散点图可知存在异方差性
再用等级相关系数分析:
相关系数
Xt
Spearman的rhox相关系数1.000.318,
Sig.(双侧).021
N5353
t相关系数.318,1.000
Sig.(双侧).021
N5353
*.在置信度(双测)为0.05时,相关性是显著的。
P=o.021所以方差与自变量的相关性是显著的。
(3)
模型描述
因变量y
自变量1X
权重源X
翻直1.500
模型:MOD」.
M=l.5时可以建立最优权函数,此时得到:
ANOVA
平方和df均方FSig.
回归.0061.00698.604.000
残差.00351.000
总计.00952
系数
未标准化系数标准彳匕系数
B标准误试用版标准误tSig.
(常数)-.683.298-2.296.026
14
*南大摩
CENTRALSOUTHUNIVERSITY
系数
未标准化系数标准彳匕系数
B标准误试用版标准误tSig.
(常数)-.683.298-2.296.026
X.004.000.812.0829.930,000
所以:y=-0.683+0.004x
(4)
系数1
模型非标准化系数标准系数
B标准误差试用版tSig.
1(常量).582,1304.4X1.000
X.001.000.8059.699.000
a.因变量:yy
散点图
因变量:yy
L
回L
归
标
准
化
残
十
差
Z
-3-
—
—
册
—
6—
003.004.
,00w.00
15
*南大摩
CENTRALSOUTHUNIVERSITY
4.13解:
(1)
系数•
模型非标准化系数标准系数
B标准误差试用版tSig.
1(常量)-1.435.242-5.930.000
X.176.002.999107.928.000
a.因变量:y
y=-1.435+0.176x
(2)
模型汇总,
模型标准估计的误
RR方调整R方差Durbin-Watson
1.999'.998.998.09744.663
a.预测变量:(常量),x。
b.因变量:y
DW=0.663查DW分布表知:d,=0.95
所以,故误差项存在正相关。
残差图为:
16
oVTH
*南大孽
CENTRALSOUTHUNIVERSITY
.20000-
e-
n.10000-
p-
s£
pa
zp-
」B
UP.00000-
s2
un
-.10000-
-.20000-t
120.00130.00140.00150.00160.00170.00180.00
X
随t的变化逐次变化并不频繁的改变符号,说明误差项存在正相关。
(3)p=l-0.5*DW=0.6685计算得:
Y,x'
7.3944.90
7.6545.80
6.8440.69
8.0048.50
7.7946.85
8.2649.45
7.9648.47
8.2850.04
7.9048.03
8.4951.17
7.8847.26
8.7752.33
8.9352.69
9.3254.95
9.2955.54
9.4856.77
9.3855.83
9.6758.00
9.9059.22
17
*南大摩
CENTRALSOUTHUNIVERSITY
模型汇总“
模型标准估计的误
RR方调整R方差Durbin-Watson
1.996'.993.993.073951.344
a.预测变量:(常量),xx。
b.因变量:yy
系数‘
模型非标准化系数标准系数
B标准误差试用版tSig.
1(常量)-.303.180-1.684.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 少儿游泳测试题及答案
- 系统规划与管理学习的交流平台建设试题及答案
- 精确掌握图书管理员考试重点试题及答案
- 补充知识短板2025年乡村全科执业助理医师试题及答案
- 理顺公共卫生执业考试的试题及答案
- 理论与实际相结合的光电考试准备试题及答案
- 卫生管理与健康促进试题及答案
- 网络规划设计师常见误区及试题及答案
- 卫生管理证书考试经验交流会试题及答案
- 激光干涉仪原理试题及答案
- 2024年北京市家庭教育需求及发展趋势白皮书
- 2023年贵州贵安新区招聘中小学国企雇员教师考试真题
- 鼻窦手术后护理查房
- 绿色种养循环示范基地建设田间沼液池项目可行性研究报告-沼液池助力绿色循环产业效益稳步提升
- 精益医疗管理
- 农业昆虫学-形考测试二-国开(ZJ)-参考资料
- 中学生铸牢中华民族共同体意识的研究现状与趋势
- 2025年全年考勤表
- 部编四年级道德与法治下册全册教案(含反思)
- 工程伦理(2024东莞理工)学习通超星期末考试答案章节答案2024年
- 医学教材 《疟疾》课件
评论
0/150
提交评论