版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3章数据的概括性度量
3.1(1)众数:A/。=1°。
中位数:中位数位置=等=等=5.5,竽=】。。
支Xi
2+4+…+14+1596c,
平均数:£=上一----------------=—=9.6o
n1010
(2)0,位置=4=12=2.5,0工=卓=5.5。
442
八Q铲3〃3x10c12+12
&位置=彳=^—=7.5,Qu=---=12。
3)
(2—9.61+(4—9.61+...+(14—9.6)2+(159.61
10-1
(4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。
3.2(1)从表中数据可以看出,年龄出现频数最多的是19和23,所以有两个众
数,即刈=19和"=23。
将原始数据排序后,计算的中位数的位置为:中位数位置=四=纪里=13,第
22
13个位置上的数值为23,所以中位数=23。
(2)。力位置=^=*6.25,&=19+0.25x(19—19)=19。
3x25
位置==18.75,Qv=25+0.75x(27-25)=26.5。
Vx.
小下出她-勺19+15+…+17+23600»
(3)平均数x=——=------------------=——=24。
n2525
119-24)2+(15-24)2+…+(17-24)2+(23-244
V25-1-
25>&-24)3
(4)偏态系数:SK=------区〜---------7=1.08o
(25-1)(25—2)x6.653
2
25(25+1)Z(七一24尸—3区区—24)『(25-1)
峰态系数:K=0.77o
(25-1)(25-2)(25-3)x6.654
(5)分析:从众数、中位数和平均数来看,网民年龄在23〜24岁的人数占多数。
由于标准差较大,说明网民年龄之间有较大差异。从偏态系数来看,年龄分布为右
偏,由于偏态系数大于1,所以偏斜程度很大。由于峰态系数为正值,所以为尖峰
分布。
3.3(1)茎叶图如下:
茎叶数据个数
551
66783
7134885
/、、-5.5+6.6+…+7.8+7.863、
(2)x-------------------------------------7o
99_______________
1(5.5-7)2+(6.6—7y+...+(7.8—7>+(7.8-7产U.08
;=J------------------------------------------------------------------=J-------=0-714
V9-1V8
(3)由于两种排队方式的平均数不同,所以用离散系数进行比较。
第一种排队方式:匕=生=0.274;%=纪±=0」02。由于丹〉匕,表明
17.2
第一种排队方式的离散程度大于第二种排队方式。
(4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一
种排队方式。
Vx.
一4‘八一白’8223
3.4⑴x=——=-------274.1o
n30
272+273=272.5。
中位数位置=g1=15.5,Me:
22
Qf)258+261
(2)Q/立置=和=7.5,Q259.5。
L2
3x30MU284+291
Q”位置—-----=22.5,Qu=287.5。
42
13002.7「
⑶s=1=1——21.1/。
n-130-1
35⑴甲企业的平均成本=瑞=瑞翔詈二翳
=19.41o
152030
总成本3255+1500+15006255
乙企业的平均成本18.29.
总产量3255150011500342
15203()
原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所
占比重较大,因此拉低了总平均成本。
3.6(1)平均数计算过程见下表:
组中值企业数
按利润额分组ZMf
200-300250194750
300〜4003503010500
400〜5004504218900
500〜600550189900
600以上650117150
合计—12051200
ZMf
51200
i=l=426.67。
n120
标准差计算过程见下表:
按利润额分组组中值企业数力(%-元产(%-无产力
200〜3002501931212.3593033.5
300〜400350305878.3176348.7
400-50045042544.322860.1
500-6005501815210.3273785.2
600以上6501149876.3548639.2
合计—120102721.51614666.7
(2)偏态系数和峰态系数的计算过程见下表:
按利润额分组组中值企业数力(M-守方(M-5)"
200-30025019-104771226.518509932589.2
300〜40035030-13520652.31036628411.8
400〜50045042533326.912442517.1
500〜6005501833765928.74164351991.6
600以上65011122527587.627364086138.8
合计—12038534964.451087441648.4
k
七''_38534964.4
偏态系数:=0.203。
ns5~120x116.483
51087441648.4
峰态系数:K=乂-----------------—3=-3=—0.688»
ns120x116.484
3.7(1)两位调查人员所得到的平均身高应该差不多相同,因为均值的大小基本
上不受样本大小的影响。
(2)两位调查人员所得到的身高的标准差应该差不多相同,因为标准差的大小基
本上不受样本大小的影响。
(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,
变化的范围就可能越大。
3.8(1)要比较男女学生体重的离散程度应该采用离散系数。女生体重的离散系
数为丫女=』=0.1,男生体重的离散系数为勺,=0.08,所以女生的体
重差异大。
(2)男生:元=60x2.2=132(磅),5=5x2.2=11(磅);
女生:x=50x2.2=110(磅),s=5x2.2=ll(磅);
(3)假定体重为对称分布,根据经验法则,在平均数加减1个标准差范围内的数
据个数大约为68%。因此,男生中大约有68%的人体重在55kg到65kg之间。
(4)假定体重为对称分布,根据经验法则,在平均数加减2个标准差范围内的数
据个数大约为95%。因此,女生中大约有95%的人体重在40kg到60kg之间。
3.9通过计算标准分数来判断:
x,115-100,xH-xH425-400,、「
zA=———-=--------=1;zB8=-—-=---------=0.5。
AS.15sB50
该测试者在A项测试中比平均分数高出1个标准差,而在B项测试中只高出平均
分数0.5个标准差,由于A项测试的标准分数高于B项测试,所以A项测试比较
理想。
3.10通过标准分数来判断,各天的标准分数如下表:________________
日期周一周二周三周四周五周六周日
标准分数Z3-0.6-0.22.4-1.8-2.20
周一和周六两天失去了控制。
3.11(1)应该采用离散系数,因为它消除了不同组数据水平高低的影响。
42
(2)成年组身高的离散系数:匕=—=0.024;
172.1
25
幼儿组身高的离散系数:匕=上=0.035;
,71.3
由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离
散程度相对较大。
3.12(1)应该从平均数和标准差两个方面进行评价。在对各种方法的离散程度进
行比较时,应该采用离散系数。
(2)下表给出了用Excel计算一些主要描述统计量。
方法A方法B方法C
平均165.6平均128.73平均125.53
中位数165中位数129中位数126
众数164众数128众数126
标准差2.13标准差1.75标准差2.77
极差8极差7极差12
最小值162最小值125最小值116
最大值170最大值132最大值128
从三种方法的集中趋势来看,方法A的平均产量最高,中位数和众数也都高
于其他两种方法。从离散程度来看,三种方法的离散系数分别为:
2.131752.77
:0.013,vB=———=0.014,%=0.022。方法
165.6128.73125.53
A的离散程度最小。因此应选择方法A。
3.13(1)用方差或标准差来评价投资的风险。
(2)从直方图可以看出,商业类股票收益率的离散程度较小,说明投资风险
也就较小。
(3)从投资风险角度看,应该选择风险较小的商业类股票。当然,选择哪类
股票还与投资者的主观判断有很大关系。
第4章抽样与参数估计
4.1(1)已知:cr=5,〃=40,x=25,a=0.05,Zo.05/2=1.96o
cr_5
样本均值的抽样标准差b.0.79o
y[nV40
b1八45
(2)估计误差EZR2kL96x而=1.55。
=
4.2(1)已知:cr=15,〃=49,x=120,a—0.05,^0.05/21-96o
样本均值的抽样标准差bq=%==2.14。
4nV49
(2)估计误差E-z/2-Zr=1.96x-=4.20。
'V49
(3)由丁•总体标准差已知,所以总体均值〃的95%的置信区间为:
"Zw2a120±1.96x提120±4.20,即(115.8,124.2).
4.3已知:n=100,a=85414,x=104560,a=0.05,z005/2=1.96o
由于总体标准差已知,所以总体均值4的95%的置信区间为:
a85414
±=104560±1.96x—==104560±16741.144,即(87818.856,
/五Two
121301.144)o
4.4(1)已知:«=100,元=81,5=12,a=0.1,Zo,1/2=L645。
由于〃=100为大样本,所以总体均值〃的90%的置信区间为:
c2
x±z,,^==81±1.645=81±1.974,即(79.026,82.974)。
,一品Vwo
(2)已知:a=0.05,Z0.05/2=L96。
由于〃=100为大样本,所以总体均值〃的95%的置信区间为:
12
元土%/2为81±1.96x^^=8112.352,即(78.648,83.352)。
V100
(3)已知:a=0.01,Z0.01/2=2.58。
由于"=100为大样本,所以总体均值〃的99%的置信区间为:
-,s12
X±〃/2-f==81±2.58x^==81±3.096,即(77.940,84.096)»
7nV100
4.5(1)已知:元=25,cr=3.5,〃=60,a=0.05,z005/2=1.96o
由于总体标准差已知,所以总体均值4的95%的置信区间为:
a<
亍士Za,2-^=25±1.96x-^==25±0.89,即(24.11,25.89)。
-<60
(2)已知:x=119.6,s—23.89,〃=75,oc—0.02,z002/^-2.33o
由于f=75为大样本,所以总体均值〃的98%的置信区间为:
=119.6±2.33x^22=
x119.6±6.43,即(113.17,126.03)o
士S忑V75
(3)已知:x=3.419,5=0.974,”=32,a=0.1,z01y2-1.645。
由于〃=32为大样本,所以总体均值〃的90%的置信区间为:
0.974
X—"a/2=3.419±1.645X=3.419±0.283,即(3.136,3.702)。
4nV32
4.6(1)已知:总体服从正态分布,(T=500,〃=15,x=8900,a=0.05,
Zo.05/2=1・96。
由于总体服从正态分布,所以总体均值〃的95%的置信区间为:
于士Za,2爷=8900±1.96x^2^=8900±253.03,即(8646.97,9153.03),
VnJ15
(2)已知:总体不服从正态分布,。=500,〃=35,元=8900,a=0.05,
Z0.05/2=L96。
虽然总体不服从正态分布,但由于〃=35为大样本,所以总体均值"的95%的置
信区间为:
x±za)l2-^==8900±1.96x=8900±165.65,即(8734.35,9065.65)。
VnJ35
(3)已知:总体不服从正态分布,c未知,n=35fx=8900,s=500,cc=0.1,
Z(H/2=L645o
虽然总体不服从正态分布,但由于〃=35为大样本,所以总体均值〃的90%的置
信区间为:
I±za/2=8900±1.645x^2=8900±139.03,即(8760.97,9039.03)。
y]nV35
(4)已知:总体不服从正态分布,。未知,〃=35,5=8900,s=500,a=0.01,
z().oi/2=2.58o
虽然总体不服从正态分布,但由于〃=35为大样本,所以总体均值〃的99%的置
信区间为:
x±z=8900±2.58x-8900±218.05,即(8681.95,9118.05)。
八4nV35
4.7已知:〃=36,当a为0.1、0.05、0.01时,相应的如〃=L645、
^0.05/2=1-96>Zo.01/2=2.58。
根据样本数据计算得:元=3.32,5=1.6K
由于〃=36为大样本,所以平均上网时间的90%的置信区间为:
x±za/2-^==3.32±1.645x=3.32±0.44,即(2.88,3.76)。
~V36
平均上网时间的95%的置信区间为:
±z-j==3.32±1.96x=3.32±0.53,即(2.79,3.85)。
a/2NnV36
平均上网时间的99%的置信区间为:
1Z71
于土Za,2-r=3.32±2.58x3=3.32±0.69,即(2.63,4.01)。
'J36
4.8已知:总体服从正态分布,但b未知,”=8为小样本,a=0.05,
f0.05/2(8-1)=2.365o
根据样本数据计算得:x=10,5=3.46o
总体均值〃的95%的置信区间为:
_,s3.46
X±%2-f=10±2.365x10±2.89,即(7.11,12.89)。
NnVs
4.9已知:总体服从正态分布,但cr未知,〃=16为小样本,a=0.051
‘0.05/2(16-1)=2.131。
根据样本数据计算得:x=9.375,5=4.113。
从家里到单位平均距离的95%的置信区间为:
v4113
x±r,,=9.375±2.131=9.375±2.191,即(7.18,11.57)»
'6V16
4.10(1)已知:〃=36,x=149.5,a=0.05,Z0.05/2=1§6。
由于〃=36为大样本,所以零件平均长度的95%的置信区间为:
s]93
元土3=149.5±1.96x-^=149.5±0.63,即(148.87,150.13)。
八4nV36
(2)在上面的估计中,使用了统计中的中心极限定理。该定理表明:从均值为〃、
方差为『的总体中,抽取容量为n的随机样本,当n充分大时(通常要求〃230),
样本均值x的抽样分布近似服从均值为以、方差为b?/〃的正态分布。
4.11(1)已知:总体服从正态分布,但。未知,〃=50为大样本,a=0.05,
Z0.05/2=L96。
根据样本数据计算得:元=101.32,s=1.63。
该种食品平均重量的95%的置信区间为:
x±za:!2-y==101.32±1.96X=101.32±0.45,即(100.87,101.77)o
'V50
(2)根据样本数据可知,样本合格率为p=上45=0.9。该种食品合格率的95%的
50
置信区间为:
p士j2陛工^=0.9±1.96J"%1一呵=09士0.08,即(0.82,0.98)。
4.12已知:总体服从正态分布,但cr未知,”=25为小样本,a=0.01,
即(25-1)=2.797。
根据样本数据计算得:元=16.128,s=0.871。
总体均值〃的99%的置信区间为:
x±r,,=16.128±2.797x=16.128±0.487,即(15.64,16.62)。
-4nV25
4.13已知:总体服从正态分布,但a■未知,〃=18为小样本,a=0.1,
"18—1)=1.740。
根据样本数据计算得:1=13.56,5=7.80o
网络公司员工平均每周加班时间的90%的置信区间为:
7.80
x±%2-7=13.56±1.740x13.56±3.20,即(10.36,16.76)。
7nV18
=
4.14(1)已知:"=44,p-0.51,a—0.01,2o.oi/22.58o
总体总比例冗的99%的置信区间为:
p±=0.51±2.58『f=0.51±0.19,即(0.32,0.70);
/2=0
(2)已知:n—300,p=0.82»a=0.05,z005
总体总比例%的95%的置信区间为^_____________
p士=882±L96『82(;U^=0.82±0.04,即(0.78,0.86);
=
(3)已知:n=1150,p=0.48,a=0.1,^0.1/21.645o
总体总比例冗的90%的置信区间为:_____________
p±Za/2J",,)=0.48±1.645448;;;^§2=04g±0.02,即(0.46,
0.50)o
4.15已知:n=200,p=0.23,a为0.1和0.05时,相应的z()j/2=1645,
Z().05/2=196。
总体总比例1的90%的置信区间为:
023
p±Za,2/Q-P)=0.23±1.645^'^Q^^=0.23±0.05,即(0.18,
0.28)o
总体总比例万的95%的置信区间为:
p±Za,2y,P)=0.23±1.9610,23(;涓HI=023±0.06,即(0.17,0.29)0
4.16已知:(T=1000,估计误差E=200,a=0.01,z00l/2=2.58»
22
而见中的坪木层小心/2)%22.58X1000
应抽取的样本量为:n=——------=--------;----=167o
E22002
=
4.17(1)已知:E=0.02,re=0.40,a=0.04,^004/22.05o
(%/2)2•7(1一兀)2.052X0.40(1-0.40)
应抽取的样本量为:〃=2522。
E20.022
(2)已知:E=0.04,1未知,a=0.05,^0.05/2=1-96«
由于乃未知,可用使用0.5。
(Za/2)2•7(1一乃)1.962>050(1—0.50)
应抽取的样本量为:n=
下一Ok
(3)已知:E=0.05,7t-0.55,a=0.1,J2=1-645o
(Za/2)2•7(1—兀)1.6452X0.55(1—0.55)
应抽取的样本量为:n=
=
4.18(1)已知:〃=50,p=—=0.64,a—0.05,z005/21-96<.
总体中赞成该项改革的户数比例的95%的置信区间为:
p±Za/2=0.64±1=0.64±0.13,即(0.51,0.77)。
(2)已知:71—0.80,a—0.05,^0.05/2=1-960
-(%2尸.万(1—万)1.962X0.80(1-0.80)0
应抽取的样本量为:n=———-------=----------7-------=62。
E20.12
第5章假设检验
5.1(1)研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对
于以前提高了“,所以原假设与备择假设应为:Ho://<1035,
%:〃>1035。
(2)如果不能拒绝原假设,表示没有充分的统计证据支持该开发小组认为新
型弦线的抗拉强度得到了提高。
(3)如果有充足的理由拒绝原假设,表示开发小组可以相信新型弦线的抗拉
强度超过了1035Mpa,因此可以进一步采取推广措施。
5.2(1)该组织想要证实的假设是“每个月平均销售的汽车数量不足14辆”,所
以提出的假设形式为,〃o:〃N14,
(2)当不能拒绝原假设时,该组织认为没有充分的理由怀疑汽车销售管理者
的说法。
(3)当可以拒绝原假设时,该组织有充分的统计证据断定汽车销售管理者的
声明不真实。
5.3(1)〃o:〃=65,”]:〃工65。
(2)样本数据表明应该拒绝原假设时,意味着该生产线生产的玻璃纸平均横
向延伸率不符合规格,必须对生产线进行调整。
(3)样本数据无法支持拒绝原假设时意味着质量控制监督人员没有充分的理
由认为该生产线所处状态不正常,无需停产调整。
5.4(1)发生第一类错误指的是实际上奖励计划并未提高销售
人员的平均销售额,而公司董事长却认为它提高了销售人
员的平均销售额,这将导致公司错误的推行新的奖励计划,
却无法获得更高的销售额。
(2)发生第二类错误指的是实际上奖励计划提高了销售人
员的平均销售额,公司董事长却没有意识到,这将使公司
错过推行新的奖励计划的机会,也就无法进一步提高销售
额。
5.5(1)检验的临界值是Zoos=1645,拒绝法则是:如果z=±华>1.645,
o75/〃
就拒绝Ho。
(2)检验统计量z=635言=294〉1.645,所以拒绝原假设,认为新
1.19/V100
纤维的平均强力超过了6克。
5.6(1)—Z|-2.33。亍=22.0时,检验统计量z=二=-2.5<-
0012/V100
拒绝原假设。
(2)元=24.0时,检验统计量z=240-f25=_0.83>—Zooi,不拒绝原假
12/V100
设。
935—95
(3)X=23.5时,检验统计量z==-1.25>-Z,不拒绝原假
12/V100OOI
设。
(4)x=22.8时,检验统计量z==-1.83>-z,不拒绝原假
12/710000l
设。
5.7(1)拒绝规则是:如果z=三令>1.96或z=七聿<-1.96,则拒绝“0o
s/\ns/y/n
142-15
(2)检验统计量z=
5/V50
(3)在5%的显著性水平下,不能拒绝原假设。
5.8建立原假设与备择假设为:Ho://>100,W,://<100;
检验统计量2=至二吧=-3。<-2.33,拒绝原假设,认为该厂机器的平均开
25/V9
工成本的确有所下降。
5.9建立原假设与备择假设为:Ho://=0.618,月1:〃力0.618;
z=0.6583-0.618=193>所以不拒绝原假设,也就是没有充分的理由怀疑
0.09327/V20
该厂生产的工艺品框架宽与长的平均比例不是0.618。
5.10(1)Ho:7T<0.25:7T>0.25«如果zi70和〃(1一;r。)都大于等于5。
四-0.25
⑵z=T1.39<z001(=2.33),不能拒绝原假设,因此没
0.25(1-0.25)
V400
有充分的理由认为这部电视剧是成功的。
上313-0.75
5.11检验统计量z=,356
5.63>1.96,所以拒绝原假设,认为该医
0.75(1-0.75)
\356
生的声明并不属实。
第6章相关与回归分析
6.1(1)散点图如下:
从散点图可以看出,产量与生产费用之间为正的线性相关关系。
(2)利用Excel的“CORREL”函数计算的相关系数为r=0.920232。
(3)首先提出如下假设:Wo:p=0,"/PKO。
计算检验的统计量_____________
/二卜|、匹^=10.9202321.^12-2---■=7.435
1'Vl-r21W-0.9202322
当a=0.05时,仇5/2(12-2)=2.228。由f检验统计量t=7.435>ta12=2.228,
拒绝原假设。表明产量与生产费用之间的线性关系显著。
6.2(1)散点图如下:
从散点图可以看出,复习时间与考试分数之间为正的线性相关关系。
(2)利用Excel的“CORREL”函数计算的相关系数为厂=0.8621。相关系数
r>0.8,表明复习时间与考试分数之间有较强的正线性相关关系。
6.3⑴瓦=10表示当x=0时y的期望值为10。
(2)A=—0.5表示x每增加一个单位,y平均下降0.5个单位。
(3)x=6时,E(y)=10—0.5x6=7。
⑴邺=*
=90%。
SSTSSR+SSE36+4
R2=90%表示,在因变量y取值的变差中,有90%可以由x与y之间的线性关系
来解释。
SSE4
(2)Se0.5。
~\n-218-2
Se=0.5表示,当用x来预测y时;平均的预测误差为0.5o
6.5(1)散点图如下:
6
5
4
3
2
1
0
050010001500
运送距离
从散点图可以看出,运送距离与运送时间之间为正的线性相关关系。
(2)利用Excel的“CORREL”函数计算的相关系数为r=0.9489。相关系数
r>0.8,表明运送距离与运送时间之间有较强的正线性相关关系。
(3)由Excel输出的回归结果如下表:
回归统计
MultipleR0.948943
RSquare0.900492
AdjustedRSquare0.888054
标准误差0.480023
观测值10
方差
dfSSMSFSignificanceF
回归分析116.6816216.6816272.395852.79E-05
残差81.8433790.230422
总计918.525
Coefficients标准误差tStatP-value
Intercept0.1181290.3551480.332620.74797
XVariable10.0035850.0004218.5085752.79E-050.002613
得到的回归方程为:y=0.118129+0.003585%。
回归系数6=0.003585表示运送距离每增加1公里,运送时间平均增加0.003585
天。
6.6(1)散点图如下:
14000
1H2000
10000
S8000
6000
4000
2000
0
010000200003000040000
人均GDP
从散点图可以看出,人均GDP与人均消费水平为正的线性相关关系。
(2)利用Excel的“CORREL”函数计算的相关系数为r=0.998128。相关系数接
近于1,表明人均GDP与人均消费水平之间有非常强的正线性相关关系。
(3)由Excel输出的回归结果如下表:
回归统计
MultipleR0.998128
RSquare0.996259
AdjustedRSquare0.995511
标准误差247.3035
观测值7
方差分析
dfSSMSFSignificanceF
回归181444969814449691331.6922.91E-07
残差530579561159.01
总计681750764
Coefficients标准误差tStatP-value
Intercept734.6928139.54035.2650940.003285
XVariable10.3086830.00845936.492362.91E-07
得到的回归方程为:y=734.6928+0.308683x«回归系数4=0.308683表示
人均GDP每增加1元,人均消费水平平均增加0.308683元。
(4)判定系数R2=0.996259。表明在人均消费水平的变差中,有99.6259%是由
人均GDP决定的。.
(5)首先提出如下假设:H0:/3\=0,H]:01Ho
由于SignificanceF<a=0.05,拒绝原假设,表明人均GDP与人均消费水平之间
的线性关系显著。
(6)y5000=734.6928+0.308683x5000=2278.1078(元)。
(7)当a=0.05时,%四2(7-2)=2.571,s’=247.3035。置信区间为:
2
1,(x0-x)
y±f/2Se--1------------
0a〃t^-xf
/=!
(5000—12248.42857)2
2278.1078±2.571x247.3035+
854750849.7
=2278.1078±287.4
即(1990.7,2565.5)。
预测区间为:
「11(x0-W
y。土丘s1+二
=2278.1078±2.571X247.3035J1+;+(500()-12248.42857)2
854750849.7
=2278.1078±697.8
即(1580.3,2975.9)。
6.7(1)散点图如下:
2o
£OO
8o
16o
4O
从散点图可以看出,航班正点率与被投诉次数之间为负的线性相关关系。
(2)由Excel输出的回归结果如下表:
回归统计
MultipleR0.868643
RSquare0.75454
AdjustedRSquare0.723858
标准误差18.88722
观测值10
方差分析
dfSSMSFSignificanceF
回归分析18772.5848772.58424.591870.001108
残差82853.816356.727
总计911626.4
Coefficients标准误差tStatP-value
Intercept430.189272.154835.9620290.000337
XVariable1-4.700620.947894-4.959020.001108
得到的回归方程为:y=430.1892-4.7x»回归系数6=一4.7表示航班正点率
每增加1%,顾客投诉次数平均下降4.7次。
(3)回归系数检验的P-Value=0.001108<a=0.05),拒绝原假设,回归系数显
著。
(4)yi0=430.1892-4.7x80=54.1892(次)。
(5)当a=0.05时,%05/2(1°—2)=2.306,s«=18.88722。置信区间为:
1,U-x)2
--1-----0------
”名心一幻2
<=1
=54.1892±2.306x18.88722J—+(80-75-86)1
V10397.024
=54.1892±16.48
即(37.7,70.7)o
预测区间为:
%±%21+—+--------------
V〃1(…)2
=54.1892±2.306x18.88722J1+—+(80-75.86)
V10397.024
=54.1892±46.57
即(7.6,100.8)o
6.8Excel输出的回归结果如下:
MultipleR0.7951
RSquare0.6322
AdjustedRSquare0.6117
标准误差2.6858
观测值20
方差分析
dfSSMSFSignificanceF
回归1223.1403223.140330.93322.79889E-05
残差18129.84527.2136
总计19352.9855
Coefficients标准误差tStatP-value
Intercept49.31773.805012.96120.0000
XVariable10.24920.04485.56180.0000________________
由上表结果可知,出租率与月租金之间的线性回归方程为:
y=49.3177+0.2492x0回归系数自=0.2492表示:月租金每增加1元,出租
率平均增加0.2492%»
R?=63.22%,表明在出租率的变差中被出租率与租金之间的线性关系所解
释的比例为63.22%,回归方程的拟合程度一般。
估计标准误差枭=2.6858表示,当用月租金来预测出租率时,平均的预测误
差为2.6858%,表明预测误差并不大。
由方差分析表可知,SignificanceF=2.79889E-05<a=0.05回归方程的线性关
系显著。回归系数检验的P-value=0.000(Xa
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年上海济光职业技术学院高职单招高职单招英语2016-2024历年频考点试题含答案解析
- 虚拟偶像发展研究-洞察分析
- 藤棕草制品创意设计-洞察分析
- 2024-2030年中国手机媒体行业市场深度分析及发展趋势预测报告
- 2025年玻璃拉手项目投资可行性研究分析报告
- 一年级数学计算题专项练习汇编
- 2025年中国电梯、自动扶梯及升降机市场前景预测及投资规划研究报告
- 房屋买卖信息确认协议书(2篇)
- 2025年中国二件多功能料理锅行业市场发展前景及发展趋势与投资战略研究报告
- 2022-2027年中国涡轮增压器零部件行业市场运行现状及投资规划建议报告
- 湖北省黄石市阳新县2024-2025学年八年级上学期数学期末考试题 含答案
- 硝化棉是天然纤维素硝化棉制造行业分析报告
- 央视网2025亚冬会营销方案
- 《无砟轨道施工与组织》 课件 第十讲双块式无砟轨道施工工艺
- 江苏省南京市、盐城市2023-2024学年高三上学期期末调研测试+英语+ 含答案
- 2024新版《药品管理法》培训课件
- 《阻燃材料与技术》课件 第7讲 阻燃橡胶材料
- 国家开放大学学生成绩单
- 船员外包服务投标方案
- 沉积相及微相划分教学课件
- 移动商务内容运营(吴洪贵)任务五 引发用户共鸣外部条件的把控
评论
0/150
提交评论