统计学答案(第四版)_第1页
统计学答案(第四版)_第2页
统计学答案(第四版)_第3页
统计学答案(第四版)_第4页
统计学答案(第四版)_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本文格式为Word版,下载可任意编辑——统计学答案(第四版)

《统计学》第四版

第四章练习题答案

4.1(1)众数:M0=10;中位数:中位数位置=n+1/2=5.5,Me=10;平均数:

x

n

i

96

9.610

2

(2)QL位置=n/4=2.5,QL=4+7/2=5.5;QU位置=3n/4=7.5,QU=12(3)s

(xi)

n1

.4

4.29

(4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。

4.2(1)从表中数据可以看出,年龄出现频数最多的是19和23,故有个众数,即M0=19和M0=23。

将原始数据排序后,计算中位数的位置为:中位数位置=n+1/2=13,第13个位置上的数值为23,所以中位数为Me=23

(2)QL位置=n/4=6.25,QL==19;QU位置=3n/4=18.75,QU=26.5

x(3)平均数

n

i

600/25=24,标准差s

(x)

n1

2

1062

6.65

251

(4)偏态系数SK=1.08,峰态系数K=0.77

(5)分析:从众数、中位数和平均数来看,网民年龄在23-24岁的人数占多数。由于标准差较大,说明网民年龄之间有较大差异。从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。由于峰态系数为正值,所以为尖峰分布。4.3(1

(2)

2

x

n

i

63/9=7,s

(x)

n1

4.08

0.7148

(3)由于两种排队方式的平均数不同,所以用离散系数进行比较。

第一种排队方式:v1=1.97/7.2=0.274;v2=0.714/7=0.102.由于v1>v2,说明第一种排队方式的离散程度大于其次种排队方式。

(4)选方法二,由于其次种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。

x4.4(1)

n

i

8223/30=274.1

中位数位置=n+1/2=15.5,Me=272+273/2=272.5

(2)QL位置=n/4=7.5,QL==(258+261)/2=259.5;QU位置=3n/4=22.5,QU=(284+291)/2=287.5(3)s

(xi)

n1

2

13002.7

21.17

301

2100300015006600

19.41

210030001500340

152030

4.5(1)甲企业的平均成本=总成本/总产量=

乙企业的平均成本=总成本/总产量=

3255150015006255

18.29

325515001500342

152030

原因:尽管两个企业的单位成本一致,但单位成本较低的产品在乙企业的产量中所占比重较

大,因此拉低了总平均成本。4.6(1)(计算过程中的表略),

Mf

i

i

n

51200/120=426.67

s

(M)

n1

2

fi

.7

116.48

1201

SK=0.203K=-0.688

4.7(1)两位调查人员所得到的平均身高应当差不多一致,由于均值的大小基本上不受样本大小的影响。

(2)两位调查人员所得到身高的标准差应当差不多一致,由于标准差的大小基本上不受样本大小的影响。

(3)具有较大样本的调查人员有更大的机遇取得最高或最低者,由于样本越大,变化的范围就可能越大。

4.8(1)要比较男女学生体重的离散程度应当采用离散系数。女生体重的离散系数为v女=5/50=0.1,男生体重的离散系数为v男=5/60=0.08,所以女生的体重差异大。(2)男生:602.2=132(磅),s=52.2=11(磅)

女生:502.2=110(磅),s=52.2=11(磅)

(3)假定体重为对称分布,根据经验法则,在平均数加减1个标准差范围内的数据个数大约为68%。因此,男生中大约有68%的人体重在55kg-65kg之间。

(4)假定体重为对称分布,根据经验法则,在平均数加减2个标准差范围内的数据个数大约为95%。因此,男生中大约有95%的人体重在40kg-60kg之间。4.9通过计算标准分数来判断:

xAA115100zAsA151;

z

B

xBB425400

1;

sB50

该测试者在A项测试中比平均分数高出1个标准差,而在B项测试中只高出平均分数0.5

个标准差,由于A项测试的标准分数高于B项测试,所以,A项测试比较理想。4.9通过标准分数来判断,各天的标准分数如下表:

4.11

(1)应当采用离散系数,由于它消除了不同组数据水平高低的影响。

4.2

0.024172.12.5

0.035幼儿组身高的离散系数:vs

71.3

(2)成年组身高的离散系数:vs

由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。4.12

(1)应当从平均数和标准差两个方面进行评价。在对各种方法的离散程度进行比较时,应当采用离散系数。

(2)下表给出了各种方法的主要描述统计量。

从三种方法的集中趋势来看,方法A的平均产量最高,中位数和众数也都高于其他两种方法。从离散程度来看,三种方法的离散系数分别为:vA

2.13

0.013,165.6

vB

1.752.77

0.014,vC0.022。方法A的离散程度最小,因此,应选择方

128.73125.53

法A。4.13

(1)用方差或标准差来评价投资的风险。

(2)从直方图可以看出,商业类股票收益率的离散程度较小,说明投资风险也就较小。(3)从投资风险角度看,应选中择风险较小的商业类股票。当然,选择哪类股票还与投资者的主观判断有很大关系。

第五章练习题答案

5.1(1)平均分数是范围在0-100之间的连续变量,Ω=[0,100](2)已经遇到的绿灯次数是从0开始的任意自然数,Ω=N

(3)之前生产的产品中可能无次品也可能有任意多个次品,Ω=[10,11,12,13…….]

5.2设订日报的集合为A,订晚报的集合为B,至少订一种报的集合为A∪B,同时订两种报的集合为A∩B。

P(A∩B)=P(A)+P(B)-P(A∪B)=0.5+0.65-0.85=0.3

5.3P(A∪B)=1/3,P(A∩)=1/9,P(B)=P(A∪B)-P(A∩)=2/95.4P(AB)=P(B)P(A∣B)=1/3*1/6=1/18

P(∪)=P()=1-P(AB)=17/18P()=1-P(B)=2/3

P()=P()+P()-P(∪)=7/18P(∣)=P()/P()=7/12

5.5设甲发芽为事件A,乙发芽为事件B。

(1)由于是两批种子,所以两个事件相互独立,所以有:P(AB)=P(B)P(B)=0.56(2)P(A∪B)=P(A)+P(B)-P(A∩B)=0.94

(3)P(A)+P(B)=P(A)P()+P(B)P()=0.38

5.6设合格为事件A,合格品中一级品为事件BP(AB)=P(A)P(B∣A)=0.96*0.75=0.72

5.7设前5000小时未坏为事件A,后5000小时未坏为事件B。P(A)=1/3,P(AB)=1/2,P(B∣A)=P(AB)/P(A)=2/3

5.8设职工文化程度小学为事件A,职工文化程度初中为事件B,职工文化程度高中为事件C,职工年龄25岁以下为事件D。P(A)=0.1P(B)=0.5,P(C)=0.4

P(D∣A)=0.2,P(D∣B)=0.5,P(D∣C)=0.7P(A∣D)=

A)

A)B)C)

2/55

同理P(B∣D)=5/11,P(C∣D)=28/55

5.9设次品为D,由贝叶斯公式有:P(A∣D)=

A)

A)B)C)

=0.249

同理P(B∣D)=0.112

5.10由二项式分布可得:P(x=0)=0.25,P(x=1)=0.5,P(x=2)=0.255.11(1)P(x=100)=0.001,P(x=10)=0.01,P(x=1)=0.2,P(x=0)=0.789(2)E(X)=100*0.001+10*0.01+1*0.2=0.4

5.13答对至少四道题包含两种状况,对四道错一道,对五道。C54

54

(3)5=1/6444C(6

4

5.14由泊松分布的性质有:P(X=1)=e

,P(X=2)=

2e

2!

,可得=2

P(X=4)=2/3e

P(Xk1)k1(k)!5.15k1

P(Xk)(k1)!k1

所以,当k=-1和k=时P(x=k)最大。

5.16(1)P(x>2)=P(x>2)+P(x<-2)=(0.5)+1-(2.5)=0.6977由于N(3,4)关于均值3对称,所以P(x>3)=0.5

x-4040

5.17P(120<x<200)=P()2()10.08

40

)0.9,398.27

x20230

)(1.5)0.93322023x20230

)2(0.5)10.383(2)P(190x210)P(

2023

5.18(1)P(x230)P(

第七章练习题参考答案

7.1(1)已知=5,n=40,=25,=0.05,

z

0.052

=1.96

样本均值的抽样标准差

=

n

=

540

0.79

(2)估计误差(也称为边际误差)E=

z

2

n

=1.96*0.79=1.55

7.2(1)已知=15,n=49,=120,=0.05,

z

0.052

=1.96

(2)样本均值的抽样标准差

=

n

=

1549

2.14

估计误差E=

z

2

n

=1.96*

1549

4.2

(3)由于总体标准差已知,所以总体均值的95%的置信区间为:

z

n

=1201.96*2.14=1204.2,即(115.8,124.2)

7.3(1)已知=85414,n=100,=104560,=0.05,

z

0.052

=1.96

由于总体标准差已知,所以总体均值的95%的置信区间为:

z

n

=1045601.96*

8541410456016741.144即(87818.856,121301.144)

7.4(1)已知n=100,=81,s=12,

=0.1,z0.2=1.645

由于n=100为大样本,所以总体均值的90%的置信区间为:

z2

sn

=811.645*

12811.974,即(79.026,82.974)

(2)已知=0.05,

z

0.052

=1.96

由于n=100为大样本,所以总体均值的95%的置信区间为:

z2

sn

=811.96*

12812.352,即(78.648,83.352)

(3)已知=0.01,

z

0.2

=2.58

由于n=100为大样本,所以总体均值的99%的置信区间为:

z2

sn

=812.58*

12813.096,即(77.94,84.096)

7.5(1)已知=3.5,n=60,=25,=0.05,

z

0.052

=1.96

由于总体标准差已知,所以总体均值的95%的置信区间为:

z

n

=251.96*

3.560

250.89,即(24.11,25.89)

(2)已知n=75,=119.6,s=23.89,

=0.02,z0.022=2.33

由于n=75为大样本,所以总体均值的98%的置信区间为:

z2

sn

=119.62.33*

23.8975

119.66.43,即(113.17,126.03)

(3)已知=3.419,s=0.974,n=32,=0.1,

z

0.2

=1.645

由于n=32为大样本,所以总体均值的90%的置信区间为:

z2

sn

=3.4191.645*

0.9743.4190.283,即(3.136,3.702)

7.6(1)已知:总体听从正态分布,=500,n=15,=8900,=0.05,由于总体听从正态分布,所以总体均值的95%的置信区间为:

z

0.052

=1.96

z

n

=89001.96*

5008900253.03,即(8646.97,9153.03)

(2)已知:总体不听从正态分布,=500,n=35,=8900,=0.05,

z

0.052

=1.96

虽然总体不听从正态分布,但由于n=35为大样本,所以总体均值的95%的置信区间为:

z

n

=89001.96*

5008900165.65,即(8734.35,9065.65)

(3)已知:总体不听从正态分布,未知,n=35,=8900,s=500,

=0.1,z0.2=1.645

虽然总体不听从正态分布,但由于n=35为大样本,所以总体均值的90%的置信区间为:

z2

sn

=89001.645*

50035

8900139.03,即(8760.97,9039.03)

(4)已知:总体不听从正态分布,未知,n=35,=8900,s=500,

=0.01,z0.=2.58

虽然总体不听从正态分布,但由于n=35为大样本,所以总体均值的99%的置信区间为:

z2

sn

=89002.58*

50035

8900218.05,即(8681.95,9118.05)

7.7已知:n=36,当=0.1,0.05,0.01时,相应的

z

0.2

=1.645,

z

0.=1.96,

z

0.2

=2.58

根据样本数据计算得:=3.32,s=1.61

由于n=36为大样本,所以平均上网时间的90%置信区间为:

z2

sn

=3.321.645*

1.6136

3.320.44,即(2.88,3.76)

平均上网时间的95%置信区间为:

z2

sn

=3.321.96*

1.6136

3.320.53,即(2.79,3.85)

平均上网时间的99%置信区间为:

z2

sn

=3.322.58*

1.6136

3.320.69,即(2.63,4.01)

7.8已知:总体听从正态分布,但未知,n=8为小样本,=0.05,根据样本数据计算得:=10,s=3.46总体均值的95%的置信区间为:

t

0.0581)=2.365

tsn

=102.365*

3.468

102.89,即(7.11,12.89)

7.9已知:总体听从正态分布,但未知,n=16为小样本,=0.05,根据样本数据计算得:=9.375,s=4.113

从家里到单位平均距离的95%的置信区间为:

t

0.161)=2.131

tsn

=9.3752.131*

4.1139.3752.191,即(7.18,11.57)

7.10(1)已知:n=36,=149.5,=0.05,

z

0.052

=1.96

由于n=36为大样本,所以零件平均长度的95%的置信区间为:

zsn

=149.51.96*

1.9336

149.50.63,即(148.87,150.13)

(2)在上面的估计中,使用了统计中的中心极限定理。该定理说明:从均值为、方差为

2

的总体中,抽取了容量为n的随机样本,当n充分大时(寻常要求n30),样本均值

的抽样分布近似听从均值为,方差为

n

2

的正态分布。

7.12(1)已知:总体听从正态分布,但未知,n=25为小样本,=0.01,0.2(251)=2.797根据样本数据计算得:=16.128,s=0.871总体均值的99%的置信区间为:

t

tsn

=16.1282.797*

0.87125

16.1280.487,即(15.64,16.62)

7.13已知:总体听从正态分布,但未知,n=18为小样本,=0.1,根据样本数据计算得:=13.56,s=7.8

网络公司员工平均每周加班时间的90%的置信区间为:

t

0.(181)=1.74

tsn

=13.561.74*

7.813.563.2,即(10.36,16.76)

7.14(1)已知:n=44,p=0.51,=0.01,总体比例的99%的置信区间为:

z

0.=2.58

pz2

p(1p)0.51(10.51)

=0.512.58=0.510.19,即(0.32,0.7)n44

(2)已知:n=300,p=0.82,=0.05,总体比例的95%的置信区间为:

z

0.052

=1.96

pz2

p(1p)0.82(10.82)

=0.821.96=0.820.04,即(0.78,0.86)n300

(3)已知:n=1150,p=0.48,=0.1,,总体比例的90%的置信区间为:

z

0.2

=1.645

pz2

p(1p)0.48(10.48)

=0.481.645=0.480.02,即(0.46,0.5)n1150

7.15已知:n=200,p=0.23,为0.1和0.05时,相应的总体比例的90%的置信区间为:

z

0.2

=1.645,

z

0.=1.96

pz2

p(1p)0.23(10.23)

=0.231.645=0.230.05,即(0.18,0.28)n200

总体比例的95%的置信区间为:

pz2

p(1p)0.23(10.23)

=0.231.96=0.230.06,即(0.17,0.29)n200

7.16已知:=1000,估计误差E=200,=0.01,

z

0.2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论