统计学课后答案_第1页
统计学课后答案_第2页
统计学课后答案_第3页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.4 1 一家汽车零售店的10 名销售人员5 月份销售的汽车数量( 单位:台 )排序后如下:24710101012121415要求:( 1)计算汽车销售量的众数、中位数和平均数。(2) 根据定义公式计算四分位数。(3)计算销售量的标准差。(4)说明汽车销售量分布的特征。解:Statistics汽车销售数量NValid10Missing0Mean9.60Median10.00Mode10Std. Deviation4.169Percentiles256.255010.007512.50Histogram32ycneuqerF1Mean =9.6Std. Dev. =4.1690N =102.55

2、7.51012.515汽车销售数量42随机抽取25 个网络用户,得到他们的年龄数据如下:19152925242321382218302019191623272234244120311723要求; (1) 计算众数、中位数:1、排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄FrequencyPercentCumulative FrequencyCumulative Percent1514.014.01614.028.01714.0312.0Valid14.0416.01819312.0728.02028.0936.0精品.2114.01040.02228.01248.023312.0

3、1560.02428.01768.02514.01872.02714.01976.02914.02080.03014.02184.03114.02288.03414.02392.03814.02496.04114.025100.0Total25100.0从频数看出,众数Mo有两个: 19、 23;从累计频数看,中位数Me=23。(2) 根据定义公式计算四分位数。Q1 位置 =25/4=6.25 ,因此 Q1=19,Q3位置 =3×25/4=18.75 ,因此 Q3=27,或者,由于 25和 27 都只有一个,因此 Q3也可等于 25+0.75 ×2=26.5 。(3) 计算

4、平均数和标准差;Mean=24.00;Std. Deviation=6.652(4) 计算偏态系数和峰态系数:Skewness=1.080 ;Kurtosis=0.773(5) 对网民年龄的分布特征进行综合分析:分布,均值=24、标准差 =6.652 、呈右偏分布。如需看清楚分布形态,需要进行分组。为分组情况下的直方图:32tnuoC10151617181920212223242527293031343841网络用户的年龄为分组情况下的概率密度曲线:3.02.5tnu2.0oC1.51.0151617181920212223242527293031343841网络用户的年龄分组:精品.1、确定

5、组数: Klg( n)lg 251.3985.64 ,取 k=6111lg(2)lg 20.301032、确定组距:组距(最大值-最小值 ) ÷ 组数 =( 41-15 )÷ 6=4.3 ,取 53、分组频数表网络用户的年龄(Binned)FrequencyPercentCumulative FrequencyCumulative Percent<= 1514.014.016-20832.0936.021-25936.01872.0Valid26-30312.02184.031-3528.02392.036-4014.02496.041+14.025100.0Tota

6、l25100.0分组后的均值与方差:Mean23.3000Std. Deviation7.02377Variance49.333Skewness1.163Kurtosis1.302分组后的直方图:108y6cneuqerF42Mean =23.30Std. Dev. =7.024N =25010.0015.0020.0025.0030.0035.0040.0045.0050.00组中值4 6 在某地区抽取120 家企业,按利润额进行分组,结果如下:按利润额分组 ( 万元 )企业数 ( 个)20030019300400304005004250060018600 以上11合计120要求: (1)

7、计算 120 家企业利润额的平均数和标准差。(2)计算分布的偏态系数和峰态系数。解:Statistics精品.企业利润组中值Mi(万元)NValid120Missing0Mean426.6667Std. Deviation116.48445Skewness0.208Std. Error of Skewness0.221Kurtosis-0.625Std. Error of Kurtosis0.438Histogram5040yc 30neuqerF20100200.00300.00400.00500.00600.00700.00企业利润组中值 Mi(万元)Cases weighted by企业

8、个数Mean =426.67Std. Dev. =116.484N =12049一家公司在招收职员时,首先要通过两项能力测试。在A 项测试中,其平均分数是100 分,标准差是15 分;在 B 项测试中,其平均分数是400 分,标准差是50 分。一位应试者在A 项测试中得了115 分,在 B 项测试中得了425 分。与平均分数相比,该应试者哪一项测试更为理想?解:应用标准分数来考虑问题,该应试者标准分数高的测试理想。ZA= xx = 115 100 =1; ZB= x x = 425 400 =0.5因此, A 项测试结果理想。s15s504 11对 10 名成年人和10 名幼儿的身高进行抽样调

9、查,结果如下:成年组166169l72177180170172174168173幼儿组686968707l7372737475要求: (1) 如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量?为什么 ?均值不相等,用离散系数衡量身高差异。(2)比较分析哪一组的身高差异大?成年组幼儿组平均172.1 平均71.3标准差4.201851 标准差2.496664离散系数0.024415 离散系数0.035016幼儿组的身高差异大。7.3 从一个总体中随机抽取n=100 的随机样本, 得到 x=104560,假定总体标准差=86414,构建总体均值的95%的置信区间。 解:已知 n =100

10、, x =104560 , = 85414 , 1- a 95% ,由于是正态总体,且总体标准差已知。总体均值m在 1-a 置信水平下的置信区间为104560± 1.96 ×85414÷ 100= 104560±16741.1447.4从总体中抽取一个n=100 的简单随机样本, 得到 x =81, s=12。精品.样本均值服从正态分布: x N,2或 xN , s2置信区间为: x z2s , x z2s, s=12=1.2nnnnn100(1)构建的 90的置信区间。z2=0.05 =1.645 ,置信区间为: ( 81-1.645×1.2

11、,81+1.645× 1.2 ) =(79.03, 82.97)z(2)构建的 95的置信区间。z2= z0.025=1.96 ,置信区间为: ( 81-1.96 × 1.2,81+1.96 ×1.2)=( 78.65 ,83.35 )(3)构建的 99的置信区间。z2= z0.005=2.576 ,置信区间为:( 81-2.576×1.2,81+2.576× 1.2 ) =(77.91 , 84.09)7.5 利用下面的信息,构建总体均值的置信区间(1) x =25, =3.5 , n=60,置信水平为95%( 2) x =119.6 ,s=

12、23.89,n=75,置信水平为 95%( 3) x =3.419 ,s=0.974 ,n=32,置信水平为 90%解:1)1-a 95% ,其置信区间为: 25±1.96 ×3.5 ÷ 60= 25 ±0.8852 )1-a 98% ,则 =0.02, a/2=0.01, 1-a/2=0.99,查标准正态分布表 , 可知 :2.33a其置信区间为 : 119.6±2.33 ×23.89 ÷ 75= 119.6±6.3453)1-90%,1.65其置信区间为 : 3.149 ± 1.65 × 0

13、.974 ÷ 32= 3.149 ± 0.284a7.7某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取36 人,调查他们每天上网的时间,得到下面的数据3.33.16.25.82.34.15.44.53.24.42.05.42.66.41.83.55.72.32.11.91.25.14.34.23.60.81.54.71.41.22.93.52.40.53.62.5求该校大学生平均上网时间的置信区间,置信水平分别为95。解:(1)样本均值 x =3.32 ,样本标准差 s=1.61 ;( 2)抽样平均误差:重复抽样:x =sn=1.61/6=

14、0.268nx =NnsNn1.61750036不重复抽样:N1nN=3675001n1=0.268 ×0.995=0.268 × 0.998=0.267( 3)置信水平下的概率度:1=0.95 ,t= z2 = z0.025 =1.96( 4)边际误差(极限误差) :xtxz2x1=0.95 ,xtxz 2 x = z0.025 x重复抽样:xz2zx =1.96 ×0.268=0.525x = 0.025不重复抽样:xz 2x = z0.025x =1.96 × 0.267=0.523精品.( 5)置信区间: 1=0.95 ,重复抽样:xx , xx

15、= 3.320.525,3.320.525 =(2.79 ,3.85 )不重复抽样:xx , xx= 3.320.441,3.320.441 =(2.80 ,3.84)7.8 从一个正态总体中随机抽取样本量为8 的样本,各样本值分别为:10、8、12、15、 6、 13、5、11. ,求总体均值的95%的置信区间解:本题为一个小样本正态分布,未知。先求样本均值:= 80 ÷ 8=10再求样本标准差:=84/7 = 3.4641于是 ,的置信水平为1- 的置信区间是,已知 1- =25, n = 8,则 =0.05, /2=0.025 ,查自由度为n-1 = 7 的 分布表得临界值2.

16、45所以,置信区间为:10 ± 2.45 ×3.4641 ÷ 77 11 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为l00g 。现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量( g)包数969829810031001023410210471041064合计50已知食品包重量服从正态分布,要求:(1) 确定该种食品平均重量的95的置信区间。解:大样本,总体方差未知,用z 统计量xN0,1样本均值 =101.4 ,样本标准差 s=1.829zsn置信区间:xz2s, xz2s1=0.95 , z 2 = z0.025 =1.96nn

17、x z 2s, xz2s=101.41.961.829,101.41.961.829 =( 100.89 ,101.91 )nn5050(2) 如果规定食品重量低于l00g属于不合格,确定该批食品合格率的95的置信区间。解:总体比率的估计大样本,总体方差未知,用z 统计量精品.pN0,1样本比率 =(50-5 ) /50=0.9zp 1 pn置信区间:p 1pp 1p=0.95 , z =1.96pz2, pz 21z2nn0.025p z 2p 1p, p z2p 1 p= 0.91.960.9 1 0.9 ,0.9 1.960.9 1 0.9= ( 0.8168 ,0.9832 )nn50

18、507.18 某小区共有居民500 户,小区管理着准备采用一项新的供水设施,想了解居民是否赞成。 采取重复抽样方法随机抽取了50 户,其中有 32 户赞成, 18户反对。( 1)求总体中赞成该项改革的户数比例的置信区间( 2)若小区管理者预计赞成的比例能达到80%,估计误差不超过 10%,应抽取多少户进行调查?解: 1)已知 N=50,P=32/50=0.64 , =0.05 , /2 =0.025,则1.96置信区间: P± P(1-P )/N = 0.64 ±1.96 0.64 × 0.36/50= 0.64± 1.96 ×0.48/7.0

19、7=0.64±0.1332)已知丌 =0.8 , E = 0.1, =0.05 , /2 =0.025 ,则1.96N=2丌 (1- 丌)/E 2= 1.96 2× 0.8× 0.2 ÷ 0.1 2 628.1 已知某炼铁厂的含碳量服从正态分布N(4.55 ,0.108 2),现在测定了9 炉铁水,其平均含碳量为4.484 ,如果估计方差没有变化,可否认为现在生产的铁水平均含碳量为4.55 ?解: 已知 0=4.55 ,2=0.108 2, N=9,=4.484 ,这里采用双侧检验,小样本,已知,使用Z 统计。假定现在生产的铁水平均含碳量与以前无显著差异

20、。则,H0 :=4.55; H1 : 4.55 =0.05 , /2 =0.025,查表得临界值为1.96计算检验统计量:= (4.484-4.55)/(0.108/9)= -1.833决策: Z 值落入接受域,在=0.05的显著性水平上接受H0。结论:有证据表明现在生产的铁水平均含碳量与以前没有显著差异,可以认为现在生产的铁水平均含碳量为4.55 。8 2 一种元件,要求其使用寿命不得低于700 小时。现从一批这种元件中随机抽取36 件,测得其平均寿命为680 小时。已知该元件寿命服从正态分布, 60 小时,试在显著性水平0 05下确定这批元件是否合格。解: 0:700; 1:700已知:x

21、68060H H由于 n=36 30,大样本,因此检验统计量:zx0680700 -2sn3660当 0.05 ,查表得z 1.645 。因为 z - z ,故拒绝原假设,接受备择假设,说明这批产品不合格。8.3某地区小麦的一般生产水平为亩产250 公斤,其标准差为30 公斤,先用一种花费进行试验,从25 个小区抽样,平均产量为270 公斤。这种化肥是否使小麦明显增产?解:已知 0 =250 , = 30 , N=25, x =270这里是小样本分布,已知,用Z 统计量。右侧检验,=0.05 ,则 Z=1.645提出假设:假定这种化肥没使小麦明显增产。即 H0 : 250H1: 250精品.计

22、算统计量:Z =( x - 0) / ( / N)= (270-250 ) / ( 30/ 25) = 3.33结论: Z 统计量落入拒绝域,在 =0.05的显著性水平上,拒绝H0,接受 H1。决策:有证据表明,这种化肥可以使小麦明显增产。10 .1 从 3 个总体中各抽取容量不同的样本数据,结果如下。检验3 个总体的均值之间是否有显著差异方差分析:单因素方差分析SUMMARY组观测数求和平均方差样本 1579015861.5样本 2460015036.66667样本 33507169121方差分析差异源SSdfMSFP-valueF crit组间618.91672309.45834.6574

23、0.0408778.021517组内598966.44444总计1216.9171110. 。2 下面是来自 5 个总体的样本数据方差分析:单因素方差分析SUMMARY组观测数求和平均方差样本 133712.333334.333333样本 2550101.5样本 3448120.666667样本580161.5样本 5678130.8方差分析差异源SSdfMSFP-valueF crit组间93.76812423.4420315.823371.02E-054.579036组内26.66667181.481481总计120.43482210 3 一家牛奶公司有4 台机器装填牛奶,每桶的容量为4L

24、 。下面是从 4 台机器中抽取的样本数据:机器 l机器 2机器 3机器 44.053.993.974.004.014.023.984.024.024.013.973.994.043.993.954.0l4.004.004.00精品.取显著性水平a0.01 ,检验 4 台机器的装填量是否相同?解:不相同。ANOVA每桶容量( L)平方和df均方F显著性组间0.00730.0028.7210.001组内0.004150.000总数0.0111811.6 下面是 7 个地区 2000 年的人均国内生产总值(GDP)和人均消费水平的统计数据:地区人均 GDP(元 )人均消费水平 ( 元)北京22 46

25、07 326辽宁11 2264 490上海34 54711 546江西4 8512 396河南5 4442 208贵州2 6621 608陕西4 5492 035要求:(1) 人均 GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。(2) 计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。(3) 利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。(4) 计算判定系数,并解释其意义。(5) 检验回归方程线性关系的显著性 (a=0.05) 。(6) 如果某地区的人均 GDP为 5 000 元,预测其人均消费水平。(7) 求人均 GDP为 5 000 元时,人均消费水平95的置信区间和预测区间。人均 12000消费水平10000(元)80006000400020000010000200003000040000解:(1)人均 GDP(元)可能存在线性关系。( 2)相关系数:有很

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论