统计学后答案_第1页
统计学后答案_第2页
统计学后答案_第3页
统计学后答案_第4页
统计学后答案_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、41 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。(2)根据定义公式计算四分位数。 (3)计算销售量的标准差。 (4)说明汽车销售量分布的特征。解:Statistics汽车销售数量 NValid10Missing0Mean9.60Median10.00Mode10Std. Deviation4.169Percentiles256.255010.007512.5042 随机抽取25个网络用户,得到他们的年龄数据如下:1915292524232138221830201

2、9191623272234244120311723要求;(1)计算众数、中位数:1、排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄 FrequencyPercentCumulative FrequencyCumulative PercentValid1514.014.01614.028.01714.0312.01814.0416.019312.0728.02028.0936.02114.01040.02228.01248.023312.01560.02428.01768.02514.01872.02714.01976.02914.02080.03014.02184.03114.02

3、288.03414.02392.03814.02496.04114.025100.0Total25100.0从频数看出,众数Mo有两个:19、23;从累计频数看,中位数Me=23。(2)根据定义公式计算四分位数。 Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25 和27都只有一个,因此Q3也可等于25+0.75×2=26.5。(3)计算平均数和标准差; Mean=24.00;Std. Deviation=6.652(4)计算偏态系数和峰态系数: Skewness=1.080;Kurtosis=0.773(5)对

4、网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。如需看清楚分布形态,需要进行分组。为分组情况下的直方图:为分组情况下的概率密度曲线:分组:1、确定组数:,取k=62、确定组距:组距( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取53、分组频数表网络用户的年龄 (Binned) FrequencyPercentCumulative FrequencyCumulative PercentValid<= 1514.014.016 - 20832.0936.021 - 25936.01872.026 - 30312.02184

5、.031 - 3528.02392.036 - 4014.02496.041+14.025100.0Total25100.0分组后的均值与方差:Mean23.3000Std. Deviation7.02377Variance49.333Skewness1.163Kurtosis1.302分组后的直方图:46 在某地区抽取120家企业,按利润额进行分组,结果如下:按利润额分组(万元)企业数(个)200300300400400500500600600以上1930421811合 计120要求:(1)计算120家企业利润额的平均数和标准差。 (2)计算分布的偏态系数和峰态系数。解:Statistics

6、企业利润组中值Mi(万元) NValid120Missing0Mean426.6667Std. Deviation116.48445Skewness0.208Std. Error of Skewness0.221Kurtosis-0.625Std. Error of Kurtosis0.43849 一家公司在招收职员时,首先要通过两项能力测试。在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。一位应试者在A项测试中得了115分,在B项测试中得了425分。与平均分数相比,该应试者哪一项测试更为理想?解:应用标准分数来考虑问题,该应试者标准分数

7、高的测试理想。ZA=1;ZB=0.5 因此,A项测试结果理想。411 对10名成年人和10名幼儿的身高进行抽样调查,结果如下:成年组166 169 l72 177 180 170 172 174 168 173幼儿组68 69 68 70 7l 73 72 73 74 75要求:(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量?为什么? 均值不相等,用离散系数衡量身高差异。 (2)比较分析哪一组的身高差异大?成年组幼儿组平均172.1平均71.3标准差4.201851标准差2.496664离散系数0.024415离散系数0.035016 幼儿组的身高差异大。7.3从一个总体中随机

8、抽取n=100的随机样本,得到x=104560,假定总体标准差=86414,构建总体均值的95%的置信区间。解: 已知n =100, =104560, = 85414,1-a95% ,由于是正态总体,且总体标准差已知。总体均值m在1-a置信水平下的置信区间为 104560 ± 1.96×85414÷100= 104560 ±16741.1447.4 从总体中抽取一个n=100的简单随机样本,得到=81,s=12。样本均值服从正态分布:或置信区间为:,=1.2(1)构建的90的置信区间。=1.645,置信区间为:(81-1.645×1.2,81+

9、1.645×1.2)=(79.03,82.97)(2)构建的95的置信区间。=1.96,置信区间为:(81-1.96×1.2,81+1.96×1.2)=(78.65,83.35)(3)构建的99的置信区间。=2.576,置信区间为:(81-2.576×1.2,81+2.576×1.2)=(77.91,84.09)7.5利用下面的信息,构建总体均值的置信区间 (1)=25,=3.5,n=60,置信水平为95% (2)=119.6,s=23.89,n=75,置信水平为95%(3)=3.419,s=0.974,n=32,置信水平为90%解: 1) 1

10、-a95% , 其置信区间为:25±1.96×3.5÷60= 25±0.885 2) 1-a98% ,则a=0.02, a/2=0.01, 1-a/2=0.99,查标准正态分布表,可知: 2.33 其置信区间为: 119.6±2.33×23.89÷75= 119.6±6.345 3) 1-a90%,1.65 其置信区间为: 3.149±1.65×0.974÷32= 3.149±0.2847.7 某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取3

11、6人,调查他们每天上网的时间,得到下面的数据3.33.16.25.82.34.15.44.53.24.42.05.42.66.41.83.55.72.32.11.91.25.14.34.23.60.81.54.71.41.22.93.52.40.53.62.5求该校大学生平均上网时间的置信区间,置信水平分别为95。解:(1)样本均值=3.32,样本标准差s=1.61;(2)抽样平均误差: 重复抽样:=1.61/6=0.268 不重复抽样:=0.268×=0.268×0.998=0.267(3)置信水平下的概率度:=0.95,t=1.96(4)边际误差(极限误差): =0.9

12、5,=重复抽样:=1.96×0.268=0.525不重复抽样:=1.96×0.267=0.523(5)置信区间: =0.95, 重复抽样:=(2.79,3.85)不重复抽样:=(2.80,3.84)7.8从一个正态总体中随机抽取样本量为8的样本,各样本值分别为:10、8、12、15、6、13、5、11.,求总体均值的95%的置信区间解:本题为一个小样本正态分布,未知。 先求样本均值: = 80÷8=10再求样本标准差:= 84/7 = 3.4641于是 , 的置信水平为1-的置信区间是 , 已知1-=25,n = 8,则=0.05,/2=0.025,查自由度为n-

13、1 = 7的 分布表得临界值 2.45所以,置信区间为: 10±2.45×3.4641÷7711 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为l00g。现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(g)包数969898100100102102104104106233474合计50已知食品包重量服从正态分布,要求: (1)确定该种食品平均重量的95的置信区间。 解:大样本,总体方差未知,用z统计量 样本均值=101.4,样本标准差s=1.829置信区间: =0.95,=1.96=(100.89,101.91)(2)如果规定食品重量

14、低于l00g属于不合格,确定该批食品合格率的95的置信区间。解:总体比率的估计大样本,总体方差未知,用z统计量 样本比率=(50-5)/50=0.9置信区间: =0.95,=1.96= =(0.8168,0.9832)7.18某小区共有居民500户,小区管理着准备采用一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。(1)求总体中赞成该项改革的户数比例的置信区间(2)若小区管理者预计赞成的比例能达到80%,估计误差不超过10%,应抽取多少户进行调查?解:1)已知N=50,P=32/50=0.64,=0.05,/2 =0.025 ,则1.96置

15、信区间:P±P(1-P)/N= 0.64±1.960.64×0.36/50= 0.64±1.96×0.48/7.07=0.64±0.1332)已知丌=0.8 , E = 0.1, =0.05,/2 =0.025 ,则1.96 N= ²丌(1-丌)/E²= 1.96²×0.8×0.2÷0.1²628.1已知某炼铁厂的含碳量服从正态分布N(4.55,0.108²),现在测定了9炉铁水,其平均含碳量为4.484,如果估计方差没有变化,可否认为现在生产的铁水平均含

16、碳量为4.55?解: 已知0=4.55,²=0.108²,N=9,=4.484,这里采用双侧检验,小样本,已知,使用Z统计。 假定现在生产的铁水平均含碳量与以前无显著差异。则,H0 : =4.55 ; H1 : 4.55 =0.05,/2 =0.025 ,查表得临界值为1.96 计算检验统计量: = (4.484-4.55)/(0.108/9)= -1.833 决策:Z值落入接受域,在a=0.05的显著性水平上接受H0。结论:有证据表明现在生产的铁水平均含碳量与以前没有显著差异,可以认为现在生产的铁水平均含碳量为4.55。82 一种元件,要求其使用寿命不得低于700小时。现

17、从一批这种元件中随机抽取36件,测得其平均寿命为680小时。已知该元件寿命服从正态分布,60小时,试在显著性水平005下确定这批元件是否合格。解:H0:700;H1:700 已知:680 60由于n=3630,大样本,因此检验统计量: -2当0.05,查表得1.645。因为z-,故拒绝原假设,接受备择假设,说明这批产品不合格。8.3某地区小麦的一般生产水平为亩产250公斤,其标准差为30公斤,先用一种花费进行试验,从25个小区抽样,平均产量为270公斤。这种化肥是否使小麦明显增产?解:已知0 =250, = 30,N=25, =270 这里是小样本分布,已知,用Z统计量。右侧检验, =0.05

18、,则Z=1.645提出假设:假定这种化肥没使小麦明显增产。 即 H0:250 H1: 250计算统计量: Z = (-0)/(/N)= (270-250)/(30/25)= 3.33结论:Z统计量落入拒绝域,在 =0.05的显著性水平上,拒绝H0,接受H1。决策:有证据表明,这种化肥可以使小麦明显增产。10.1从3个总体中各抽取容量不同的样本数据,结果如下。检验3个总体的均值之间是否有显著差异方差分析:单因素方差分析SUMMARY组观测数求和平均方差样本1579015861.5样本2460015036.66667样本33507169121方差分析差异源SSdfMSFP-valueF crit组

19、间618.91672309.45834.65740.0408778.021517组内598966.44444总计1216.9171110.。2下面是来自5个总体的样本数据方差分析:单因素方差分析SUMMARY组观测数求和平均方差样本133712.333334.333333样本2550101.5样本3448120.666667样本580161.5样本5678130.8方差分析差异源SSdfMSFP-valueF crit组间93.76812423.4420315.823371.02E-054.579036组内26.66667181.481481总计120.434822103 一家牛奶公司有4台机

20、器装填牛奶,每桶的容量为4L。下面是从4台机器中抽取的样本数据:机器l机器2机器3机器44.053.993.974.004.014.023.984.024.024.013.973.994.043.993.954.0l4.004.004.00取显著性水平a0.01,检验4台机器的装填量是否相同?解:不相同。ANOVA每桶容量(L) 平方和df均方F显著性组间0.00730.0028.7210.001组内0.004150.000总数0.0111811.6 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据: 地区 人均GDP(元) 人均消费水平(元) 北京 辽宁 上海 江

21、西 河南 贵州 陕西 22 460 11 226 34 547 4 851 5 444 2 662 4 549 7 326 4 490 11 546 2 396 2 208 1 608 2 035要求: (1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。 (2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 (3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。 (4)计算判定系数,并解释其意义。 (5)检验回归方程线性关系的显著性(a=0.05)。 (6)如果某地区的人均GDP为5 000元,预测其人均消费水平。(7)求人均GDP为5 000元时,人均消费水平95的置信区间和预测区间。解:(1)可能存在线性关系。(2)相关系数:有很强的线性关系。相关性 人均GDP(元)人均消费水平(元)人均GDP(元)Pearson 相关性1.998(*)显著性(双侧)0.000N7

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论