统计学(第五版)课后答案_第1页
统计学(第五版)课后答案_第2页
统计学(第五版)课后答案_第3页
统计学(第五版)课后答案_第4页
统计学(第五版)课后答案_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学(第五版)课后答案统计学(第五版)课后答案统计学(第五版)课后答案统计学(第五版)课后答案编制仅供参考审核批准生效日期地址:电话:传真:邮编:4.1一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:24710101012121415要求:(1)计算汽车销售量的众数、中位数和平均数。(2)根据定义公式计算四分位数。(3)计算销售量的标准差。(4)说明汽车销售量分布的特征。解:Statistics汽车销售数量NValid10Missing0MeanMedianMode10Std.DeviationPercentiles2550754.2随机抽取25个网络用户,得到他们的年龄数据如下:19152925242321382218302019191623272234244120311723要求;(1)计算众数、中位数:1、排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄FrequencyPercentCumulativeFrequencyCumulativePercentValid151116121713181419372029211102221223315242172511827119291203012131122341233812441125Total25从频数看出,众数Mo有两个:19、23;从累计频数看,中位数Me=23。(2)根据定义公式计算四分位数。Q1位置=25/4=,因此Q1=19,Q3位置=3×25/4=,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+×2=。(3)计算平均数和标准差;Mean=;Std.Deviation=(4)计算偏态系数和峰态系数:Skewness=;Kurtosis=(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=、呈右偏分布。如需看清楚分布形态,需要进行分组。为分组情况下的直方图:为分组情况下的概率密度曲线:分组:1、确定组数:,取k=62、确定组距:组距=(最大值-最小值)÷组数=(41-15)÷6=,取53、分组频数表网络用户的年龄(Binned)FrequencyPercentCumulativeFrequencyCumulativePercentValid<=151116-208921-2591826-3032131-3522336-4012441+125Total25分组后的均值与方差:MeanStd.DeviationVarianceSkewnessKurtosis分组后的直方图:4.6在某地区抽取120家企业,按利润额进行分组,结果如下:按利润额分组(万元)企业数(个)200~300300~400400~500500~600600以上1930421811合计120要求:(1)计算120家企业利润额的平均数和标准差。(2)计算分布的偏态系数和峰态系数。解:Statistics企业利润组中值Mi(万元)NValid120Missing0MeanStd.DeviationSkewnessStd.ErrorofSkewnessKurtosisStd.ErrorofKurtosis4.9一家公司在招收职员时,首先要通过两项能力测试。在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。一位应试者在A项测试中得了115分,在B项测试中得了425分。与平均分数相比,该应试者哪一项测试更为理想解:应用标准分数来考虑问题,该应试者标准分数高的测试理想。ZA===1;ZB===因此,A项测试结果理想。4.11对10名成年人和10名幼儿的身高进行抽样调查,结果如下:成年组166169l72177180170172174168173幼儿组686968707l7372737475要求:(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量为什么均值不相等,用离散系数衡量身高差异。(2)比较分析哪一组的身高差异大成年组幼儿组平均平均标准差标准差离散系数离散系数幼儿组的身高差异大。从一个总体中随机抽取n=100的随机样本,得到x=104560,假定总体标准差σ=86414,构建总体均值μ的95%的置信区间。解:已知n=100,=104560,σ=85414,1-=95%,由于是正态总体,且总体标准差已知。总体均值在1-置信水平下的置信区间为104560±×85414÷√100=104560±从总体中抽取一个n=100的简单随机样本,得到=81,s=12。样本均值服从正态分布:或置信区间为:,==(1)构建的90%的置信区间。==,置信区间为:(×,81+×)=(,)(2)构建的95%的置信区间。==,置信区间为:(×,81+×)=(,)(3)构建的99%的置信区间。==,置信区间为:(×,81+×)=(,)利用下面的信息,构建总体均值的置信区间(1)=25,σ=,n=60,置信水平为95%(2)=,s=,n=75,置信水平为95%(3)=,s=,n=32,置信水平为90%解:∵∴1)1-=95%,其置信区间为:25±×÷√60=25±2)1-=98%,则=,/2=,1-/2=,查标准正态分布表,可知:其置信区间为:±×÷√75=±3)1-=90%,其置信区间为:±×÷√32=±某大学为了解学生每天上网的时间,在全校7500名学生中采取重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据求该校大学生平均上网时间的置信区间,置信水平分别为95%。解:(1)样本均值=,样本标准差s=;(2)抽样平均误差:重复抽样:==6=不重复抽样:===×=×=(3)置信水平下的概率度:=,t===(4)边际误差(极限误差):=,=重复抽样:==×=不重复抽样:==×=(5)置信区间:=,重复抽样:==(,)不重复抽样:==(,)从一个正态总体中随机抽取样本量为8的样本,各样本值分别为:10、8、12、15、6、13、5、11.,求总体均值μ的95%的置信区间解:本题为一个小样本正态分布,σ未知。先求样本均值:=80÷8=10再求样本标准差:=√84/7=于是,μ的置信水平为1-α的置信区间是,已知1-α=25,n=8,则α=,α/2=,查自由度为n-1=7的分布表得临界值所以,置信区间为:10±×÷√77.11某企业生产的袋装食品采用自动打包机包装,每袋标准重量为l00g。现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(g)包数96~9898~100100~102102~104104~106233474合计50已知食品包重量服从正态分布,要求:(1)确定该种食品平均重量的95%的置信区间。解:大样本,总体方差未知,用z统计量样本均值=,样本标准差s=置信区间:=,====(,)(2)如果规定食品重量低于l00g属于不合格,确定该批食品合格率的95%的置信区间。解:总体比率的估计大样本,总体方差未知,用z统计量样本比率=(50-5)/50=置信区间:=,====(,)某小区共有居民500户,小区管理着准备采用一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。(1)求总体中赞成该项改革的户数比例的置信区间(2)若小区管理者预计赞成的比例能达到80%,估计误差不超过10%,应抽取多少户进行调查解:1)已知N=50,P=32/50=,α=,α/2=,则置信区间:P±√{P(1-P)/N}=±√×50=±×=±2)已知丌=,E=,α=,α/2=,则N=²丌(1-丌)/E²=²××÷²≈62已知某炼铁厂的含碳量服从正态分布N(,²),现在测定了9炉铁水,其平均含碳量为,如果估计方差没有变化,可否认为现在生产的铁水平均含碳量为解:已知μ0=,σ²=²,N=9,=,这里采用双侧检验,小样本,σ已知,使用Z统计。假定现在生产的铁水平均含碳量与以前无显著差异。则,H0:μ=;H1:μ≠α=,α/2=,查表得临界值为计算检验统计量:=决策:∵Z值落入接受域,∴在=的显著性水平上接受H0。结论:有证据表明现在生产的铁水平均含碳量与以前没有显著差异,可以认为现在生产的铁水平均含碳量为。8.2一种元件,要求其使用寿命不得低于700小时。现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。已知该元件寿命服从正态分布,=60小时,试在显著性水平0.05下确定这批元件是否合格。解:H0:μ≥700;H1:μ<700已知:=680=60由于n=36>30,大样本,因此检验统计量:==-2当α=,查表得=。因为z<-,故拒绝原假设,接受备择假设,说明这批产品不合格。某地区小麦的一般生产水平为亩产250公斤,其标准差为30公斤,先用一种花费进行试验,从25个小区抽样,平均产量为270公斤。这种化肥是否使小麦明显增产解:已知μ0=250,σ=30,N=25,=270这里是小样本分布,σ已知,用Z统计量。右侧检验,α=,则Zα=提出假设:假定这种化肥没使小麦明显增产。即H0:μ≤250H1:μ>250计算统计量:Z=(-μ0)/(σ/√N)=(270-250)/(30/√25)=结论:Z统计量落入拒绝域,在α=的显著性水平上,拒绝H0,接受H1。决策:有证据表明,这种化肥可以使小麦明显增产。10..1从3个总体中各抽取容量不同的样本数据,结果如下。检验3个总体的均值之间是否有显著差异方差分析:单因素方差分析SUMMARY组观测数求和平均方差样本15790158样本24600150样本33507169121方差分析差异源SSdfMSFP-valueFcrit组间2组内5989总计1110.。2下面是来自5个总体的样本数据方差分析:单因素方差分析SUMMARY组观测数求和平均方差样本1337样本255010样本344812样本58016样本567813方差分析差异源SSdfMSFP-valueFcrit组间4组内18总计2210.3一家牛奶公司有4台机器装填牛奶,每桶的容量为4L。下面是从4台机器中抽取的样本数据:机器l机器2机器3机器4取显著性水平a=,检验4台机器的装填量是否相同解:不相同。ANOVA每桶容量(L)平方和df均方F显著性组间3组内15总数18下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:地区人均GDP(元)人均消费水平(元)北京辽宁上海江西河南贵州陕西224601122634547485154442662454973264490115462396220816082035要求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。(4)计算判定系数,并解释其意义。(5)检验回归方程线性关系的显著性(a=。(6)如果某地区的人均GDP为5000元,预测其人均消费水平。(7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。解:(1)可能存在线性关系。(2)相关系数:有很强的线性关系。相关性人均GDP(元)人均消费水平(元)人均GDP(元)Pearson相关性1.998(**)显著性(双侧)N77人均消费水平(元)Pearson相关性.998(**)1显著性(双侧)N77**.在.01水平(双侧)上显著相关。(3)回归方程:回归系数的含义:人均GDP没增加1元,人均消费增加元。系数(a)模型非标准化系数标准化系数t显著性B标准误Beta1(常量)人均GDP(元)a.因变量:人均消费水平(元)(4)人均GDP对人均消费的影响达到%。模型摘要模型RR方调整的R方估计的标准差1.998(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论