统计学课程设计_第1页
统计学课程设计_第2页
统计学课程设计_第3页
统计学课程设计_第4页
统计学课程设计_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计学课程设计班级:国贸091 学号:209090407姓名:张文骏 2011年12月第一部分 数据的图表展示1.01 为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:a.好;b.较好;c.一般;d.差;e.较差。调查结果见下表。要求:(1)指出上面的数据属于什么类型?(2)用excel制作一张频数分布表;(3)绘制一张条形图,反映评价等级的分布。beccabdacedacbccdeeeadbccdacebbacdedadbccbcedcbbccdacbccdeebbeccabdacebacdedadbcadbccdacebcbcedcbbcc解

2、(1)顺序数据 (2)服务质量等级频数分布表服务质量等级频数频率%a1414b2121c3232d1818e1515 (3) 1.02某行业管理局所属40个企业2002年的产品销售收入数据(单位:万元)见下表3.02。要求:1) 根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;2) 如果按规定:销售收入在125万元以上为先进企业,115125万元为良好企业,105115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。 152103105136105103123146117137116127971381151351249211

3、0117119118115113108120100104881128712512995107108114142119126解:(1)按销售收入分组(万元)企业数(个)频率(%)向上累积向下累积企业数频率企业数频率100以下100110110120120130130140140以上591274312.522.530.017.510.07.55142633374012.535.065.082.592.5100.04035261473100.087.565.035.017.57.5合计40100.0(2) 按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.

4、527.522.522.5合计40100.01.03 某考试管理中心对2002年参加成人自学考试的12000名学生的年龄分组数据见下表。1) 对这个年龄分布作直方图;2) 从直方图分析成人自学考试人员年龄分布的特点。 年龄%18191.9212134.7222434.1252917.230346.435392.740441.845591.2解:(1) (2)从上图可以看出,2002年成人考试的年龄分布是不对称的。其中,21-22、22-24年龄阶段的考生最多。右部的尾部比左部的尾部长。此年龄分布的形状接近右偏分布。1.04 19781999年我国的国内生产总值数据如下(按当年价格计算,单位:亿

5、元)见下表。(1)用excel绘制国内生产总值的线图;(2)制第一、二、三产业国内生产总值的线图;(3)根据1999年的国内生产总值及其构成数据,绘制饼图。 年 份国内生产总 值第一产业第二产业第三产业19783624.11018.41745.2860.519794038.21258.91913.5865.819804517.81359.42192966.419814862.41545.62255.51061.319825294.71761.623831150.119835934.51960.82646.21327.5198471712295.53105.71769.819858964.425

6、41.63866.62556.2198610202.22763.94492.72945.6198711962.53204.35251.63506.6198814928.338316587.24510.1198916909.2422872785403.2199018547.950177717.45813.5199121617.85288.69102.27227199226638.1580011699.59138.6199334634.46882.116428.511323.8199446759.49457.222372.214930199558478.11199328537.917947.219

7、9667884.613844.233612.920427.5199774462.614211.237222.723028.7199878345.214552.438619.325173.5199981910.914457.240417.927035.8解:(1) (2)(3)第二部分 数据的特征描述2.01 某百货公司6月份各天的销售额数据如下(单位:万元) 见下表。1) 计算该百货公司日销售额的均值、中位数和四分位数;2) 计算日销售额的标准差。 2573102762402972362522652382782712742922672612802812913012582722632843222

8、68249303269273295解:(1)&(2)平均值274.1中位数272.5标准差21.17472上四分位数261.5下四分位数289.25 2.02 甲乙两个企业生产三种产品的单位成本和总成本资料见下表。 比较哪个企业的总平均成本高?并分析其原因。 产品单位成本总成本(元)名称(元)甲企业乙企业a1521003255b2030001500c3015001500解:甲公司的总平均成本:(2100+3000+1500)/(2100/15+3000/20+1500/30)=19.412乙公司的总平均成本:(3255+1500+1500)/(3255/15+1500/20+1500/30)=

9、18.289由此可见,甲公司的总平均成本高2.03 在某地区抽取的120家企业按利润额进行分组,结果见下表。1) 计算120家企业利润额的均值和标准差;2) 计算分布的偏态系数和峰态系数。 按利润额分组(万元)企业数(个)20030019300400304005004250060018600以上11合计120解:平均426.6667标准差116.4845峰度-0.6247偏度0.208442 2.04 对10名成年人和10名幼儿的身高(厘米)进行抽样调查,结果见下表。(1)要比较成年组和幼儿组的身高差异,你会采用什么样的指标测度值?为什么?(2)比较分析哪一组的身高差异大? 成年组166169

10、172177180170172174168173幼儿组68696870717372737475解:(1)离散系数 (2)成人组:标准差=4.2091,均值=172.1,离散系数=标准差/均值=0.0244 幼儿组:标准差=204967,均值=71.3,离散系数=标准差/均值=0.0350 因为幼儿组的离散系数大于成人组的离散系数,所以幼儿组的身高差异大。2.05 一种产品需要人工组装,现有三种可供选择的组装方法。为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。15个工人分别用三种方法在相同的时间内组装的产品数量(单位:个)见下表。(1)你准备采用什么方法来评价组装方法的优劣?

11、(2)如果让你选择一种方法,你会作出怎样的选择?试说明理由。 方法a方法b方法c164129125167130126168129126165130127170131126165130128164129127168127126164128127162128127163127125166128126167128116166125126165132125解:(1)可以通过比较各组数据的标准差来评价个组装方法的优劣。 (2)方法a的标准差为2.1314,方法b的标准差为1.7512,方法c的标准差为2.7740。 因为方法b的标准差最小,说明用此方法组装的波动幅度最小。所以选择方法b。第三部分 参数估

12、计3.01 某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间(单位:小时) ,得到的数据见下表。 求该校大学生平均上网时间的置信区间,置信概率分别为90%、95%和99%。 3.35.85.43.12.34.56.24.13.24.42.63.526.45.75.41.82.32.15.13.61.94.30.81.24.21.54.72.90.51.43.53.61.22.42.5解:(1)置信概率为90%时平均3.316666667标准差1.609347694置信区间0.441190232 由图表可知,在置信概率为90%时,置信

13、区间为3.31670.4412(2)置信概率为95%时平均值3.316666667标准差1.609347694置信区间0.525710586 由图表可知,在置信概率为90%时,置信区间为3.31670.5257 (3)置信概率为99%时平均值3.316666667标准差1.609347694置信区间0.690900825 由图表可知,在置信概率为99%时,置信区间为3.31670.69093.02 生产工序的方差是共需质量的一个重要度量。当方差较大时,需要对共需进行改进以减小方差。下面是两部机器生产的袋茶重量(克)的数据见下表。构造两个总体方差比s12/s22 95%的置信区间。 机器1机器2

14、机器1机器2机器1机器23.453.223.223.283.903.353.203.382.983.193.703.303.223.303.753.203.283.053.503.303.383.293.353.332.953.343.453.353.203.273.163.283.483.163.123.283.203.303.183.343.253.25解:1=0.5837,2=0.0058置信区间为(4.06,14.35)第四部分 假设检验4.01糖厂用自动打包机打包,每包标准重量是100公斤。每天开工后需要检验一次打包机工作是否正常。某日开工后测得9包重量如下: 99.398.7 10

15、0.5 101.2 98.3 99.7 99.5 102.1 100.5 已知包重服从正态分布,试检验该日打包机工作是否正常? (a=0.05)解:原假设 h0:100;备择假设 h1:100经计算得:99.9778 s1.21221检验统计量:-0.055当0.05,自由度n19时,查表得2.262。因为,样本统计量落在接受区域,故接受原假设,拒绝备择假设,说明打包机工作正常。4.02某种电子元件的寿命(以小时记)服从正态分布。现测得16只元件的寿命如下: 159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170 问是否有

16、理由认为元件的平均寿命显著地大于225小时? (a=0.05)解:原假设 h:225;备择假设 h:225经计算知:241.5 s98.726检验统计量:0.669当0.05,自由度n115时,查表得1.753。因为t,样本统计量在接受区域,故接受原假设,拒绝备择假设,说明元件寿命没有显著大于225小时。4.03 随机抽取9个单位,测得结果分别为: 85 59 66 81 35 57 55 63 66 以a=0.05的显著性水平对下述假设进行检验。 解:经计算知:=63 s=14.688a= 0.05, n=9, df = 9 - 1 = 8, s=215.75, =63临界值(s):15.5

17、1 15.51接受;否则拒绝检验统计量: =8*215.75/100=17.26 17.2615.51决策:在a= 0.05的水平上拒绝h结论:s100 4.04装配一个部件时可以采用不同的方法,所关心的问题是哪一个方法的效率更高。劳动 效率可以用平均装配时间反映。现从不同的装配方法中各抽取12件产品,记录下各自的装 配时间(分钟)如下: 甲法:31 34 29 32 35 38 34 30 29 32 31 26 乙法:26 24 28 29 30 29 32 26 31 29 32 28 两总体为正态总体,且方差相同。问两种方法的装配时间有无显著不同? (a=0.05)解:建立假设h0:1

18、2=0 h1:120总体正态,小样本抽样,方差未知,方差相等,检验统计量 根据样本数据计算,得12,=12,31.75,3.19446,28.6667,=2.46183。 8.13262.6480.05时,临界点为2.074,此题中,故拒绝原假设,认为两种方法的装配时间有显著差异。第五部分 多元线性回归5.01一家电气销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费用对月销售额作出估计。近8个月的销售额与广告费用数据见下表。1) 用电视广告费用作自变量,月销售额作因变量,建立估计的回归方程。2) 用电视广告费用和报纸广告费用作自变量,月销售额作因变量,建立估计的回归方程。3

19、) 上述1)和2)所建立的估计方程,电视广告费用的系数是否相同?对其回归系数分别进行解释。4) 根据问题2)所建立的估计方程,在销售收入的总变差中,被估计的回归方程所解释的比例是多少?5) 根据问题2)所建立的估计方程,检验回归方程的线性关系是否显著 (a=0.05) 月销售收入(万元)y电视广告费用(万元)x1报纸广告费用(万元)x2965.01.5902.02.0954.01.5922.52.5953.03.3943.52.3942.54.2943.02.5解:(1)回归方程为:(2)回归方程为:(3)不相同,(1)中表明电视广告费用增加1万元,月销售额增加1.6万元;(2)中表明,在报纸

20、广告费用不变的情况下,电视广告费用增加1万元,月销售额增加2.29万元。(4)判定系数r2= 0.919,调整的= 0.8866,比例为88.66%。(5)回归系数的显著性检验:coefficients标准误差t statp-valuelower 95%upper 95%下限 95.0%上限 95.0%intercept83.230091.57386952.882484.57e-0879.1843387.2758579.1843387.27585电视广告费用工:x1 (万元)2.2901840.3040657.5318990.0006531.5085613.0718061.5085613.07

21、1806报纸广告费用x2(万元)1.3009890.3207024.0566970.0097610.4765992.1253790.4765992.125379假设:h0:=0 h1:0t=7.53=2.57,认为y与x1线性关系显著5.02某农场通过试验取得早稻收获量与春季降雨量和春季温度的数据见下表。1) 试确定早稻收获量对春季降雨量和春季温度的二元线性回归方程。2) 解释回归系数的实际意义。3) 根据你的判断,模型中是否存在多重共线性?解:(1)回归方程为:(2)在温度不变的情况下,降雨量每增加1mm,收获量增加22.386kghm2,在降雨量不变的情况下,降雨量每增加1度,收获量增加3

22、27.672kghm2。(3)与的相关系数=0.965,存在多重共线性。5.03一家房地产评估公司想对某城市的房地产销售价格(y1)与地产的评估价值(x1)、房产的评估价值(x2)和使用面积(x3)建立一个模型,以便对销售价格作出合理预测。为此,收集了20栋住宅的房地产评估数据见下表12.03。1) 写出估计的多元回归方程。2) 在销售价格的总变差中,被估计的回归方程所解释的比例是多少?3) 检验回归方程的线性关系是否显著(a=0.05)。4) 检验各回归系数是否显著(a=0.05) 。解:(1)由excel输出的回归结果如下: 回归统计 multiple r0.947362r square

23、0.897496adjusted r square0.878276标准误差 791.6823观测值 20方差分析 dfssmsfsignificance f回归分析 3878035052926783546.696973.88e-08残差 1610028175626760.9总计 1997831680 coefficients标准误差 t statp-valuelower 95%intercept148.7005574.42130.258870.799036-1069.02x variable 10.8147380.5119891.5913210.131099-0.27063x variable

24、 20.820980.2111773.8876460.0013070.373305x variable 30.1350410.0658632.0503220.057088-0.00458估计的多元回归方程为: =148.7005+0.8147+0.8210+0.1350(2)判定系数=89.75%,调整的判定系数=87.83% 。表明销售价格的总变差中,被计的回归方程所解释的比例为87.83%。(3)由于significance f3.88e-08(4)p-value=0.1311a=0.05,不显著;p-value=0.0013;p-value=0.0571a=0.05,不显著。 5.04随

25、机抽取的15家大型商场销售的同类产品的有关数据见下表。(1)计算y与x1、y与x2之间的相关系数,是否有证据表明销售价格与购进价格、销售价格与销售费用之间存在线性关系?(2)根据上述结果,你认为用购进价格和销售费用来预测销售价格是否有用?(3)用excel进行回归,并检验模型的线性关系是否显著(a=0.05) 。(4)解释判定系数r2,所得结论与问题2)中是否一致?(5)计算x1与x2之间的相关系数,所得结果意味着什么?解:(1)y与x1的相关系数=0.309,y与x2之间的相关系数=0.0012。对相关性进行检验:相关性 销售价格购进价格销售费用销售价格pearson 相关性10.3090.

26、001显著性(双侧)0.2630.997n151515购进价格pearson 相关性0.3091-.853(*)显著性(双侧)0.2630.000n151515销售费用pearson 相关性0.001-.853(*)1显著性(双侧)0.9970.000n151515*. 在 .01 水平(双侧)上显著相关。可以看到,两个相关系数的p值都比较的,总体上线性关系也不现状,因此没有明显的线性相关关系。(2) 意义不大。回归统计multiple r0.593684r square0.35246adjusted r square0.244537标准误差69.75121观测值15(3)方差分析dfssmsfsignificance f回归分析231778.153915889.083.2658420.073722残差1258382.77944865.232总计1490160.9333coefficients标准误差t statp-valuelower 95%upper 95%下限 95.0%上限 95.0%intercept375.6018339.4105621.106630.290145-363.911115.114-363.9111

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论