统计学第一章作业.doc_第1页
统计学第一章作业.doc_第2页
统计学第一章作业.doc_第3页
统计学第一章作业.doc_第4页
统计学第一章作业.doc_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章 描述性统计1. 某生产车间50名工人日加工零件数如下(单位:个)。试在minitabe下画直方图,并分析数据特征。1171221241291391071171301221251081311251171221331261221181081101181231261331341271231181121121341271231191131201231271351371141201281241151391281241211.给数据排序2.拿数据最大值减最小值,确定组数 3.由于组距一般为5或10,因此确定组距为5 4.计算频数 5.绘制直方图,再编辑横轴和纵轴的区间。数据特征:大多数人的日加工零件数在120到125之间。2. 为了了解车间加工零件误差与原材料供应商以及工人的关系,收集如下数据,试画多元箱线图展示该数据并进行分析原材料供应商员工编号1234567甲0.3790.3310.2590.2330.2230.2890.396甲0.4000.3050.2770.2310.4340.4750.329乙0.2670.3250.2990.3720.1570.2570.399乙0.0980.6170.2360.2190.3050.2120.334丙0.2660.4510.3040.4230.2740.2990.173丙0.2990.5460.3920.4340.3120.3180.218丁0.1220.3420.1760.2420.4270.2650.136丁0.2480.2580.2690.1720.3030.3900.034由原材料供应商的箱线图可知,原材料供应商的数据比较集中,差距不大,但从工人的箱线图看出,工人的数据起伏波动较大,尤其是工人2的数据,跟其他工人的数据相比有很大的差异,因此原材料供应商对加工零部件误差的影响要小于工人对加工零部件的影响。3. 甲乙两个班各有40名学生,期末统计学考试成绩的分布如下:考试成绩人数甲班乙班优36良615中189及格98不及格42 (1)根据上面的数据,在Excel中画出两个班考试成绩的复合柱形图、环形图和图饼图。(2)比较两个班考试成绩分布的特点。(3)在Excel中画出雷达图,比较两个班考试成绩的分布是否相似。 (1) (2)从上面的图标可以看出,甲班同学的考试成绩主要分布在中,乙班同学的考试成绩主要分布在良。甲班的不及格人数比乙班的不及格人数多。(3)从上图可知,甲乙两班考试成绩的分布不相似。4. 随机抽取25个网络用户,得到他们的年龄数据(单位:周岁)如下:网民年龄151617181919192020212222232323242425272930313438(1)计算众数、中位数。(exlce数据分析:众数19,中位数22.5)(2)根据定义公式计算四分位数(上四分位数的位置为3(24+1)/4=18.75,所以上四分位数是26.5,下四分位数的位置是(24+1)/4=6.25,所以下四分位数是19)。(3)计算平均数和标准差(平均数是23.29,标准差是5.75)。(4)计算偏态系数和峰态系数(偏态系数是0.93,峰度系数是0.59)。(5)对网民年龄的分布特征进行综合分析。(根据以上的分析得出,网民的年龄主要集中在19岁,偏态系数大于0,说明网民的年龄分布呈现右偏分布,即年龄较小的网民占绝大多数,峰态系数大于0,说明网民的年龄分布为尖峰分布,表明年龄较小的网民占较大比重。)5. 某银行为缩短顾客到银行办理业务等待的时间,准备采用两种排队方式进行试验:一种是所有顾客都进入一个等待队列;另一种是顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,两种排队方式各随机抽取的9名顾客,得到第一中排队方式的平均等待时间为7.2分钟,标准差为,1.97分钟,第二种排队方式的等待时间(单位:min)如下: 排队时间5.56.66.76.87.17.37.47.87.8()计算第二种排队方式等待时间的平均数和标准差(平均数是7,标准差是0.71)。()比较两种排队方式等待时间的离散程度(因为两种排队方式的平均数不同,所以用离散系数进行比较,利用离散系数的计算公式,得第一种排队方式的离散系数0.274,第二种排队方式的离散系数是0.102,所以第一种排队方式等待时间的离散程度大于第二种排队方式)。() 如果让你选择一种排队方式,你会选择哪一种?试说明理由(选择第二种,因为平均等待时间短,而且离散程度小)。6. 在某地区抽取的120家企业按利润额进行分组,结果如下 按利润额分组企业数20030019300400304005004250060018600以上11合计120 (1)计算120家企业利润额的均值和标准差;(2)计算分布的偏态系数和峰态系数;() 画直方图,阶段企业利润的分布特性。(1)利用加权均值的公式(ppt77),得均值为427,利用总体组距分组差公式,得标准差为116。(2)利用偏态系数公式,得偏态系数为1.34,利用峰度系数公式得,峰度系数为2.29(3) 由上图可知,企业的利润大多分布在400-500,偏态系数大于0,说明企业的利润分布呈现右偏分布,即利润达不到600以上的企业占绝大多数,峰态系数大于0,说明企业的利润分布为尖峰分布,表明利润较小的企业占较大比重7. 2005年4月北京亚运村市场汽车交易市场的汽车销售数据(单位:辆)如下:国产车销售排行前10名销售量进口车销售排行前10名销售量福美来556丰田149夏利541现代102捷达370日产68松花江298奔驰30富康277宝马30哈飞路宝200大众汽车23高尔夫190克莱斯勒17东方之子181本田16长安奥拓145雷克萨斯10爱丽舍117奥迪6(1)画出国产汽车和进口汽车销售量的对比条形图和环形图。(2)分别画出国产汽车和进口汽车销售量的帕累托图。(1)(2)首先计算出各车的累计频率。然后制图。频数累计频率频数累计频率福美来556287519.34%19.34%丰田14945133.04%33.04%夏利541287518.82%38.16%现代10245122.62%55.65%捷达370287512.87%51.03%日产6845115.08%70.73%松花江298287510.37%61.39%奔驰304516.65%77.38%富康27728759.63%71.03%宝马304516.65%84.04%哈飞路宝20028756.96%77.98%大众汽车234515.10%89.14%高尔夫19028756.61%84.59%克莱斯勒174513.77%92.90%东方之子18128756.30%90.89%本田164513.55%96.45%长安奥拓14528755.04%95.93%雷克萨斯104512.22%98.67%爱丽舍11728754.07%100.00%奥迪64511.33%100.00%8. 对10名成年人和10名幼儿的身高(单位:cm)进行抽样调查,结果如下:成年组166169172177180170172174168173幼儿组68696870717372737475 (1)要比较成年组和幼儿组的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论