第三章、数据的整理及展示1_第1页
第三章、数据的整理及展示1_第2页
第三章、数据的整理及展示1_第3页
第三章、数据的整理及展示1_第4页
第三章、数据的整理及展示1_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章、统计数据的整理和展示【学习目标】了解统计数据的整理的意义掌握统计分组的方法掌握分配数列的编制方法熟悉统计表的结构和编制方法熟悉统计图的特征和绘制方法掌握Excel在统计数据整理的运用第三章、统计数据的整理和展示第一节、统计数据的整理第二节、统计数据的展示第三节、统计数据整理中Excel的运用第一节、统计数据的整理统计调查所收集到的统计数据是零星的、分散的、不系统的,他只能说明总体单位的情况,而不能反映总体的特征,不能深刻揭示现象的本质,更不能从量的方面反映现象发展变化的规律。根据统计研究预定的目的和任务,运用科学的方法和手段,有计划、有组织的收集反映客观现实的统计资料的工作过程。统计调查随机抽取130位顾客的购物小票如下单位:元小票金额人数8以下468—162616—241624—321132--40840—48748—56356—64464—72372—80080以上1130位顾客的购物小票统计表一、统计数据的整理统计数据整理

根据统计研究任务的要求,将统计调查得到的原始资料进行审核、分组、汇总,使之系统化、条理化,形成能够反映总体特征的综合统计资料的工作过程。统计整理主要内容资料审核、分组、汇总、制表、制图等。分组分配数列统计表统计图统计数据整理的意义实现由反映总体单位特征的标志向反映总体综合特征的的统计指标的转化;是从对个体量的观察到对总体量的认识的连接点;是人们对社会经济现象从感性认识到理性认识的过渡阶段;是统计分析的前提和基础。意义对原始资料进行审核进行统计分组加工汇总、编制分配数列制作统计表、绘制统计图统计整理的程序根据统计研究的需要,按某种标志(能反映现象的本质特征)将总体中所有单位分为性质不同但又有联系的几个部分的一种统计方法。统计分组(一)统计分组的意义和种类二、统计分组分组前分组后25%33%42%1、统计分组的意义:第一,分组的结果,对总体而言是“分”,对于个体而言是“合”。

第二,分组的结果,在同一组内则保持着相同的性质、组与组之间保持差异性。

品质分组变量分组

2、统计分组的种类

(1)按照分组标志的性质

选择反映事物属性差异的品质标志作为分组标志,并且在品质标志的变异范围内划分各组界限,将总体划分为若干性质不同又有联系的几个部分。选择反映事物数量差异的数量标志作为分组标志,并且在数量标志的变动范围内划分各组界限,将总体划分为若干性质不同又有联系的几个部分。我国三种产业结构(%)年份1980199020002004200520062007GDP100100100100100100100第一产业29.926.914.813.112.611.811.7第二产业48.241.345.946.247.548.749.2第三产业21.931.839.931.839.939.539.1按照产业类型(品质标志)分组统计学成绩(分)学生人数(人)60以下60-7070-8080-9090-100合计

5

7

8

20

14

54某班同学《统计学》成绩按照成绩(数量标志)分组某地区100个百货商店月销售额与流通费用情况销售额(万元)每百元商品销售额中支付的流通费(元)2135363945454647…32936038718.316.917.215.614.714.213.612.9…8.27.17.6按销售额分组(万元)商店数(个)每百元商品销售额中支付的流通费(元)50以下50~100100~200200~300300以上102030251514.211.410.19.28.5某地区100个百货商店月销售额与流通费用情况按照销售额(数量标志)分组简单分组复合分组

即总体按一个标志进行分组。它只能从某一方面说明总体的分布状况和内部结构。

复合分组是指对所研究的总体按两个或两个以上的标志进行的多层次分组。可用于对事物多方面、多层次的分析研究。

(2)按照分组标志的多少统计学成绩(分)学生人数(人)60以下60-7070-8080-9090-100合计

5

7

8

20

14

54某班同学《统计学》成绩第一标志(职务)第二标志(年龄)第三标志(性别)高级职称(教授、副教授)45岁以上男女45岁以下男女非高级职称(讲师、助教)45岁以上男女45岁以下男女某高校教师按照职务、年龄、性别进行分组练习:如何对下列资料进行分组?某地200家企业的有关资料如下:(1)2000人以下的企业中全民企业10家,集体企业5家,合资企业3家(2)2000—3000人的企业中全民企业20家,集体企业34家,合资企业4家(3)3000—4000人的企业中全民企业15家,集体企业15家,合资企业2家(4)4000人以上的企业中全民企业20家,集体企业15家,合资企业1家职工人数经济类型企业个数2000人以下全民企业10集体企业5合资企业32000--3000全民企业20集体企业34合资企业43000--4000全民企业15集体企业15合资企业24000人以上全民企业20集体企业15合资企业1(二)分组标志的选择统计分组的关键是分组标志的选择分组标志的选择的正确与否关系到能否正确的反映总体的性质特征,能否实现统计调查任务和目的。如:考察学生学习《统计学》的情况:性别、《统计学》成绩?统计学成绩(分)学生人数(人)60以下60-7070-8080-9090-100合计

5

7

8

20

14

54某班同学《统计学》成绩分组标志的选择应该注意的几个问题分组标志要根据统计调查目的和任务选择。若干标志中,要选择最能反映事物本质特征的标志作为分组标志。如:毛泽东的《对湖南农民运动考察报告》中,对农民进行分组,根据研究目的——看农民对中国革命的态度。于是根据阶级成分划分:地主、富农、中农、贫农、赤贫。在分组过程中,毛也看到了生活水平的差异。现在如果研究目的是看农民的生活水平,绝对不能在以阶级成分划分,现在的分组标志应该是农民家庭人均收入。(三)统计分组的方法品质分组:选择反映事物属性差异的品质标志作为分组标志,并且在品质标志的变异范围内划分各组界限,将总体划分为若干性质不同又有联系的几个部分。变量分组:选择反映事物数量差异的数量标志作为分组标志,并且在数量标志的变动范围内划分各组界限,将总体划分为若干性质不同又有联系的几个部分。变量分组分为:单项式分组、组距式分组(等距分组、不等距分组)单项式分组:一个变量值为一组组距式分组:一个区间为一组“穷尽原则”和“互斥原则”。“穷尽原则”是指各分组必须容纳所有总体单位,即总体中的每一个总体单位都必须有组的归属。如劳动者按文化程度分组,分为小学、中学毕业、和大学毕业三组。“互斥原则”是指在特定的分组标志下,总体中的任何一个单位不能同时归属于几个组,而只能归属于某一组。如把鞋子分为男鞋、女鞋、童鞋三类,就不符合互斥原则。

三、分配数列分配数列的概念和分类变量数列的编制(重点)次数分布的主要类型——统计分组整理、汇总的基本结果变量数列品质数列将统计资料按某一标志分成若干组后按照一定的分组顺序,列出各组的总体单位数,形成一个反应总体单位在各组间分配情况的统计数列。分配数列分类不等距数列等距数列组距数列单项数列(一)分配数列的概念和分类分组标志的具体表现(各组名称)各组的次数(频数)构成要素基本形式:分组单位数频率(%)合计………100频数分布频率分布总体单位总量获金牌项目

金牌数占总数比例跳水5枚0.1786举重5枚0.1786乒乓球4枚0.1429羽毛球4枚0.1429体操3枚0.1071射击3枚0.1071柔道2枚0.0714田径1枚0.0357跆拳道1枚0.0357中国体育代表团在悉尼奥运会上获金牌的项目品质数列变量数列品质数列种类通常我们用X表示变量,变量数列由两串数字组成,一串数字为变量的不同取值,另一串为次数或频率。

用表示变量值,表示次数。

用变量数列品质数列种类异距数列等距数列组距数列单项数列变量数列按每个组的变量取值形式不同将若干个相邻的变量值合并为一组,使每个组有一个变量值变动范围,以组距形式表示的变量数列。组距数列的每组变量值为一个区间。是按数量标志分组后,用一个变量值代表一个组形成的数列。即一个变量值为一组。某地区100个百货商店月销售额与流通费用情况销售额(万元)每百元商品销售额中支付的流通费(元)2135363945454647…32936038718.316.917.215.614.714.213.612.9…8.27.17.6按销售额分组(万元)商店数(个)每百元商品销售额中支付的流通费(元)50以下50~100100~200200~300300以上102030251514.211.410.19.28.5(1)单项数列的编制同时具备变量是离散变量变量值个数较少(二)变量数列的编制单项数列编制条件:单项数列一个变量值为一组的变量数列编制步骤排序汇总组单位数(次数)

制作单项数列统计表【例】己知某车间有24名工人,他们的日产量(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。日产量(件)X工人数(人)f202122232425263564321合计24编制结果如下:【例】统计某企业40名工人在一个工作日内生产的零件数量。请根据表中资料编制单项数列。40名工人一个班次生产的零件数量找出最大值和最小值排序汇总组单位数(次数)

制作单项数列统计表【解】作业:思考与练习5编制单项数列统计表组距数列指每个组的变量值用一个区间来表现的变量数列(2)组距数列的编制变量是连续变量;总体单位数较多、变量值个数也较多的离散变量。

编制条件:变量值变动区间的长度相等变量值变动区间的长度不完全相等等距数列不等距数列注意:数据分组一般还与数据本身的特点及数据的多少有关。分组的目的是观察数据分布的特征。组数太少则数据分布就会过于集中,组数太多数据分布就会过于分散,不便于观察数据分布的特征和规律。一般情况下数据组数不少于5组且不多于15组。实际应用中,可根据数据的多少和特点及分析的要求确定组数。组距数列的编制程序编制步骤或内容计算组中值排序确定组限计算变异全距确定组数、组距汇总组单位数制作组距数列统计表编制组距数列将要使用的相关概念总的变异范围。简称全距,用R来表示。变异全距变异全距的计算公式:指每组两端表示各组界限的变量值,各组的最小值为下限L,最大值为上限U。组限当首、末组组限采用“××以下”或“××以上”形式时。开口式组距数列相关概念每组变量值变动区间的长度,为上下限之差组距每组变量取值范围的中点数值组中值组中值=各组只包括本组下限变量值至本组上限以下变量值的单位。上组限不记入原则“××以上”组距数列的上限值“××以下”组距数列的下限值假定上限假定下限开口式组距数列组中值的计算:首组假定下限=首组上限-相邻组组距末组假定上限=末组下限+相邻组组距先计算开口组的假定上、下限:

因此有:首组组中值末组组中值某地区100个百货商店月销售额与流通费用情况销售额(万元)商店数(个)每百元商品销售额中支付的流通费(元)50以下50~100100~200200~300300以上102030251514.211.410.19.28.5上组限U下组限L如:组距d=U-L=100-50=50(万元)如:组中值x=(U+L)/2=(100+200)/2=150(万元)假定上限400假定下限040名工人一个班次生产的零件数量【例】统计某企业40名工人在一个工作日内生产的零件数量。请根据表中资料编制组距数列。③确定组数及组距等距数列编制步骤:【解】①排序②计算变异全距计算组数(组数不宜过多,也不宜太少)计算组数(我们使用斯特基斯H.A.Sturges公式)其中,N是总体单位总数。编制等距数列本例中(当的结果为整数时)(当的结果为小数时)因此,取本例中,m=7,则有(当的结果为整数时)(当的结果为小数时)由于R≤组距(d)×组数(m)确定组距的原则:要能区分各组的性质差异要能反映总体资料的分布特征为方便计算,尽可能为5或10的整数倍④确定组限对于离散变量,相邻组组限可以间断,也可重叠;对于连续变量,相邻组组限必须重叠;符合“上组限不计入”原则;首末两组可使用“××以下”及“××以上”的开口组。组限的表示方法日产量(件)组中值次数合计—试分组?日产量(件)组中值次数82以下82~8686~9090~9494~9898~102102以上合计—⑤计算次数日产量(件)组中值次数82以下82~8686~9090~9494~9898~102102以上04918531合计—40?日产量(件)组中值次数83以下83~8787~9191~9595~9999~103103以上131710621合计—40试分组?编制结果:日产量(件)组中值次数83以下83~8787~9191~9595~9999~103103以上131710621合计—40??⑥制作组距数列编制等距数列适用于总体单位的标志值变动比较均匀的情况实例己知某地区某年50个商店商品销售额的资料如下(单位:百万元):

7.412.629.02.012.47.014.817.515.018.218.715.512.826.017.38.314.712.03.56.825.019.36.44.011.98.513.214.517.115.613.44.59.520.015.76.011.423.014.216.721.016.013.610.013.95.05.810.516.322.0要求编制组距数列。③确定组数及组距等距数列编制步骤:【解】①排序②计算变异全距其中,N=50④确定组限销售额(百万元)组中值商店数(次数)2~66~1010~1414~1818~2222~2626~30481216202428681214532合计—50⑤计算次数⑥制作组距数列P50例题3.1Excel操作时注意确定分组上限的确定例:某电脑公司2008年前四个月的销售量(单位:台)141159166172177182188196203214143160167173177183189196203215144160168173178184189196205218149161168174178185189196206223150161168174178186190196207225152162170174179186190197208226153163171175179187191197209228153163171175179187192198210233154164172175180187194198210233155165172175180187194200211234156165172176181188195201211234158165172176182188195202213237组数及组距的确定最小值141最大值237数据个数120全距96组数10组距102.确定分组上限、计算频数Excel在计算频数时,每一组的频数包括组的上限值,即a<x<=b数据分组原则:上组限不计入,即a<=x<b所以,右面的分组是正确的。但是,分组上限的确定不正确。

按销售量分组(台)分组上限频数(天)140-1501505150-1601601016018018028180-19019020190-20020016200-21021011210-2202206220-2302304230-24024052.确定分组上限、计算频数(续)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论