第三章、数据的整理及展示1_第1页
第三章、数据的整理及展示1_第2页
第三章、数据的整理及展示1_第3页
第三章、数据的整理及展示1_第4页
第三章、数据的整理及展示1_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章、统计数据的整理和展示第三章、统计数据的整理和展示 【学习目标】o 了解统计数据的整理的意义o 掌握统计分组的方法o 掌握分配数列的编制方法o 熟悉统计表的结构和编制方法o 熟悉统计图的特征和绘制方法o 掌握Excel在统计数据整理的运用第三章、统计数据的整理和展示第三章、统计数据的整理和展示o 第一节、统计数据的整理o 第二节、统计数据的展示o 第三节、统计数据整理中Excel的运用第一节、统计数据的整理o 统计调查所收集到的统计数据是零星的、分零星的、分散的、不系统的散的、不系统的,他只能说明总体单位的情况,而不能反映总体的特征,不能深刻揭示现象的本质,更不能从量的方面反映现象发展变

2、化的规律。根据统计研究预定的目的和任务,运用科学的方法和手段,有计划、有组织的收集反映客观现实的统计资料的工作过程。随机抽取130位顾客的购物小票如下单位:元小票金额小票金额人数人数8以下468162616241624321132-408404874856356644647237280080以上1130位顾客的购物小票统计表010203040500102030405060708090FrequencyLINGSHOU一、统计数据的整理统计整理统计整理主要内容主要内容资料审核、分组、资料审核、分组、汇总、制表、制图等。汇总、制表、制图等。分组分组分配数列分配数列统计表统计表统计图统计图统计数据整

3、理的意义根据统计研究的需要,按某种根据统计研究的需要,按某种标志标志(能反映现象的本质特征)将总体中(能反映现象的本质特征)将总体中所有单位分为性质不同但又有联系的所有单位分为性质不同但又有联系的几个部分的一种统计方法。几个部分的一种统计方法。253342品质分组品质分组变量分组变量分组 选择反映事物属性差异的品质标志作为分组标志,并且在品质标志的变异范围内划分各组界限,将总体划分为若干性质不同又有联系的几个部分。选择反映事物数量差异的数量标志作为分组标志,并且在数量标志的变动范围内划分各组界限,将总体划分为若干性质不同又有联系的几个部分。我国三种产业结构(我国三种产业结构(% %)年份198

4、0199020002004200520062007GDP100100100100100100100第一产业29.926.914.813.112.611.811.7第二产业48.241.345.946.247.548.749.2第三产业21.931.839.931.839.939.539.1按照产业类型(品质标志)分组统计学成绩(分)学生人数(人)60以下60707080809090100合计578201454某班同学统计学成绩 按照成绩(数量标志)分组销售额(万元)销售额(万元)每百元商品销售额中每百元商品销售额中支付的流通费(元)支付的流通费(元)2135363945454647329360

5、38718.316.917.215.614.714.213.612.98.27.17.6按销售额分组按销售额分组(万元)(万元)商店数商店数(个)(个)每百元商品销售额中每百元商品销售额中支付的流通费(元)支付的流通费(元)50以下以下50100100200200300300以上以上102030251514.211.410.19.28.5按照销售额(数量标志)分组简单分组简单分组复合分组复合分组 即总体按即总体按一个标志进行一个标志进行分组。它只能分组。它只能从某一方面说从某一方面说明总体的分布明总体的分布状况和内部结状况和内部结构。构。 复合分组是复合分组是指对所研究的总体指对所研究的总体按

6、两个或两个以上按两个或两个以上的标志进行的多层的标志进行的多层次分组。可用于对次分组。可用于对事物多方面、多层事物多方面、多层次的分析研究。次的分析研究。 统计学成绩(分)学生人数(人)60以下60707080809090100合计578201454某班同学统计学成绩 第一标志(职务)第一标志(职务) 第二标志(年龄)第二标志(年龄) 第三标志(性别)第三标志(性别)高级职称(教授、副教授)45岁以上男女45岁以下男女非高级职称(讲师、助教)45岁以上男女45岁以下男女某高校教师按照职务、年龄、性别某高校教师按照职务、年龄、性别进行分组进行分组练习:如何对下列资料进行分组? 某地200家企业的

7、有关资料如下:(1)2000人以下的企业中全民企业10家,集体企业5家,合资企业3家(2)20003000人的企业中全民企业20家,集体企业34家,合资企业4家(3)30004000人的企业中全民企业15家,集体企业15家,合资企业2家(4)4000人以上的企业中全民企业20家,集体企业15家,合资企业1家职工人数经济类型企业个数2000人以下全民企业10集体企业5合资企业32000-3000全民企业20集体企业34合资企业43000-4000全民企业15集体企业15合资企业24000人以上全民企业20集体企业15合资企业1(二)分组标志的选择o 统计分组的关键是分组标志的选择o 分组标志的选

8、择的正确与否关系到能否正确的反映总体的性质特征,能否实现统计调查任务和目的。o 如:考察学生学习统计学的情况:性别、 统计学成绩?统计学成绩(分)学生人数(人)60以下60707080809090100合计578201454某班同学统计学成绩 分组标志的选择应该注意的几个问题o 分组标志要根据统计调查目的和任务选择。分组标志要根据统计调查目的和任务选择。o 若干标志中,要选择最能反映事物本质特若干标志中,要选择最能反映事物本质特征的标志作为分组标志。征的标志作为分组标志。o 如:毛泽东的对湖南农民运动考察报告中,对农民进行分组,根据研究目的看农民对中国革命的态度。于是根据阶级成分划分:地主、富

9、农、中农、贫农、赤贫。在分组过程中,毛也看到了生活水平的差异。现在如果研究目的是看农民的生活水平,绝对不能在以阶级成分划分,现在的分组标志应该是农民家庭人均收入。1. 品质分组:选择反映事物属性差异的品质标志作为分组标志,并且在品质标志的变异范围内划分各组界限,将总体划分为若干性质不同又有联系的几个部分。2. 变量分组:选择反映事物数量差异的数量标志作为分组标志,并且在数量标志的变动范围内划分各组界限,将总体划分为若干性质不同又有联系的几个部分。变量分组分为:单项式分组、组距式分组(等距分组、不等距分组)o 单项式分组:一个变量值为一组o 组距式分组:一个区间为一组“穷尽原则”和“互斥原则”。

10、o “穷尽原则穷尽原则”是指各分组必须容纳所有总体是指各分组必须容纳所有总体单位,即总体中的每一个总体单位都必须有单位,即总体中的每一个总体单位都必须有组的归属。组的归属。如劳动者按文化程度分组,分为小学、中学毕业、和大学毕业三组。o “互斥原则互斥原则”是指在特定的分组标志下,总是指在特定的分组标志下,总体中的任何一个单位不能同时归属于几个组,体中的任何一个单位不能同时归属于几个组,而只能归属于某一组。而只能归属于某一组。如把鞋子分为男鞋、女鞋、童鞋三类,就不符合互斥原则。 统计分组整理、汇总的基本结果构成要素构成要素基本形式:基本形式:分组分组单位数单位数频率(频率(%)合计合计 100频

11、数分布频数分布频率分布频率分布总体单位总量总体单位总量获金牌项目获金牌项目金牌数金牌数 占总数比例占总数比例跳水枚跳水枚 0.1786举重枚举重枚 0.1786乒乓球枚乒乓球枚 0.1429羽毛球枚羽毛球枚 0.1429体操枚体操枚 0.1071射击枚射击枚 0.1071柔道枚柔道枚 0.0714田径枚田径枚 0.0357跆拳道枚跆拳道枚 0.0357中国体育代表团在悉尼奥运会上获金牌的项目中国体育代表团在悉尼奥运会上获金牌的项目品质数列品质数列通常我们用通常我们用X表示变量,表示变量, 变量数列由变量数列由两串数字组两串数字组成,一串数成,一串数字为变量的字为变量的不同取值,不同取值,另一串

12、为次另一串为次数或频率。数或频率。 用用), 2 , 1(mixi表示变量值,表示变量值,), 2 , 1(mifi表示次数。表示次数。 用用变量数列按每个组的变量取值形式不同变量数列按每个组的变量取值形式不同 将若干个相邻的变量值将若干个相邻的变量值合并为一组,使每个组合并为一组,使每个组有一个变量值变动范围,有一个变量值变动范围,以组距形式表示的变量以组距形式表示的变量数列数列 。组距数列的每组。组距数列的每组变量值为一个区间变量值为一个区间 。是按数量标志是按数量标志分组后,用一分组后,用一个变量值代表个变量值代表一个组形成的一个组形成的数列。即一个数列。即一个变量值为一组。变量值为一组

13、。 销售额(万元)销售额(万元)每百元商品销售额中每百元商品销售额中支付的流通费(元)支付的流通费(元)213536394545464732936038718.316.917.215.614.714.213.612.98.27.17.6按销售额分组按销售额分组(万元)(万元)商店数商店数(个)(个)每百元商品销售额中支每百元商品销售额中支付的流通费(元)付的流通费(元)5050以下以下5050100100100100200200200200300300300300以上以上1010202030302525151514.214.211.411.410.110.19.29.28.58.5一个变量值为

14、一组的变量数一个变量值为一组的变量数列列编制步骤编制步骤排序排序汇总组单位数汇总组单位数(次数)(次数) 制作单项数列统计表制作单项数列统计表 己知某车间有己知某车间有24名工人,他们的日产量(件)名工人,他们的日产量(件)分别是:分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。要求根据以上资料编制变量数列。某企业某企业40名工人在一个工作日内生产的零名工人在一个工作日内生产的零件数量。请根据表中资料编制单项数列。件数量。请根据表中资料编制单项数列。 4040名

15、工人一个班次生产的零件数量名工人一个班次生产的零件数量工人编号生产数量(件)工人编号生产数量(件)工人编号生产数量(件)工人编号生产数量(件)工人编号生产数量(件)1100990178925903390210010921888268834953901191198527903591493129820972892369258513952193299237886901410722933090388978915902382318939978891691249632884085找出最大值和最小值找出最大值和最小值 排序排序汇总组汇总组单位数单位数(次数)(次数) 制作单项制作单项数列统计数列统计表表生产

16、生产数量数量(件件)8282 8585 8888 8989 9090 9191 9292 9393 9595 9696 9797 9898 100100 107107次数次数 1 13 34 45 58 83 34 43 32 21 12 21 12 21 1作业:思考与练习 5 编制单单项数列统计表项数列统计表指每个组的变量值用一个区指每个组的变量值用一个区间来表现的变量数列间来表现的变量数列变量值变动区间的长度相等变量值变动区间的长度相等注意:o 数据分组一般还与数据本身的特点及数据的多少有关。分组的目的是观察数据分布的特征。组数太少则数据分布就会过于集中,组数太多数据分布就会过于分散,不

17、便于观察数据分布的特征和规律。 o 一般情况下数据组数不少于5组且不多于15组。o 实际应用中,可根据数据的多少和特点及分析的要求确定组数。编制步骤或内容编制步骤或内容计算组中值计算组中值排序排序确定组限确定组限计算变异全距计算变异全距确定组数、组距确定组数、组距汇总组单位数汇总组单位数制作组距数列统计表制作组距数列统计表 总的变异范围。简称全距,总的变异范围。简称全距,用用R 来表示。来表示。minmaxXXR 指每组两端表示各组界限的变量值,指每组两端表示各组界限的变量值, 各组的最小值为各组的最小值为下限下限L L,最大值为,最大值为上上 限限U U。当当首、末首、末组组限采用组组限采用

18、“以下以下”或或“以上以上”形式时。形式时。 每组变量值变动区间的长每组变量值变动区间的长 度度,为上下限之差为上下限之差 每组变量取值范围的中点数值每组变量取值范围的中点数值 2下限上限 组中值=各组只包括本组下限变量值至各组只包括本组下限变量值至本组上限以下变量值的单位。本组上限以下变量值的单位。“以上以上”组距数列的上限值组距数列的上限值“以下以下”组距数列的下限组距数列的下限值值先计算开口组的假定上、下限:先计算开口组的假定上、下限:22相邻组组距上限首组首组假定下限首组上限22相邻组组距下限末组末组假定上限末组下限销售额(万销售额(万元)元)商店数商店数(个)(个)每百元商品销售每百

19、元商品销售额中支付的流通额中支付的流通费(元)费(元)50以下以下50100100200200300300以上以上102030251514.211.410.19.28.5上组限上组限U下组限下组限L如:组距如:组距d=U-L=100-50=50(万元)(万元)如:组中值如:组中值x=(U+L)/2 =(100+200)/2=150(万元)(万元)假定上限假定上限400假定下限假定下限04040名工人一个班次生产的零件数量名工人一个班次生产的零件数量工人编号生产数量(件)工人编号生产数量(件)工人编号生产数量(件)工人编号生产数量(件)工人编号生产数量(件)1100990178925903390

20、210010921888268834953901191198527903591493129820972892369258513952193299237886901410722933090388978915902382318939978891691249632884085某企业某企业40名工人在一个工作日内生产的名工人在一个工作日内生产的零件数量。请根据表中资料编制组距数列。零件数量。请根据表中资料编制组距数列。 件)(2582107minmaxXXR确定组数及组距确定组数及组距排序排序计算变异全距计算变异全距Nmlg322. 31322. 6lg322. 31NmmNmlg322. 31mlg

21、322. 32Nm组)(7lg322. 32Nm417251mRd1mRdmRdmRmR由于由于R组距组距(d) 组数(组数(m)q要能区分各组的性质差异要能区分各组的性质差异q要能反映总体资料的分布特征要能反映总体资料的分布特征q为方便计算,尽可能为为方便计算,尽可能为5 5或或1010的整数倍的整数倍q对于离散变量,相邻组组限可以对于离散变量,相邻组组限可以间断间断,也,也可可重叠重叠;q对于连续变量,相邻组组限对于连续变量,相邻组组限必须重叠必须重叠;q符合符合“上组限不计入上组限不计入”原则;原则;q首末两组可使用首末两组可使用“以下以下”及及“以以上上”的开口组。的开口组。 日产量(

22、件)日产量(件)组中值组中值次数次数合计合计fX试分组? 日产量(件)日产量(件)组中值组中值次数次数82以下以下828686909094949898102102以上以上合计合计 日产量(件)日产量(件)组中值组中值次数次数82以下以下828686909094949898102102以上以上04918531合计合计40? 日产量(件)日产量(件)组中值组中值次数次数83以下以下838787919195959999103103以上以上131710621合计合计40试分组?fX 日产量(件)日产量(件)组中值组中值次数次数83以下以下838787919195959999103103以上以上1317

23、10621合计合计40fX?制作组距数列制作组距数列适用于总体单位的标志值适用于总体单位的标志值变动比较均匀的情况变动比较均匀的情况百万元)(27229minmaxXXR排序排序计算变异全距计算变异全距Nmlg322. 31699. 1322. 316 . 6组)(7lg322. 32Nm百百万万元元)(417271 mRd 销售额(百万销售额(百万元)元)组中值组中值商店数(次商店数(次数)数)2 6610101414181822222626 30481216202428681214532合计合计50fX制作组距数列制作组距数列P50例题3.1o Excel操作时注意确定分组上限的确定例:某

24、电脑公司例:某电脑公司20082008年前四个月的销售年前四个月的销售量量( (单位单位: :台台) )14115916617217718218819620321414316016717317718318919620321514416016817317818418919620521814916116817417818518919620622315016116817417818619019620722515216217017417918619019720822615316317117517918719119720922815316317117517918719219821023315416417

25、21751801871941982102331551651721751801871942002112341561651721761811881952012112341581651721761821881952022132371. 组数及组距的确定最小值141最大值237数据个数120全距96组数10组距102.确定分组上限、计算频数o Excel在计算频数时,每一在计算频数时,每一组的频数包括组的上限值,组的频数包括组的上限值,即即ax=bo 数据分组原则:数据分组原则:上组限不计上组限不计入入,即即 a=xb 所以,右面的分组是正确的。所以,右面的分组是正确的。但是,分组上限的确定不正但是,分组上限的确定不正确。确。 按销售量分组(台)分组上限频数(天)140-1501505150-1601601016018018028180-19019020190-20020016200-21021011210-2202206220

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论