统计学课件第二章统计整理_第1页
统计学课件第二章统计整理_第2页
统计学课件第二章统计整理_第3页
统计学课件第二章统计整理_第4页
统计学课件第二章统计整理_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学课件第二章统计整理第一页,共三十四页,编辑于2023年,星期三第一节统计整理概述一、统计整理的概念二、统计整理的内容第二页,共三十四页,编辑于2023年,星期三统计整理概念

将统计调查得到的数据进行加工整理,使其系统化、条理化,符合分析的需要。是统计调查的继续,统计分析的前提和基础必要性第三页,共三十四页,编辑于2023年,星期三统计整理的内容

(一)对原始数据资料进行审核检查和整理1、完整性审核2、准确性审核(二)对次级资料的检查与整理1、对现有资料的甄别2、对甄别后的资料作出评价3、选用适当的再加工方法

第四页,共三十四页,编辑于2023年,星期三将总体中所有单位按一定的标志划分为若干个不同性质的组。一、统计分组统计分组的作用:可发现总体的特点与规律,分析总体中各个组成部分的结构情况分析现象之间的依存关系p33-34表2-72-8第二节统计分组第五页,共三十四页,编辑于2023年,星期三二、统计分组的方法关键问题—选择分组标志和划分各组得界限(一)分组标志确定的原则1、根据研究的目的与任务选择分组标志2、要选择能够反映事物本质或主要特征的标志3、要根据现象的历史条件及经济条件来选择分组标志第六页,共三十四页,编辑于2023年,星期三二、统计分组的方法(二)统计分组方法的分类1、根据分组标志反映事物特征不同分为按品质标志分组(事物属性差异)和按数量标志分组(事物数量差异)例性别学历工资年龄2、根据标志的多少不同分为简单分组(一个分组标志)和复合分组(两个或两个以上)

第七页,共三十四页,编辑于2023年,星期三三、编制次数分布数列在确定分组标志和分组方法后编制次数分布数列相关概念:次数分布数列:将总体按某一标志分组,按一定顺序排列并列出每个组的总体单位数,这种数列称为次数分布数列,又称分配数列次数(频数):分布在每一组的总体单位数分布数列的种类:品质数列变量数列第八页,共三十四页,编辑于2023年,星期三按品质标志分组的数列。如不同品牌饮料市场占有率(一)品质数列饮料品牌人数百分比(%)可口可乐旭日升冰茶百事可乐汇源果汁露露15119693022181218合计50100第九页,共三十四页,编辑于2023年,星期三按数量标志分组的数列。含义:以一个变量值作为一组。根据每一组变量值的多少,可以进行单项式数列、组距式数列。适用范围:离散性变量且变量值数目不多的情况。单项式数列(二)变量数列第十页,共三十四页,编辑于2023年,星期三单项式数列

某社区家庭户拥有孩子数情况表孩子数(个)户数百分比(%)01231502001005030402010合计500100第十一页,共三十四页,编辑于2023年,星期三组距式数列

含义:以变量值的一定变动范围为一组适用范围:连续变量和离散变量变量值很多的情况。等距数列异距数列变量值变动区间的长度相等变量值变动区间的长度不完全相等第十二页,共三十四页,编辑于2023年,星期三等距数列某工厂工人完成生产定额情况表工人完成生产定额(%)工人数(个)百分比(%)90以下90—100100—110110—120120以上304060302016.722.233.316.711.1合计180100第十三页,共三十四页,编辑于2023年,星期三异距数列某地区人口年龄分布情况

人口年龄分组人口数(万人)百分比(%)2岁以下(婴儿组)2—7岁(幼儿组)7—18岁(学龄儿童组)18—60岁(劳动力人口组)60岁以上(老年组)

161224.68.1

1.911.623.247.615.7合计51.7100第十四页,共三十四页,编辑于2023年,星期三相关概念指每组两端的变量值,各组的最小值为下限,最大值为上限。组限每组变量值变动区间的长度,为上下限之差组距每组变量取值范围的中点数值组中值第十五页,共三十四页,编辑于2023年,星期三开口式组距数列组中值的计算:组中值=上限-相邻组组距/2

组中值=下限+相邻组组距/2

缺下限:缺上限:第十六页,共三十四页,编辑于2023年,星期三某地区100个百货商店月销售额与流通费用情况销售额(万元)商店数(个)每百元商品销售额中支付的流通费(元)50以下50~100100~200200~300300以上102030251514.211.410.19.28.5上组限U下组限L如:组距d=U-L=100-50=50(万元)如:组中值x=(U+L)/2=(100+200)/2=150(万元)第十七页,共三十四页,编辑于2023年,星期三编制等距数列实例己知50个同学的英语考试成绩如下:

要求编制组距数列。7889926680527796638280754874637188906771885660725575847766907378846659638090746681706674827580816678第十八页,共三十四页,编辑于2023年,星期三编制步骤:⒈求全距⒉确定组距及组数组距=全距÷组数组距和组数成反比的关系,组数的确定一般原则(1)正确的反映总体各部分质的差异(2)能够准确清晰的反映总体单位的分布特征编制等距数列全距=最大值-最小值第十九页,共三十四页,编辑于2023年,星期三⒊确定组限对于离散变量,相邻组组限可以间断,也可重叠;对于连续变量,相邻组组限必须重叠;符合“上组限不在内”原则;首末两组可使用“××以下”及“××以上”的开口组。组限的表示方法编制等距数列第二十页,共三十四页,编辑于2023年,星期三

按照习惯,成绩一般分为不及格、及格、中等、良好、优秀即组限组中值

60分以下

60~706570~807580~908590分以上上组限不在内第二十一页,共三十四页,编辑于2023年,星期三频数=每组单位数频率=每组频数/总单位数组限频数比重%60以下51060~70112270~80163280~90132690分以上510⒋确定频数和频率第二十二页,共三十四页,编辑于2023年,星期三四、统计分类标准化与常用的分组(类)(一)统计分类标准化是统计标准化的一种(指标体系分类标准基本术语编码)按其适用的范围不同分为:国家标准行业标准地方标准企业标准第二十三页,共三十四页,编辑于2023年,星期三四、统计分类标准化与常用的分组(类)(二)国民经济中常用的几种分组标准1、经济类型分类(所有制结构)公有经济{国有经济集体经济}非公有经济(私有经济港澳台经济外商经济)2、三次产业分类(国民经济各部门分为三大类型)第一产业第二产业第三产业3、行业分类(三大产业的分类)第二十四页,共三十四页,编辑于2023年,星期三(二)国民经济中常用的几种分组标准4、基本单位分类机构单位(住户法人单位)产业活动单位(基层单位是指位于一个地点、主要从事一种经济活动的单位。它与机构单位具有隶属关系,一个机构单位可能包含一个或多个基层单位,而一个基层单位仅属于一个机构单位)5、机构部门分类(四类)具有相同特征的机构单位合并在一起构成部门第二十五页,共三十四页,编辑于2023年,星期三第三节统计表一、统计表的结构二、统计表的设计★第二十六页,共三十四页,编辑于2023年,星期三统计表的常用结构:统计表的结构按照一定结构和顺序设计的表格总标题列标题(宾词)行标题(主词)数据资料第二十七页,共三十四页,编辑于2023年,星期三列标题行标题数字资料总标题2008年浙江省各地市GDP

单位:亿元地市GDP第一产业第二产业第三产业杭州4781.16178.642389.382213.14宁波3964.05167.362196.681600.01温州2424.2976.681286.761060.85嘉兴1815.3105.521085.29624.49湖州1034.8982.63593.56358.7绍兴2222.95116.651329.12777.18金华1681.8589.61903.07689.17义乌493.3315.28223.46254.59衢州580.0561.71317.85200.49舟山490.2549.18226.44214.63台州1965.27133.541037.47794.26丽水505.6855.26245.85204.57全省合计21486.921095.4311580.338811.16第二十八页,共三十四页,编辑于2023年,星期三二、统计表的设计根据任务设计的统计表要主次分明,简明醒目,科学合理统计表的形式应长宽比例适中,一般长方形表的上、下端用粗线或双线封口,左右两端一般不封口表的纵栏较多时,可以按栏的顺序编号统计表的总标题要简明扼要,在标题内或标题下说明资料所属时间和空间第二十九页,共三十四页,编辑于2023年,星期三二、统计表的设计计量单位一致时应放在表右上角;如果同栏单位相同各栏之间不同可在各栏标题中注明单位,如果同行的单位相同各行之间不同可在各栏的前面增加一栏单位各栏数字的位数要一致第三十页,共三十四页,编辑于2023年,星期三二、统计表的设计数据栏不能有空白,不应有数字用_表示;数字太小达不到要求用……如果规定不报用×主次或宾词的排序应遵循时间的先后、数量的大小、空间位置等自然顺序排列。一般从小到大,从过去到现在从低到高可在标下进行注释第三十一页,共三十四页,编辑于2023年,星期三练习题

5.统计分配数列()①都是变量数列②都是品质数列③是变量数列或品质数列④是统计分组。7.将25个企业按产值分组而编制的变量数列中,变量值是()①产值②企业数③各组的产值数④各组的企业数。11.划分连续变量的组限和划分离散变量的组限时,相邻组的组限()①必须重叠③前者必须重叠,后者可以间断②必须间断④前者必须间断,后者必须重叠。

一、单项选择第三十二页,共三十四页,编辑于2023年,星期三12.在分组时,凡是遇到某单位的标志值刚好等于相邻两组下上限数值时,一般是()①将此数值归入上限所在组②将此值归入下限所在的组③将此值归入上限所在组或下限所在组均可④另立一组。第三十三页,共三十四页,编辑于2023年,星期三二、多项选择5.分布数列的两个组成要素为()①品质标志②数量标志③分组④次数⑤分组标志。⒒在组距数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论