《统计基础(第二版)》课件第三章_第1页
《统计基础(第二版)》课件第三章_第2页
《统计基础(第二版)》课件第三章_第3页
《统计基础(第二版)》课件第三章_第4页
《统计基础(第二版)》课件第三章_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章 统计整理本章相关内容 第三节 频数分布第四节 统计数据的表现形式第二节 统计分组第一节 统计整理的意义和内容下页大学毕业的小王应聘到李女士公司,李女士告诉小王:“我们这里的报酬不错,平均工资每周400元。”小王工作几天后,找到李女士说:“你欺骗了我,我问过其他工人,没有一个工人的工资达到每周400元,平均工资怎么可能是一周400元呢?”李女士说:“小王,这是上月的工资表,你自己算一下。”案例引入 员工分组 李女士 李女士亲友领工 工人 学徒 合计工资 (元/周)2300350320300200人数 (人)16510123频率(%)4.3526.0921.7343.484.35100每组

2、工资额(元)23002100160030002009200案例讨论 1通过统计调查搜集的数据资料能否直接用于分析?2如何对统计数据进行分类整理?描述认识统计数据的整理在统计调查中的重要性,领会统计分组的含义。根据研究的目的,正确地选择分组标志。掌握分配数列、统计表的概念、种类和编制方法。准确应用统计图和统计表显示统计数据的数量特征。目标要求能力(技能)目标知识目标会对调查资料进行审核会对调查资料进行编码能录入调查数据会确定组距、组数会确定组限会计算组中值会编制次数分配数列会设计制作统计图、表会用Excel录入数据、汇总、制作统计图表了解统计整理的概念和内容了解统计分组的概念及分类了解统计表、统

3、计图的作用熟悉调查资料审核熟悉分配数列的概念与分类掌握调查资料的编码、录入掌握统计分组方法掌握组距、组数、组中值的确定掌握次数分配数列的编制掌握统计图、表结构、设计制作掌握用Excel录入数据、汇总、制作统计图表第一节 统计整理概念及内容一、统计整理(一)概念根据统计研究的任务与要求,对统计调查所搜集到的原始资料或者对已经加工的综合资料进行再加工,使之条理化、系统化,得出反映现象总体特征的综合数据的工作过程。(二)意义1能深刻地认识事物2是统计分析的前提3由个别单位的标志值向总体数量特征的指标值的过渡。 制定方案审核分组汇总编制统计图表二、统计整理的内容起点审核录入调查资料完整性准确性(1)填

4、写方式(2)限选项目是否有超选情况(3)计算上是否有错误(4)具有逻辑关系的题目前后是否存在矛盾(1)总体单位是否齐全(2)调查项目(标志)的资料是否完整逻辑检查:分析标志、数据之间是否符合逻辑,有无矛盾及违背常理的地方。 比较审查法:利用指标数据之间的关系及规律进行审查。 设置疑问框审查:利用指标之间存在一定的量值与比例关系,规定疑问框,审查数据。通过审核发现数据差错,应根据情况及时纠正或处理:属于填报错误,可通知填报者重新填报; 属汇总过程错误应根据情况予以修正。准确性检查方法 调查资料数据录入汇总手工录入汇总计算机汇总技术点线法传票法折叠法过录法常用的手工汇总方法有四种:(1)准备软件与

5、程序(EXCEL)(2)编码(3)数据录入(4)数据编辑(5)储存、制表与打印 分组前分组后统计分组:把总体按照某一标志划分为若干性质不同又有联系的几个部分第二节 统计分组二、统计分组的作用 (三)分析现象之间的数量依存关系(一)区分事物的不同性质,划分现象类型(二)反映总体内部结构 三、统计分组的基本原则 通过统计分组,必须保持组内统计资料的同质性,组间统计资料的差异性。1.要能充分反映研究目的2.要能反映事物的本质3.不能脱离现象所处的历史条件且要科学、互斥和穷尽四、分组标志的选择五、统计分组的类型按分组标志的性质不同品质分组变量分组按品质标志对资料进行分组。如:人口按性别分组、按职业分组

6、、企业按经济类型分组等。单项式分组 组距式分组以一个变量值代表一组。如:人口按年龄分组1岁一组等。这种分组适用于离散性变量,且变量值的个数较少的情况。以变量值变动的一个区间作为一组,区间的距离称为组距。适用于连续型变量和离散型变量的变量值较多的情况。性别人数男女2030合计50品质分组 按学习成绩分人数 5070 7080 8090 901005121815 合计50变量分组单项式分组五、 统计分组的类型变量分组按分组标志的多少不同简单分组复合分组只按某一个标志分组按两个或两个以上的标志进行层叠分组经济类型企业数国有企业集体企业私营企业290230460简单分组组别职工人数男25岁以下3002

7、65938060岁以上280女25岁以下290265937560岁以上 271复合分组某企业工人性别构成情况性别人数/人频率(%)男12060女8040合计200100某企业工人工龄构成情况工龄/年人数/人频率(%)10以下90451020402020以上7035合计200100某企业工人性别构成情况(1)人数/人频率(% )总计200100男10以下52431020262220以上4235合计120100女10以下38481020141720以上2835合计80100某企业工人性别构成情况(2)人数/人频率(%)性别男12060女8040合计200100工龄/年10以下90451020402

8、020以上7035合计200100一、分配数列的概念和种类(一)分配数列的概念分配数列是统计分组的结果,即在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体单位数在各组间的分布,这个数列称为分配数列,又称分布数列或次数分布。第三节 分配数列(二)分配数列组成分配数列由组名和次数两个要素组成,其中分布在各组的单位数叫次数,各组频数与总频数之比叫频率绝对数:次数(频数) 相对数:频率(比率)第三节 分配数列品质分配数列按品质标志分组形成的分配数列叫做品质分配数列,简称品质数列,也叫属性分布数列 。 (三)分配数列的种类变量分配数列按数量标志分组所编制的分配数列叫变量分配数

9、列,简称变量数列 (三)分布数列的分类根据分组标志不同,可分为:(一)品质数列。按品质标志分组的数列(二)变量数列。按数量标志分组的数列 变量数列又分为:1.单项数列。每个组的组值只用一个变量值来表示。适用于离散变量,且组数不多、组值变动幅度小的情况。2. 组距数列。每个组的组值由一对表示一定范围或距离的两个变量值形成的组。适用于连续变量,或离散变量,其变量值很多、变量波动范围大的情况。某专业学生年龄分布情况年龄/周岁人数/人占总人数比重%193010.0207026.7218023.3226020.0233010.0243010.0合计300100某地农村居民年纯收入情况年纯收入/万元户数/

10、户频率%5000以下3205.7500010 00068012.010 00015 00092016.415 000 20 000160028.620 00025 000110019.625 00030 0007503013.430 000以上2404.3合计5610100(二)组距式分配数列2组距数列的相关概念上限(upper limit):组的最大值下限(low limit):组的最小值组距=上限下限全距=最大组的上限最小组的下限组中值(class midpoint)即各组上、下限的中点(上限值下限值)/2缺下限的开口组组中值上限邻组组距/2缺上限的开口组组中值下限邻组组距/2注 如变量值

11、分布均匀,组中值便与组平均数一致; 组中值常用来代表各组的平均水平,在统计分析中被广泛采用。 封口式和开口式分组数列根据首尾两组形式来分离散式分组数列和连续式分组数列离散变量的组限可重叠也可不重叠,连续变量组限必重叠根据组距是否相等来分等距分组数列 不等距分组数列。 2.组距变量数列种类 132根据组限数值是否重叠来分整理原则:上组限不在内二、变量分布数列的编制按出勤天数分组 学生数181920212236101516 合计501.排列变量值的顺序。按变量值的大小顺序排列。 2.按变量值分组。即以每个变量值为一组,重复者只取一个。 3.确定每组的频数。即以每个变量值出现的次数作为频数。 4.编

12、制单项式数列。 单项式数列(一)单项式数列的编制下限组距数列月工资( 元)人数( 人)比重()1000 以下222.81000 20008510.62000 300012415.53000 400030638.34000 500018723.45000 6000516.4 6000 以上253.1合 计800100新兴公司员工月工资资料表组距1000组限上限组中值=(上限+下限)/2=3500(二)组距式数列的编制组距式数列的编制方法 1.确定组距和组数(1)将原始资料排序,找出最大值、最小值(2)确定全距(3)确定组距和组数 组距和组数互为制约一般可先确定组距,再根据组距确定组数。在经济统计

13、中,一般515组较合适。应将总体单位的性质区别及其分布特征、集中趋势显示出来。间断式确定组限:汇总各组单位数时,按照“上下 限均包括在本组内”的原则汇总。职工人数(人) 499以下 500 599 600 699 700 799重叠式确定组限:汇总各组单位数时,按照“上组 限不在内”的原则汇总。产值(万元) 50 60 60 70 70 80 80 90单位数(个)单位数(个)因为有了“上组限不在内”的原则,实际工作中,对于离散型变量也经常采用重叠式确定组限的方法。开口组2.组限的确定原则:最小组的下限应低于或等于最小变量值 最大组的上限应高于或等于最大变量值 必要时,可采用开口组 组限表示方

14、法 一式是常用形式,适用于连续性变量,一般不包括上限 二式是对一式的补充或修正,规定更明确 三式适用于离散型变量数列 四式是三式的延伸,适用于连续型变量数列 五式是下限不在内四、次数分布(一)次数分布的涵义次数也称频数,是分布在每组的总体单位数。注:适用于等距数列分析频数分布:或称次数分布,就是把各个类别及其相应的频数全部列出来。(二)次数分布的主要类型社会经济现象的复杂性,决定了在分组基础上形成的次数分布的类型也不一样,概括起来主要有钟形分布、U形分布和J形分布三种。三、累计频数和频率分布 累计频数(cumulative frequencies)即从数列的头或尾开始,截止到某一组的上限或下限

15、止,累计出现的次数。分为:1较小制累计。从最小一组算起,小于该组上限的累计次数2较大制累计。从最大一组算起,大于该组下限的累计次数根据累计次数表可以绘制累计次数图。以累计次数为纵坐标,分组为横坐标,较小制累计次数曲线以各组上限为横轴,较大制以各组下限为横轴。一、统计表 (一)统计表的意义是表现统计资料的一种形式,即将调查得来的原始资料经过整理,使之系统化,用表格形式表现。优点:(1)使统计资料条理化、清晰化;(2)简明易懂、节省篇幅;(3)便于比较(项目、指标)、便于 计算(直接通过表格计算)(4)方便检查、核对数字的完整性和准确性第四节 统计数据的表现形式(二) 统计表的构成1.总标题。2.

16、横行标题。也称主词(主栏),表明总体及其分组,一般列于左方。3.纵栏标题。也称宾词(宾栏),表明总体特征的统计指标的名称,一般写在表的上方。4.数字资料。即空格中的数字。统计表的结构统计表的结构 横向构成纵向构成2、内容上看:主要由两部分构成1.主词栏2.宾词栏 1、形式上看:主要由四部分构成(1)总标题(2)行标题和列标题(3)表格线(4)指标数值统计表的结构统计表的结构 产业类别国内生产总值绝对数(亿元)比上年增长%比重%第一产业247005.011.8第二产业10200412.548.7第三产业8270310.339.5总 计20940710.7100.0横栏标题我国2006年国内生产总

17、值及其增长速度指标数值纵栏标题主词栏宾词栏总标题(二)从统计表内容上看Title in hereText in here宾词宾词是说明总体的各种统计指标,包括指标名称和指标数值,一般排列在表的右方。Text in here主词 主词是统计表所要说明的总体,它可以是总体的各个组或各个单位的名称,一般排列在表的左方。三、统计表的种类 (一)(二)按其作用不同来分,调查表(个体)整理表(总体)分析表(总体)按主词分组情况不同:简单表分组表复合表国 家位次旅游收入(亿美元)美国西班牙意大利法国英国德国中国奥地利加拿大墨西哥12345678910730.0315.0310.0307.0209.7165.

18、0141.0112.0102.878.5简单表复合表统计表的种类举例人口数/万人按性别分男64 189女61 720按城乡分市镇38 892乡村87 017四、统计表的形式:统计表的一般形式 统计表一般为开栏式表格。左右两侧不封口,上下两端画粗实线,除标题行与合计行以细实线区分外,行与行之间一般不画线(复合分组时可以画线),表内各栏目之间用实线隔开,表体为比例协调的长方形。统计表一般由表头、表体、表脚三个部分构成。按用途特征分类面积比重(%) 耕地 森林 内陆水域面积 草地 #可利用草地 其他1300417491174740000313332375813. 5418.22 1.8241.673

19、2.6424.75合计9600010000 2006年我国土地状况计量单位:万公顷表头 资料来源:中国统计年鉴表脚表体统计表的具体形式如下:1一般为长方形。2上下两端的端线用粗线绘制,表的左右两端不封闭。3表中横行“合计”,一般列在最后一行(或最前行),表中纵栏“合计”一般列在分组后最前一栏。4表的纵栏较多时,可编栏号。文字栏按甲、乙、丙编号;而对指标数字的各栏分别用(1)、(2)、(3)的顺序编号。各栏之间如果有计算关系,可用公式表示,如(3)(2)(l)。5总标题要简明扼要,确切说明表的内容,同时标题内或在标题下面应说明资料所属时间、空间。8填写:要规范化。书写工整,字迹清晰,数字位数对齐,同类数字要有效的统一位数。数字相同时,应全部重写一遍,不能用“同上”等字样表示。不可能有数字的空格,用短横线“”填写;如有数字但数字很小,可以忽略不计,或应有数字但不详,用虚线“”表示;某项资料免于填报,应用符号“X”填满。9某些资料必须进行说明时,应在表下注明。10. 制表完毕,制表人和负责人应签名并加盖单位公章。统计表的设计五 统计表的设计原则是合理、科学、实用、简明、美观,设计中应注意以下问题:1.总标题要简明扼要,并能确切说明表中的内容。2.统计表的上

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论