统计学原理课件_第1页
统计学原理课件_第2页
统计学原理课件_第3页
统计学原理课件_第4页
统计学原理课件_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、东莞电大廖继标1第三章第三章 统统 计计 整整 理理 教教 学学 目目 的的 通过本章的学习,要求掌握各种不同类通过本章的学习,要求掌握各种不同类型资料的整理方法、整理原则、以及一些相型资料的整理方法、整理原则、以及一些相关的概念,并能够利用所学的方法对所给的关的概念,并能够利用所学的方法对所给的实际资料按照研究目的的要求进行整理。实际资料按照研究目的的要求进行整理。东莞电大廖继标2第三章第三章 统统 计计 整整 理理 教教 学学 目目 的的 通过本章的学习,要求掌握各种不同类通过本章的学习,要求掌握各种不同类型资料的整理方法、整理原则、以及一些相型资料的整理方法、整理原则、以及一些相关的概念

2、,并能够利用所学的方法对所给的关的概念,并能够利用所学的方法对所给的实际资料按照研究目的的要求进行整理。实际资料按照研究目的的要求进行整理。东莞电大廖继标3第三章第三章 统计整理统计整理 统计整理的方法和意义统计分组的含义和种类统计分组的方法统计分布和分配数列的编制统计表的结构和种类东莞电大廖继标4第三章第三章 统计整理统计整理 统计调查搜集上来的资料,不论是哪一种类型的统计调查搜集上来的资料,不论是哪一种类型的资料都必须经过整理才能进一步进行分析。资料的类资料都必须经过整理才能进一步进行分析。资料的类型不同,研究的目的不同,资料整理的方法也不同。型不同,研究的目的不同,资料整理的方法也不同。

3、 统计整理是根据统计研究任务的要求,对调查所统计整理是根据统计研究任务的要求,对调查所搜集到的原始资料进行搜集到的原始资料进行分组、汇总分组、汇总,使其条理化、系使其条理化、系统化的工作过程。统化的工作过程。一、统计整理的意义和方法东莞电大廖继标5 统计整理又称数据整理,根据统计研究任务的要求,对调查、搜集到的原始资料进行分组汇总使其条理化、系统化的工作过程,就是统计整理。 统计整理的意义:通过统计调查所取得的总体单位的资料,是不系统的、分散的,还只是事物的表象、事物的某一侧面或外部联系的感性材料。统计整理的任务就是对这些资料进行加工处理,借助总量指标,对总体内部规律、相互联系、结构关系,作出

4、概括性的说明。统计整理实现了从个别单位的标志值向说明总体特征的指标值的过度,使人们对社会经济现象的认识从感性认识上升到理性认识的过度阶段,为统计分析提供了基础。它在统计研究中起着承前启后的作用。东莞电大廖继标6 根据某班根据某班4040名学生统计学考试成绩分名学生统计学考试成绩分析该班学生考试情况。析该班学生考试情况。57 89 49 84 86 87 75 73 72 68 57 89 49 84 86 87 75 73 72 68 75 82 97 81 67 81 54 79 87 95 75 82 97 81 67 81 54 79 87 95 76 71 60 90 65 76 72

5、 70 86 76 71 60 90 65 76 72 70 86 85 89 89 64 57 83 81 78 87 85 89 89 64 57 83 81 78 87 72 61 72 61 东莞电大廖继标7 按成绩等级分组按成绩等级分组 人数(人)人数(人) 各组人数占各组人数占 总人数比重(总人数比重(%) 不及格不及格 4 10.0 及及 格格 6 15.0 中中 12 30.0 良良 15 37.5 优优 3 7.5 合合 计计 40 100.0东莞电大廖继标8第三章第三章 统计整理统计整理 再如:通过调查取得再如:通过调查取得100100个商业企业某月销个商业企业某月销售额资

6、料:(单位:万元)售额资料:(单位:万元) 2020,6060,4545,9090,105105,5656,250250,8989,130130,3030,9898,300300。 将这些数据资料按将这些数据资料按“销售额销售额”的多少进行整的多少进行整理,得到下列整理结果:理,得到下列整理结果:东莞电大廖继标9销售额(万元)销售额(万元) 企业数(个)企业数(个) 0 50 12 50 100 25 100 150 30 150 200 23 250 300 10 合合 计计 100第三章第三章 统计整理统计整理统计整理的方法:统计整理的方法:分组、汇总、编表分组、汇总、编表东莞电大廖继标1

7、0第三章第三章 统计整理统计整理统计分组统计分组:根据研究任务的要求和现象总体的内在特点,把统计总体按照某一标志划分为若干性质不同又有联系的几个部分。统计分组应统计分组应达到的要求达到的要求同一组内的单位性质相同,不同组所包括的单位性质有差异。二、例如:工业企业按经济类型分组,可分为以下几组: 经济类型 企业数(个) 国有企业 1000 合资企业 200 合作经营企业 300 股份制企业 500 工业企业按职工人数分组,可分为以下几组: 职工人数 企业数(个) 500人以下 50 5001000 200 10001500 100 工业企业按地区分组,可分为以下几组: 地区 企业数(个)北京市

8、10000 天津市 8000 上海市 11000 东莞电大廖继标11统计分组的特点 统计分组是在总体内进行的一种定性分类,它是把总体进一步划分为一个个性质不同的范围更小的总体。 这些被称为亚总体的组,同样具有总体的特征(只是变成小一点的总体而已),它们可以继续分组。如在进行工业企业的统计调查时,我们可以按工业企业所在的地域进行分类,一个省的为一组,每一个省的工业企业又可以按不同的市进行分组。东莞电大廖继标12分组标志的选择分组标志的选择选择什么样的分组标志,就会形成什么样的分组结果,选择什么样的分组标志,就会形成什么样的分组结果,因此,因此,分组标志的选择是统计分组的关键分组标志的选择是统计分

9、组的关键。选择分组标志的一般原则必须根据统计研究的目的,在对现象进行分析的基础上,必须根据统计研究的目的,在对现象进行分析的基础上,抓住具有本质性的区别及反映现象内在联系的标志来抓住具有本质性的区别及反映现象内在联系的标志来作为分组标志。(作为分组标志。(P54P54)统计分组必须遵循两个原则:统计分组必须遵循两个原则:穷尽原则和互斥原则穷尽原则和互斥原则 即不重复不遗漏即不重复不遗漏如我们在进行城乡青少年接受教育水平的比较分析,应按如我们在进行城乡青少年接受教育水平的比较分析,应按城乡进行分组,如果按年龄进行分组或按性别进行分组就城乡进行分组,如果按年龄进行分组或按性别进行分组就不能到达研究

10、分析的目的。不能到达研究分析的目的。东莞电大廖继标13统统计计分分组组的的种种类类 按研究任务和作用不同 按分组标志的多少不同 按分组标志的性质不同类型分组结构分组分析分组简单分组复合分组品质分组(按品质标志进行分组)变量分组(按数量标志进行分组)通常认为总体按品质标志分组属于类型分组,按数量标志分组属于结构分组仅按一个标志来进行分组称为简单分组;按两个或两个以上的标志进行分组并且层叠在一起称为复合分组东莞电大廖继标14 分析分组:为了研究总体的各标志之间的依存关系而进行的分组。即为了研究某个标志表现和另一个标志表现之间有何关系而进行的分组,如要研究在东莞打工的外来劳动者的工资报酬是否与他们的

11、学历有关,则把他们按学历进行分组来进行研究。 分析分组的分组标志称为原因标志,与原因标志相对应的叫结果标志。如上例中学历是原因标志,报酬是结果标志。东莞电大廖继标15第三章第三章 统计整理统计整理品质品质分组分组方法方法变量变量分组分组方法方法以一个变量值代表一组。如:人口按年龄分组1岁一组,学生按报考科目分组等。这种分组适用于离散性变量,且变量值的个数较少的情况。如对家庭构成情况进行分析时,可按家庭人数进行分组 以变量值变动的一个区间作为一组,区间的距离称为组距。适用于连续型变量和离散型变量的变量值较多的情况。如学生成绩、工厂职工数按品质标志对资料进行分组。这种分组有些比较简单,有些非常复杂

12、,复杂的品质分组称为分类。一般的情况下该品质标志的标志表现有多少就分成多少组,或按统一规定的分组标准进行分组如:人口按性别分组、按职业分组、企业按经济类型分组等。单项式分 组组距式分 组三、统计分组方法东莞电大廖继标16第三章第三章 统计整理统计整理 等等 距距 分分 组组各组组距均相等。如: 1020 2030 3040以上各组组距均为10。这种分组适用于均匀分布的总体。 不等距不等距 分分 组组各组组距不一定相等。如: 1020 2050 5060 6070 以上分组中,其中第二组与其它各组的组距不同。这种分组适用于资料分布离差较大或者是为了满足特殊的研究目的的需要。按组距式分组会使资料的

13、真实性受到一些损害东莞电大廖继标17组距的计算对于重叠组距式分组,可以用 组距=上限下限 进行计算如成绩分组中,6070分、70 80分、80 90分,其组距就是10分。对于间断式分组,使用的公式为 组距=本组上限前组上限 =本组下限上组下限如商店按职工规模分组分为:1 5人、6 10人11 15人,则组距为105=5而不是4。东莞电大廖继标18 组限组限(p57)组限就是每一组两端的数值。 10 20 20 30 30 40下限上限 确定组限的方法有两种:间断式确定组限和重叠式确定组限。职工人数(人) 99以下 100199 200299 300399固定资产额(万元) 5060 6070

14、7080 8090间断式确定组限适用于离散变量(分组时要注意满足不重不漏原则,上、下限都要包含在内,有特殊说明的除外)重叠式确定组限适用于连续变量上面的60、70、80归于哪一组呢?P57一般把此值归并到作为下限的那一组东莞电大廖继标19 例:某地区对企业按工人人数的多少进行分未两组,下列五种分组方法中正确的是( ) A. 300人以下 300500人 B. 300人以下 300500人(不含300) C. 300人以下 301500人 D. 300人以下 310500人 E. 300人以下 300499人注意区分重叠式组限和间断式组限的不同之处,分组时应该做到不重复不遗漏东莞电大廖继标20第

15、三章第三章 统计整理统计整理组中值组中值每组上限与下限之间的中点数值,是各组的每组上限与下限之间的中点数值,是各组的假定平均数。假定平均数。组中值组中值 = = (上限值(上限值+ +下限值)下限值)2 2开口组组中值的计算:开口组组中值的计算:缺下限:组中值缺下限:组中值= =本组上限本组上限 相邻组组距相邻组组距/2/2缺上限:组中值缺上限:组中值= =本组下限本组下限+ + 相邻组组距相邻组组距/2/2例如例如产值(万元)产值(万元)5050以下以下50 6050 6060 7060 707070以上以上第一组组中值:第一组组中值:5050(10102 2)= 45= 45最后一组组中值

16、:最后一组组中值:70+70+(10102 2)= 75= 75东莞电大廖继标21第三章第三章 统计整理统计整理(一)统 计 分 布 统计分布又称分配数列统计分布又称分配数列。它是把总体的所有单位按组归并排列后形成总体中各个单位在各组间的分布。这里的单位有个、次的含义,所以分配数列又称此书发布。它由两部分组成:它由两部分组成: 总体所分的各个组和各组所拥有的单位数(次数或频数)。四、统计分布和分配数列的编制东莞电大廖继标22第三章第三章 统计整理统计整理工资分组工资分组 职工人数(人)职工人数(人) 各组人数所占比重各组人数所占比重 (元)(元) (次数或频数)(次数或频数) (%) (频率)

17、(频率)500600 100 25600700 200 50700800 100 25 合合 计计 400 100频率:各组的频率大于频率:各组的频率大于0 0,各组的频率总和等于,各组的频率总和等于1 1或或100%100%。东莞电大廖继标23(二)分配数列的种类(二)分配数列的种类 分配数列是在分组的基础上形成的,根据分组时采用的分分配数列是在分组的基础上形成的,根据分组时采用的分组标志不同,分配数列可分为:组标志不同,分配数列可分为:品质分配数列品质分配数列(简称品质数列)(简称品质数列)变量分配数列变量分配数列(简称变量数列)(简称变量数列)单项式分配数列单项式分配数列组距分配数列组距

18、分配数列等距数列等距数列不等距数列不等距数列分配数列分配数列(这种数列一般比较稳定,只要(这种数列一般比较稳定,只要分组标准定的比较恰当,通常能分组标准定的比较恰当,通常能准确地反映总体的分布特征。)准确地反映总体的分布特征。)第三章第三章 统计整理统计整理东莞电大廖继标24(三)分(三)分 配配 数数 列列 的的 编编 制制1 1、品质分配数列的、品质分配数列的 只需将品质标志的表现一一排列出来,然后汇总只需将品质标志的表现一一排列出来,然后汇总出每一种标志表现出现的次数即可。如下例:出每一种标志表现出现的次数即可。如下例:第三章第三章 统计整理统计整理 100 100 250 250 合合

19、 计计 40 40 32 32 20 20 8 8 100 100 80 80 50 50 20 20 国有企业国有企业 股份制企业股份制企业 合资企业合资企业 独资企业独资企业 比重(比重(% %) 企企 业业 数数 经济类型经济类型东莞电大廖继标25第三章第三章 统计整统计整理理2、变量分配数列的、变量分配数列的 其基本步骤为:其基本步骤为:第一步:将原始资料按数值大小依次排列。第一步:将原始资料按数值大小依次排列。第二步:确定变量的类型(按什么标志进行第二步:确定变量的类型(按什么标志进行 分组)和分组方法(单项式分组或分组)和分组方法(单项式分组或 组距分组)。组距分组)。第三步:确定

20、组数和组距。当组数确定后,第三步:确定组数和组距。当组数确定后, 组距可计算得到:组距可计算得到: 全距全距 = = 最大变量值最小变量值最大变量值最小变量值 组距组距 = 全距全距组数组数东莞电大廖继标26组数确定经验公式Sturgesn 1 3 3lgNnNRdndRn经验公式 = + .其中 为组数,为总体的单位数=其中 为组距,为全距,第三章第三章 统计整理统计整理东莞电大廖继标27分组组数参考表N 15242544 4589 90179180359n3546576879第三章第三章 统计整理统计整理东莞电大廖继标28第三章第三章 统计整理统计整理第四步:确定组限。第四步:确定组限。注

21、意:注意:第一组的下限要小于或等于最小第一组的下限要小于或等于最小变量值,最后一组的上限要大于最大变变量值,最后一组的上限要大于最大变量值。)量值。)第五步:汇总出各组的单位数,计算频第五步:汇总出各组的单位数,计算频率,(频率率,(频率= =频数频数/ /总体单位数)并编制总体单位数)并编制统计表。统计表。注意注意:不同方法确定的组限在汇总各组不同方法确定的组限在汇总各组单位数时不一样(见教材单位数时不一样(见教材P59P59例题)例题)东莞电大廖继标29间断式确定组限:汇总各组单位数时,按照间断式确定组限:汇总各组单位数时,按照“上下限均上下限均 包括在本组内包括在本组内”的原则汇总。的原

22、则汇总。职工人数(人)职工人数(人) 499499以下以下 500 599500 599 600 699 600 699 700 799 700 799重叠式确定组限:汇总各组单位数时,重叠式确定组限:汇总各组单位数时, 按照按照“上组限不在内上组限不在内”的原则汇总。的原则汇总。产值(万元)产值(万元) 50 6050 60 60 70 60 70 70 80 70 80 80 90 80 90单位数(个)单位数(个)单位数(个)单位数(个)因为有了因为有了“上组限不在内上组限不在内”的原则,实际工作中,对的原则,实际工作中,对于离散型变量也经常采用重叠式确定组限的方法。于离散型变量也经常采

23、用重叠式确定组限的方法。东莞电大廖继标30序序 计划完成计划完成 工人数工人数 比重比重 向上累计向上累计 向下累计向下累计号号 程度(程度(%) (人)(人) (%) 人数人数 比重比重 人数人数 比重比重 1 60 70 2 1.0 2 70 80 5 2.5 3 80 90 14 7.0 4 90 100 31 15.5 5 100110 65 32.5 6 110120 52 26.0 7 120130 23 11.5 8 130140 8 4.0 合合 计计 200 100 3、累计频数或频率分配数列的编制方法、累计频数或频率分配数列的编制方法通过累计频数分配数列可以反映累计到某一组

24、出现的总次通过累计频数分配数列可以反映累计到某一组出现的总次数或总频率。数或总频率。第三章第三章 统计整理统计整理2721521171691922001.03.510.526.058.584.596.0100831831481791931982004.015.541.574.089.596.599.0100东莞电大廖继标31第三章第三章 统计整理统计整理(四)(四)统计分布的类型统计分布的类型钟型分布、钟型分布、U U型分布、型分布、 J J型分布、洛伦茨分布型分布、洛伦茨分布钟型分布:钟型分布:特征是特征是“两头小,中间大两头小,中间大”,即靠近中间的,即靠近中间的变量值分布的次数多,靠近两

25、端的变量值变量值分布的次数多,靠近两端的变量值分布的次数少,其形状宛如一口古钟。分布的次数少,其形状宛如一口古钟。(见教材(见教材P62P62)U U型分布:型分布:特征是靠近中间的变量值分布的次数少,特征是靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,其形状靠近两端的变量值分布的次数多,其形状宛如英文字母宛如英文字母U U。(见教材。(见教材P62P62)J J型分布:型分布:特征是次数随着变量值的增大而增多或随特征是次数随着变量值的增大而增多或随变量值的增大而减少,其形状宛如英文大变量值的增大而减少,其形状宛如英文大写字母写字母J J。(见教材。(见教材P63P63)洛伦茨分

26、布:洛伦茨分布: 专门用以检定社会收入分配的平等程度。专门用以检定社会收入分配的平等程度。东莞电大廖继标32频率分布的类型第三章第三章 统计整理统计整理东莞电大廖继标33第三章第三章 统计整理统计整理(五)统计表的结构和种类(五)统计表的结构和种类从表的内容上看:由主词和宾词组成。主词指总从表的内容上看:由主词和宾词组成。主词指总 体所分的各个组,宾词用来说体所分的各个组,宾词用来说 明主词的各个指标。明主词的各个指标。 统计表是表现统计资料整理结果的表格统计表是表现统计资料整理结果的表格从表的形式看:由标题、横行和纵栏、数字资料从表的形式看:由标题、横行和纵栏、数字资料 等部分组成。等部分组

27、成。统计表统计表的结构的结构统计表统计表的种类的种类按照主词是否分组和分组的程度分为:按照主词是否分组和分组的程度分为:简单表:主词未经分组的统计表。简单表:主词未经分组的统计表。分组表:主词按某一标志进行分组的统计表。分组表:主词按某一标志进行分组的统计表。东莞电大廖继标34统计表的结构19992000年城镇居民家庭抽样调查资料年城镇居民家庭抽样调查资料项目项目单位单位1999年年 2000年年 调查户数调查户数 平均每户家庭人口平均每户家庭人口 平均每户就业人口平均每户就业人口 平均每户就业面平均每户就业面 平均一名就业者负担人数平均一名就业者负担人数 平均每人全部年收入平均每人全部年收入

28、 可支配收入可支配收入 平均每人消费性支出平均每人消费性支出户户人人人人%人人元元元元元元 400443.141.7756.431.775888.775854.024615.91 4222.0 3.13 1.68 53.67 1.86 6316.81 6279.98 4998.00资料来源:中国统计年鉴2001,中国统计出版社,2001,第305页。注:本表为城市和县城的城镇居民家庭抽样调查材料。 第三章第三章 统计整理统计整理东莞电大廖继标35合理安排统计表的结构总标题内容应满足3W3W要求(when 、who、what)(如P66页表3-16)数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明表中的上下两条横线一般用粗线,其他线用细线通常情况下,统计表的左右两边不封口表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一对于没有数字的表格单元,一般用“”表示必要时可在表的下方加上注释统计表的设计第三章第三章 统计整理统计整理东莞电大廖继标36统计表的设计第三章第三章 统计整理统计整理东莞电大廖继标37 一、判断一、判断 (2006.01)统计分组以后,掩

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论