版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3章统计整理1第三章统计(数据)整理
第一节统计整理的概念
第二节统计分组与统计分布(频数分布)
第三节数据的显示—统计表和统计图下一页返回目录本章内容第3章统计整理2第一节统计整理的概念
一、统计整理意义二、统计整理的步骤三、Excel中的统计整理工具上一页下一页返回本章首页第3章统计整理3一、统计整理的意义
统计整理是根据统计研究的任务,对调查所搜集到的大量原始资料进行分组和汇总,使其条理化、系统化的工作过程。上一页下一页返回本节首页第3章统计整理4一、统计整理的意义统计整理在整个统计工作过程中的地位:
起着承前启后的作用。第3章统计整理5二、统计整理的步骤
1.对数据进行审核
•
审核无误后,将数据录入计算机,建立数据表。•
数据表可以作为数据库使用。上一页下一页返回本节首页第3章统计整理62.数据排序
一般来说,录入的数据是无序的,不能反映现象之本质与规律性,为了使用的方便,要将其进行排序,以便数据按要求排列。上一页下一页返回本节首页二、统计整理的步骤3.数据分组并编制统计表将已排序的数据进行分组,并编制次数分布表与累计次数分布表
分组的目的是使性质相同的数据归为一组,性质不同的数据分开,使数据之间的差异性显示出来。次数分布表能表明各单位数在各组间的分布的状态,从而描述出总体的内部结构,揭示总体的本质特征(见29页)
累计次数分布表则能够表明各标志值以上或以下所出现的次数或比重(见31页)第3章统计整理7二、统计整理的步骤第3章统计整理84.制作统计图
将次数分布的数据画出各种各样的统计图,可以形象、直观地表明数据的分布形态与发展变化的趋势。上一页下一页返回本节首页二、统计整理的步骤第3章统计整理9三、Excel中的统计整理工具
1.数据排序Excel可以根据用户的要求对数据表的行或列数据进行排序。排序时,Excel将利用指定的排序顺序重新排列行、列或各单元格,从而使现象的规则性更加简洁地表现出来。上一页下一页返回本节首页第3章统计整理10
2.频数分布函数
频数分布函数是Excel的一个工作表函数,是编制次数分布的主要工具,通过频数分布函数,可以对数据进行分组与归类,从而使数据的分布形态更加清楚地表现出来。3.数据透视表
数据透视表是一种交互式工作表,用于对已有数据表和数据库中的数据进行汇总和分析的一种工具。上一页下一页返回本节首页三、Excel中的统计整理工具第3章统计整理114.统计图
Excel可以绘制许多图表,其中大部分是统计图,可用于数据的整理与分析,能够直观形象地描述现象的数量规律性。上一页下一页返回本节首页三、Excel中的统计整理工具第3章统计整理12第二节统计分组与统计分布(频数分布)
一、统计分组的意义和作用二、统计分组的方法三、统计分布(频数分布、分布数列、分配数列)上一页下一页返回本章首页一、统计分组的意义和作用第3章统计整理13
1.统计分组
就是根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。说明:统计分组对总体而言是“分”对个体而言是“合”第3章统计整理14一、统计分组的意义和作用总体经过分组,能够突出组与组之间的差异而抽象掉组内各单位之间的差异,使数据变得条理化,便于进一步分析研究。2.统计分组的意义第3章统计整理15一、统计分组的意义和作用⑴互斥原则⑵穷尽原则3.统计分组遵循的基本原则第3章统计整理16(1)划分现象的类型(2)揭示现象内部结构(3)分析现象之间的依存关系
上一页下一页返回本节首页4.统计分组的作用一、统计分组的意义和作用第3章统计整理17某年我国的社会商品零售额资料一、统计分组的意义和作用零售额比重(%)国有城镇集体其他8014.55.5合计100第3章统计整理18某年我国农民的消费结构如下
一、统计分组的意义和作用分类比重(%)消费品其中:食品其他劳务97.7662.6837.322.24合计100商场按销售额分组商场数
各组商品流通费用率%50万元以下50~200万元200~400万元400~600万元600~800万元800~1000万元1000万元以上25701307540181011.210.49.96.75.95.05.5商品销售额和流通费用率之间有依存关系。其中,流通费用率=费用额/销售额第3章统计整理20(1)按分组标志的多少,分为简单分组和复合分组。
简单分组是按一个标志对总体进行分组。
复合分组是用两个或两个以上的标志层叠在一起对总体进行分组。(例见P25)5.统计分组的分类一、统计分组的意义和作用第3章统计整理21如对学生按学科、学历、性别分组学科学历性别文科大专男生女生本科研究生及以上理工科一、统计分组的意义和作用第3章统计整理22说明:平行分组体系:多个简单分组构成一个平行分组体系。复合分组体系:复合分组本身构成复合分组体系。一、统计分组的意义和作用第3章统计整理23(2)按分组标志的性质不同可分为
按品质标志分组(品质分组)按数量标志分组(变量分组)一、统计分组的意义和作用第3章统计整理24
按品质标志分组:就是以反映事物属性差异的标志作为分组标志,将总体分为若干性质不同的组成部分。如按性别分组上一页下一页返回本节首页一、统计分组的意义和作用第3章统计整理25
品质标志分组,按复杂程度大致可分为三种情况:
⑴在分组标志下各单位性质差异比较明确,区分比较容易,因而各组划分比较简单;
⑵在分组标志下存在性质差异的过渡形态,以致差异界限不分明;
⑶有些现象本身情况复杂,对其分组须经过实际和理论的深入考察、分析与研究,以确定分组原则和可供操作的划分标准及界限。一、统计分组的意义和作用
例如:我国现行的工业行业分类就是按照产品使用方向、生产设备及生产工艺流程、使用原材料这样三个标志,把工业划分为40个大类,197个中类和611个小类。第3章统计整理26一、统计分组的意义和作用第3章统计整理27
按数量标志分组:从某个变量的差异程度上来区分各种类型。具体又可分为单项式分组和组距式分组。一、统计分组的意义和作用第3章统计整理28
单项式分组:离散变量的每个变量值为一组。例如工人平均日产量资料
上一页下一页返回本节首页一、统计分组的意义和作用工人平均日产量(件)工人数绝对数比重(%)2345610153040208.713.026.134.817.4合计115100.0第3章统计整理29组距式分组:以变量值的一定变动范围为一组。上一页下一页返回本节首页一、统计分组的意义和作用组距式分组可以分为间断组距式分组和连续组距式分组。在组距式分组中,凡是组限不相连的(或不相重叠的),称为间断组距式分组;凡是组限相连(或相重叠的),称为连续组距式分组。组距式分组还可以细分为等距分组和异距分组。第3章统计整理30一、统计分组的意义和作用第3章统计整理31二、统计分组的方法
统计分组的关键问题是选择分组标志和划分各组界限。
1、分组标志的选择原则:⑴根据研究的目的选择分组标志⑵要选择最能反映事物本质特征的标志⑶根据现象的历史条件和经济条件选择分组标志第3章统计整理32二、统计分组的方法第3章统计整理332、各组界限的划分分组标志确定后,则应划分各组界限。⑴如果是按品质标志分组的,各组之间界限的划分比较简单。
⑵如果是按数量标志分组的,组和组之间的界限的划分则需详细分析和比较。下面主要研究此种分法。二、统计分组的方法第3章统计整理34三、统计分布(频数分布、分布数列、分配数列)㈠统计分布的概念与种类
1、定义在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体中各个单位在各组间的分布,称为统计分布,又称次数分布、频数分布或分配数列。
上一页下一页返回本节首页第3章统计整理35三、统计分布(频数分布、分布数列、分配数列)2、分配数列的构成要素上一页下一页返回本节首页总体按某标志所分的组各组出现的单位数,即次数或频数构成要素次数:分布在各组间的总体单位数,又称频数。用f表示频率:次数的相对数,各组次数占总次数的比重。用f/∑f表示第3章统计整理373、分配数列的分类变量数列品质数列分类异距数列等距数列组距式数列单项式数列三、统计分布(频数分布、分布数列、分配数列)第3章统计整理381、变量数列的种类:单项式:一个变量值代表一组。组距式:一组变量值代表一组。其中:组距式又分为等距式和不等距式两种(二)变量数列三、统计分布(频数分布、分布数列、分配数列)等距式上一页下一页返回本节首页不等距式上一页下一页返回本节首页(三)影响变量数列分布的要素第3章统计整理41三、统计分布(频数分布、分布数列、分配数列)组数、组距、组限、组中值第3章统计整理421、组数(n):某个变量数列共分多少组组数的确定有两种方式:(1)根据对资料的定性分析确定(2)Sturges(斯特奇斯)经验公式:其中,K表示组数,n表示数据的个数。
三、统计分布(频数分布、分布数列、分配数列)第3章统计整理432、组距(d):指各组中的最大值与最小值之差组距数列可以分为等距数列和不等距(异距)数列。对于等距数列,可根据全部数据的最大最小值及组数来确定。计算公式为:组距=(最大值-最小值)/组数对于等距数列,两者的关系:当全距(R)一定时,组数的多少和组距的大小成反比对于不等距数列,组数根据实际情况确定。三、统计分布(频数分布、分布数列、分配数列)第3章统计整理44注:对于等距数列,由于各组组距相等,各组频数多少不受组距的影响,所以分布密度与分布频数一致。不等距数列由于各组组距不同,分布密度与分布次数不同。为了说明各组分布的疏密程度,可采用计算频数密度的方法消除组距因素对频数的影响。频数密度是指单位组距的分布次数。频数密度=各组次数/组距三、统计分布(频数分布、分布数列、分配数列)第3章统计整理45例:某单位有高级职称人员年龄分布数列:年龄分组/岁人数频数密度30~3435~4950~5960~64245120380.43.012.07.6合计205—三、统计分布(频数分布、分布数列、分配数列)第3章统计整理463、组限:⑴定义:组距的两个端点称为组限,是各组的数量界限。一个组中的最大值为组上限,最小值为组下限。若一组内只有上限或者只有下限,称此组为开口组;上限与下限齐全的为闭口组。三、统计分布(频数分布、分布数列、分配数列)第3章统计整理47⑵组限的划分:a)最低组的下限应小于至多等于原始资料中的最小值,最高组的上限应大于至少等于原始资料的最大值,以保证分组的完备性。b)若变量为连续型,相邻组的组限必须重叠;在统计次数时,应遵循的原则为:上组限不统计在本组内。(27页)c)若变量为离散型,相邻组的组限应该断开。三、统计分布(频数分布、分布数列、分配数列)第3章统计整理484、组中值:各组上限和下限之间的中点值。公式为:注意开口组的组中值的求法:缺下限组的组中值=首组上限–
相邻组组距/2缺上限组的组中值=末组下限+相邻组组距/2三、统计分布(频数分布、分布数列、分配数列)总结:对变量数列分组应注意分组不能过粗,也不能过细1、分组过粗,容易将不同质的单位分在同组,看不出总体分布的特征。某班统计学成绩(最低分56,最高分99)分数人数56~6060~100238合计40
2、分组过细,容易将具有相同性质的单位分开,也反映不出总体的分布特征。
分数人数56~6060~6464~6868~7272~7676~8080~8484~8888~9292~9696~10023413745344合计40
3、如下分法,则基本上能反映出总体分布的特征。
分数人数50~6060~7070~8080~9090~1002711128合计40第3章统计整理52三、统计分布(频数分布、分布数列、分配数列)
例:某地区30户居民人均月收入抽样调查资料如下:(单位:元)173016301550172014201440162015401600144016401650166014701640168016101430170016601620152016701460160014901630159016101710举例说明组距数列编制过程第3章统计整理53三、统计分布(频数分布、分布数列、分配数列)(1)将原始资料按大小顺序排列,确定总体的最大值、最小值。142014301440144014601470149015201540155015901600160016101610162016201630163016401640165016601660167016801700171017201730(2)确定编制数列的类型,即编制单项式数列或组距式数列。第3章统计整理54三、统计分布(频数分布、分布数列、分配数列)第3章统计整理55三、统计分布(频数分布、分布数列、分配数列)(3)确定组数和组距。
A、对资料进行定性分析,可将其分为高收入、中等偏上、中等收入、低收入四种类型,故设定为4组,组距为
B、若用Sturges(斯特奇斯)经验公式第3章统计整理56三、统计分布(频数分布、分布数列、分配数列)(4)确定组限(5)计算各组次数,编制频数分布表第3章统计整理57三、统计分布(频数分布、分布数列、分配数列)按月收入分组户数1400~15001500~16001600~17001700~180074154合计301、钟型分布主要特征是两头小、中间大,即靠近中间的变量值分布的频数多,靠近两端的变量值分布的频数少。绘成曲线宛如一口古钟。例P35如人的身高、学生的考试成绩即为该分布第3章统计整理58四、次数分布的类型⑴正态分布(对称分布)⑵正偏(右偏)分布⑶负偏(左偏)分布第3章统计整理59四、次数分布的类型2、“U”分布“U”分布的特征与“钟型分布”恰好相反:靠近中间的变量值分布的频数少,靠近两端的变量值分布的频数多,形成两头大、中间小的分布特征。(P35)如按年龄分组的人口死亡率即为“U”分布第3章统计整理60四、次数分布的类型3、“J”分布“J”分布有两种:正“J”分布和反“J”分布(P36)正“J”分布:频数随着变量值的增大而增多。如投资额与利润率的关系反“J”分布:频数随着变量值的增大而减少。如价格和销售量的关系第3章统计整理61四、次数分布的类型第3章统计整理62第三节数据的显示—统计表和统计图•
一、统计表•二、统计图上一页下一页返回本章首页第3章统计整理63一、统计表㈠统计表的构成:
1.从表式上看,由表头(总标题)、横行标题、纵栏标题和指标数值四个部分组成。
2.从内容上看,也可分为主词栏和宾词栏。主词栏是表中所要说明的总体及其组成部分,一般位于表的左边;宾词栏是各种指标,包括指标名称和指标数值,位于表的右边。例见P36第3章统计整理64统计表的结构1999~2000年城镇居民家庭抽样调查资料项目单位1999年2000年
调查户数平均每户家庭人口平均每户就业人口平均每户就业面平均一就业者负担人数平均每人全部年收入#可支配收入平均每人消费性支出户人人%人元元元
400443.141.7756.431.775888.775854.024615.91
4222.03.131.6853.671.866316.816279.984998.00资料来源:《中国统计年鉴2001》,中国统计出版社,2001,第305页。注:本表为城市和县城的城镇居民家庭抽样调查材料。
横行标题指标数值附注纵栏标题总标题第3章统计整理65一、统计表㈡统计表的种类
1.按用途不同可划分为调查表、整理表和分析表。调查表是用来搜集统计资料的表格;整理表是用于汇总或整理调查资料,以及表现统计汇总或整理结果的表格;分析表是用于对整理所得的统计资料进行定量分析的表格。第3章统计整理66一、统计表
2.按主词分组的不同,可划分为简单表、简单分组表和复合分组表(P37)简单表是主词未经任何分组的统计表简单分组表是主词按一个标志进行分组复合分组表是主词按两个或两个以上标志进行分组第3章统计整理67一、统计表
3.按宾词设计不同,可分为宾词简单排列、分组平行排列和分组层叠排列(P38)。宾词简单排列是指宾词不加任何分组、按一定顺序排列在统计表上宾词分组平行排列是指宾词栏中各分组标志彼此分开,平行排列宾词分组层叠排列是指统计指标同时有层次地按两个或两个以上标志分组,各种分组重叠在一起。第3章统计整理68一、统计表
4.按统计资料的时间和空间,可分为空间数列表、时间数列表和时空结合表空间数列表是指同一时间条件下,不同空间范围的统计表时间数列表是指同一空间条件下,不同时间范围的统计表时空结合表指同时反映社会经济现象在不同空间和不同时间内的数量分布第3章统计整理69一、统计表㈢统计表的设计
1.合理安排统计表的结构。
2.数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明。
3.表中的上下两条横线一般用粗线,其他线用细线
4.通常情况下,统计表的左右两边不封口。
5.表中数字因小可以忽略不计时,一般用“0”表示;对于没有数字的表格单元,一般用“—”表示;缺失资料的单元格,一般用“…”表示。
6.必要时可在表的下方加上注释。第3章统计整理70二、统计图常用的统计图有四种:直方图、折线图、曲线图、茎叶图。见书上P41第3章统计整理71分组数据—直方图(histogram)1.用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布2.在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图
第3章统计整理72注:对于异距数列,由于各组组距不同,频数的差异不能直接表明变量的分布特征。制作直方图时,要先计算出各组的频数密度,然后以组距为宽,以频数密度为高画直方图。第3章统计整理73分组数据—折线图
(frequencypolygon)1.折线图也称频数多边形图2.是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉3.折线图的两个终点要与横轴相交,具体的做法是第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的第3章统计整理74分组数据—曲线图当变量数列的组数无限增多时,折线便趋于一条平滑的曲线。曲线图的画法与折线图基本类似,只是在连接各个坐标点时,用平滑曲线而不是用折线。第3章统计整理75未分组数据—茎叶图
(stem-and-leafdisplay)1.用于显示未分组的原始数据的分布2.由“茎”和“叶”
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025届吉林省通榆一中高三3月份第一次模拟考试语文试卷含解析
- 八年级期末测试卷(课件)课件
- 2025届广东省深圳建文外国语学校高考压轴卷英语试卷含解析
- 现代学徒制课题:中国特色学徒制质量评价标准研究(附:研究思路模板、可修改技术路线图)
- 现代学徒制课题:基于中国特色学徒制的工匠精神培养路径研究(附:研究思路模板、可修改技术路线图)
- 河南省鹤壁市浚县第二高级中学2025届高三3月份模拟考试英语试题含解析
- 上海市浦东新区进才中学2025届高考语文三模试卷含解析
- 广东省深圳实验学校2025届高三3月份模拟考试英语试题含解析
- 2025届浙江省越崎中学高三最后一卷语文试卷含解析
- 《设施光环境控制》课件
- 新教科版五年级科学下册课件2.5给船装上动力
- 基坑安全监测~个人年终总结
- 手术质量与安全监测分析制度
- A9.安规设计规范
- 模型构建的原则和主要步骤
- 消防安全操作规程
- 建筑装饰施工组织与管理教学大纲
- 衬里工业管道施工工艺标准
- 柴油泄漏应急预案演练
- 号间冷塔冷却三角组合及安装作业指导书
- 突发公共卫生事件处理流程图
评论
0/150
提交评论