版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章统计整理§1统计整理的意义和内容§2统计分组§3分配数列§4统计表一、统计整理的意义二、统计整理的内容§1统计整理的意义和内容
通过统计调查可以搜集到大量的统计资料,是统计研究的基础。但是这些资料只是反映总体单位具体情况的分散的、不系统的资料,不能用以反映总体的特征。
统计数据整理将统计调查得到的原始资料进行科学的分类和汇总,使之成为系统化、条理化的综合资料,以反映研究总体的特征。是统计调查的继续,统计分析的前提和基础,起着承前启后的作用。地位一统计数据整理的意义根据研究目的的设计整理汇总方案。根据汇总方案,对各个调查项目的资料进行汇总,通过汇总计算各项指标。通过统计表或统计图的形式,描述整理的结果。二统计数据整理的内容统计资料的审核资料的分组和汇总编制统计表或绘制统计图数据整理的程序统计资料的积累、保管和公布数据审核统计工作的基本程序收集数据科学地计算与分析得出结论真实数据正确结论虚假数据错误结论假数真算一、统计分组的意义二、统计分组的作用三、统计分组的标志和种类§2统计分组指根据事物的内在特点和统计研究的需要,按一定的标志将统计总体划分为不同类型或者性质不同的几部分。使得组和组之间具有差别性,而同一组内的单位具有同质性。(一)统计分组的概念对总体而言,是“分”,即将总体区分为性质相异的若干部分。
对总体单位而言,是“合”,即将性质相同的个体组合起来,在同一组内则保持着相同的性质。
一、统计分组的意义统计分组(二)统计分组的原则互斥原则:就是在特定的分组标志下,总体中的任何一个单位只能归属于某一组,而不能同时或可能归属于几个组。穷尽原则:就是使总体中的每一个单位都应有可归,或者说各分组的空间足以容纳总体中所有单位。二统计分组的作用分组前分组后25%33%42%1、类型分组,区分事物的性质,反映各类型的特点例:按所有制性质划分,我国现有8种经济类型:国有经济;集体经济;私营经济;个体经济联营经济;股份制经济;外商投资经济;港澳台投资经济
2、结构分组,反映总体内部结构例:上海市按GDP计算的三次产业结构(%)1980年 1990年1996年 1997年GDP 100 100100100 第一产业 3.2 4.3 2.5 2.3 第二产业 75.7 63.8 54.5 52.2 第三产业 21.1 31.9 43.0 45.5 3、分析分组,研究现象之间的依存关系例:中国农民家庭按收入分组的恩格尔系数(1984年)按收入分组(元)<200<300<400<500<600<800<1000恩格尔系数(%)64.960.256.754.450.549.943.6
三统计分组的种类1、简单分组2、复合分组
即总体按一个标志进行分组。它只能从某一方面说明总体的分布状况和内部结构。
复合分组是指对所研究的总体按两个或两个以上的标志层叠或交叉起来分组。可用于对事物多方面、多层次的分析研究。
(一)按分组所选择的标志的个数1、简单分组按性别分组按民族分组按年龄分组男生汉族<18岁女生满族18-20岁回族20-22岁
22-24岁>24岁2、复合分组1、品质分组2、数量分组品质分组就是按品质(或属性)标志的分组。数量分组就是按数量标志的分组,数量标志的变异性体现在它不断变动自身的数量上,故也称为变量分组。(二)按分组标志的特征不同1、品质分组例:某高校学生性别分布表性别人数(人)频率(%)男73257.14女54942.86合计1281100.002、按数量标志分组单项式分组指用单一的数值作为分组标志分组。每个数值作为一个组。
如某班学生按年龄分组:17岁,18岁,19岁,20岁,21岁,22岁。②组距式分组将数量标志的取值范围依次划分为若干个满足互斥性和包容性的区间,用这些数值区间作为组的名称。某班学生统计学成绩分组60分以下60—70分70—80分80—90分90分以上组距式分组中的一些概念组限上限下限区间数值的最大值区间数值的最小值组距每一组的区间长度组距=上限-下限组中值每一组中点位置的数值组中值=(上限+下限)÷2开口组缺少上限数值或下限数值的组注意开口组以相邻组的组距作为该组的组距,确定其下限或上限,再计算组中值。某地区100个百货商店月销售额与流通费用情况销售额(万元)商店数(个)每百元商品销售额中支付的流通费(元)50以下50~100100~200200~300300以上102030251514.211.410.19.28.5上组限U下组限L如:组距d=U-L=100-50=50(万元)如:组中值x=(U+L)/2=(100+200)/2=150(万元)组距式分组中的一些概念等距分组异距分组各组组距相等的分组称为等距分组。各组组距不全相等的分组称为异距分组。例如60分以下60—70分70—80分80—90分90分以上组中值为(60+50)÷2=55组中值为(90+100)÷2=95上限不在内原则间断式分组凡是组限不相连,以整数位断开的分组,称为间断组距式分组。连续式分组凡是组限相连,即相邻组上、下限重叠,称为连续式分组。60分以下60—70分70—80分80—90分90分以上300以下301—400人401—500人501—600人601人以上间断式分组连续式分组统计分组的方法(1)选择分组标志根据统计研究的目的选择分组标志
根据现象的本质特征选择分组标志根据现象所处的历史条件选择分组标志正确选择分组标志是做好统计分组的前提。即决定分成哪些组,各组的内容、名称和界限。原则互斥性包容性指各组之间界限明确,总体中的每一个单位,都只应属于其中的一个组。指在一个分组方案中拟定的所有组,能够包容总体的全部单位,不能排斥和遗漏任何一个单位。按品质标志分组按数量标志分组选择反映事物属性差异的标志作为分组依据。选择反映事物数量方面的差别的标志作为分组依据(2)拟定分组数目(三)统计分组体系指根据统计研究的要求,对同一总体进行多种不同的分组而成的一种相互联系,相互补充,从不同角度说明总体的内部状况的认识体系。
对同一总体选择两个或两个以上标志分别进行简单分组。各分组标志表现并列使用。各分组标志表现交叉结合使用。平行分组体系交叉分组体系平行分组体系对教师的分类按性别分类男性女性按职称分类按年龄分类高级中级初级青年中年共计7组2+3+2复合分组体系按性别分类按职称分类按年龄分类男女高级中级初级青年中年共计12组2×3×2对教师的分类一、分配数列的概念和种类二、频率与累积频率三、次数分布的主要类型§3分配数列变量数列品质数列在统计分组基础上,将总体所有单位按组归并整理排列,形成总体中各个单位在各组间的分布,称为分配数列或次数分布。分配数列分类总体按某标志所分的组各组的次数或频率构成要素异距数列等距数列组距数列单项数列一分配数列的概念和种类射击射击体操体操乒乓球举重乒乓球羽毛球举重乒乓球羽毛球举重举重跳水跳水跳水乒乓球跳水射击体操羽毛球柔道柔道举重田径羽毛球跆拳道中国体育代表团在悉尼奥运会上获金牌的项目品质数列的编制获金牌项目金牌数占总数比例跳水5枚0.1786举重5枚0.1786乒乓球4枚0.1429羽毛球4枚0.1429体操3枚0.1071射击3枚0.1071柔道2枚0.0714田径1枚0.0357跆拳道1枚0.0357品质数列品质数列的编制单项数列指每个组值只用一个具体的变量值表现的数列同时具备变量数列的编制变量是离散变量变量的不同取值个数较少编制条件:【例】己知某车间有24名工人,他们的日产量(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。日产量(件)X工人数(人)f202122232425263564321合计24编制结果如下:变量X次数f数量数列组距数列指每个组的变量值用一个区间来表现的变量数列变量数列的编制变量是连续变量;或:总体单位数较多变量不同取值个数也较多的离散变量。编制条件:变量值变动区间的长度相等变量值变动区间的长度不完全相等等距数列异距数列编制等距数列适用于总体单位的标志值变动比较均匀的情况实例己知某班35个学生统计学期末考试成绩如下,单位(分)44505660626365656969697074767778787980838485858687888990919192939494要求编制组距数列。原始数据计算组中值排序确定组限计算变异全距确定组数、组距汇总各组单位数制作组距数列统计表编制步骤编制步骤:⒈求变异全距⒉确定组距及组数确定组距的原则:要能区分各组的性质差异要能反映总体资料的分布特征为方便计算,尽可能为5或10的整数倍R≤组距(d)×组数(n)⒊确定组限对于离散变量,相邻组组限可以间断,也可重叠;对于连续变量,相邻组组限必须重叠;符合“上组限不计入”原则;首末两组可使用“××以下”及“××以上”的开口组。组限的表示方法4、计算各组次数5、制作组距数列按考试成绩分组(分)学生人数(人)60以下60~7070~8080~9090以上38897合计35某班统计学考试成绩表6、画出次数分配曲线图405060708090100图1某班学生统计学考试成绩次数分配曲线图121086420考分人数累计次数(频率)从变量值低的组开始,将各组次数(频率)逐次向变量值高的组累计,说明某一组上限以下各组的累计次数(频率)。向上累计向下累计从变量值高的组开始,将各组次数(频率)逐次向变量值低的组累计,说明某一组下限以上各组的累计次数(频率)。频率各组单位数占总体单位总数的比重二频率与累积频率销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)5以下5~1010~1515~2020~2525以上410161343820322686合计50100销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)向上累计向上累计5以下5~1010~1515~2020~2525以上41016134382032268641430434750828608694100合计50100——销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)向上累计向下累计向上累计向下累计5以下5~1010~1515~2020~2525以上410161343820322686414304347505046362073828608694100100927240146合计50100————钟形分布J形分布和U形分布对称分布右偏分布左偏分布正J型分布反J型分布U型分布三、次数分布的主要类型一、统计表的概念二、统计表的形式三、统计表的分类四、编制统计表应注意的问题五、统计图§4统计表1.它是由纵横线交叉组成的一种表格,表格内所列的是整理后的统计资料。
2.统计表一般采用开口式,即表的左右两条线不画。
3.用统计表来显示统计资料,具有条理清晰、简明扼要的特点,便于从各方面进行比较、分析所表现的现象。一、统计表的概念统计表是用规范的表格来表现统计资料的一种形式。纵栏标题是统计指标的名称,说明纵栏所列各项资料的内容,写在表内右上方。二、统计表的形式总标题(也称统计表的名称),它用概括性的文字简单明了地说明统计资料的时间、基本内容和范围。一般写在表的上部中端。横行标题反映统计表的主要项目,写在表的左方。有些统计表还需要在下端增加注解,以说明资料的来源、某些指标数值的计算方法、填表单位和其他需要说明问题。数字资料也称指标数值,它是统计表的具体内容,列在各横行标题和各纵栏标题的交叉处。任何一个具体数值都由横行标题和纵栏标题所限定。某市2001年工业总产值按企业规模分组工业总产值(亿元)比重(‰)甲(1)(2)大型企业中型企业小型企业901.51300.67547.7950.3716.9232.35合计1776.97100.00横行标题纵栏标题数字资料总标题简单表:表的主词未经任何分组,仅列出总体各单位的名称或按时间顺序简单排列的统计表。城市名称人口数其中:市辖县的人口数北京市天津市上海市10819407878740213341896345698229303345127460第四次人口普查我国三个直辖市的人口三、统计表的种类年份黄金储备(万盎司)国家外汇(亿美元)19931994199519961267126712671267211.99516.2735.971050.29黄金和外汇储备分组表:指表的主词按某一标志进行简单分组的统计表。分组表的主词可以按数量标志分组,也可以按品质标志分组。按性别分组人数所占(%)男性女性6004006040合计1000100按品质标志分组示例按数量标志分组示例周工资额(元)人数(个)各组人数占总人数百分比%(1)(2)(3)80-9031090-100723100-1101343110-120517120-13027合计30100复合表:指表的主词按两个以上的标志进行分组的统计表。项目投资额(亿元)比重(%)一.全民所有制单位
基本建设更新改造及其它措施二.集体所有制单位
城镇农村三.个人建房投资
城镇农村952594358156451112611724469.543.426.111.43.38.119.11.317.8合计1369100四、编制统计表应注意的问题统计表的栏数如果过多,要加以编号各栏用甲、乙、丙等文字编写;宾词指标各栏则用(1)、(2)、(3)等数字编号。表中数字要填写整齐,位数对准。当不存在某项数字时,用符号“一”表示;当缺少某项数字时,用符“...”表示。数字资料要注明计量单位。当全表只有一种计量单位时,可把它写在表头的右上方。如果表中需要分别注明不同单位时,横行的计量单位可专设“计量单位”一栏,纵栏的计量单位可与纵栏标题写在一起用小字标明。统计表编制完毕并经审核后,制表人和主管部门负责人要签字,并加盖公章以示负责。统计表的文字、数字要书写工整、清晰,数位要对齐。某些需要说明的特殊资料,应在表的下方加以注解;数字资料要在表下说明来源,以备查考。五、统计图(一)统计图的概念
指将说明社会经济现象的统计资料,借助于几何图形或具体事物形象来
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论