




已阅读5页,还剩31页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章 统计数据的整理和显示,1,第一节 数据的预处理 第二节 统计分组 第三节 统计图表,第一节 数据的预处理,数据的审核 一手数据:完整性审核、准确性审核 二手数据:适用性审核、时效性审核 数据的筛选 数据的排序,第二节 统计分组,3,统计分组的一般问题 统计分组的方法 定性数据的分组方法 定量数据的分组方法,一、统计分组的一般问题,4,概念: 统计分组是根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组的统计方法 。 原则: 穷尽原则、互斥原则 种类: 按分组标志的多少:简单分组、复合分组 按分组标志的性质:品质分组、数量分组,二、统计分组的方法,5,定性数据的分组 定量数据的分组,(一)定性数据的分组:一个取值一个组 单项式分组 例,6,(二)定量数据的分组 1、按离散变量分组 (1)变量值取值不多时:一个取值一个组单项式分组,7,(二)定量数据的分组 1、按离散变量分组 (1)变量值取值不多 单项式分组 (2)变量值取值较多时,一个区间一个组 组距式分组,8,(二)定量数据的分组 1、按离散变量分组:单项式分组或组距式分组 2、按连续变量分组:一个区间一个组组距式分组,9,统计分组的方法(总结),定性数据的分组方法 单项式分组 定量数据的分组方法 1、按离散变量分组 (1)变量值取值不多 单项式分组 (2)变量值取值较多 组距式分组 2、按连续变量分组 组距式分组,10,三、组距式分组中的几个概念,1、组限 区间两端的数值 下限:区间最小值 上限:区间最大值 开口组和闭口组 开口组:统计分组中缺上限或缺下限的组 闭口组:统计分组中上、下限均齐全的组 组限的写法: 间断式写法 连续式写法:“上限不在内”,11,2、组距:区间的距离 (连续式写法) 组距=上限下限 (间断式写法) 组距=本组上限-前组上限 或=本组下限-前组下限 或=本组上限-本组下限+1(分组标志为离散变量) 等距分组和异距分组,12,等距分组:在组距式分组中,每个组的组距均相等。 一般在现象性质差异的变动比较均衡条件下使用。 优点:易于掌握次数分布的特征;各组次数可以直接比较。,13,异距分组:在组距式分组中,各组组距不尽相等。 一般在现象性质差异的变动非均衡的条件下使用。 优点:能够准确地描述偏态分布;能将性质相同的总体单位归为一组。 缺点:由于各组的组距不同,各组次数直接比较是没有意义的。,14,15,3、组数 原则: 要尽量能反映总体单位的分布情况及总体单位的集中趋势。 要尽可能区分出组与组性质上的差异。 经验公式:.Lg N,四、例:某单位30名职工工资资料如下:,16,1060 840 1100 910 1090 910 1110 1070 990 940 1190 870 1050 950 1060 1180 970 1030 1060 850 1060 1010 1050 960 1050 1070 1210 1280 1110 1010 整理以上资料,并对该单位职工工资分布情况作初步分析。,数据整理的基本步骤:,17,排序:840 8501210 1280 组数: 组距: 假设采用等距闭口组,则 最大值比真实值大一些;最小值比真实值小一些;,职工工资分布表,18,五、几个常用指标,19,频数/单位数/次数:数据落在区间的个数 频率:各组频数占总频数的比重,组中值 (闭口组)组中值(上限下限) (连续式写法) (开口组)缺下限的开口组组中值相邻组下限邻组组距 缺上限的开口组组中值本组下限邻组组距,20,累计频数和累计频率: 向上累计:从低组(第一组)到高组(最后一组),依次累计到每个组上限的总频数或总频率,表明各组上限以下的频数或频率是多少。 向下累计:从高组向低组依次累计到每个组下限的总频数或总频率,表明各组下限以上的频数或频率是多少。,21,职工工资分布表,22,六、频数分布图,23,1、直方图 用直方形的宽度和高度来表示次数分布的图形。绘制直方图时,横轴表示各组组限,纵轴表示次数(一般标在左方)和比率(或频率,一般标在右方)。 2、折线图 折线图可以在直方图的基础上,用折线将各组次数高度的坐标连接而成,也可以用组中值与次数求坐标点连接而成 3、曲线图 用平滑曲线连接各组次数坐标点即得分布曲线。,例,24,1、直方图,25,800,900,1000,1100,1200,1300,工资(元),职工数,28,24,20,16,12,8,4,2、折线图,26,800,900,1000,1100,1200,1300,工资(元),职工数,14,12,10,8,6,4,2,3、曲线图,27,800,900,1000,1100,1200,1300,工资(元),职工数,14,12,10,8,6,4,2,4、累计次数曲线,28,800,900,1000,1100,1200,1300,工资(元),职工数,28,24,20,16,12,8,4,32,以下累计,以上累计,累计次数曲线的应用洛伦兹曲线,29,洛伦茨曲线:是20世纪初美国经济学家、统计学家洛伦兹根据意大利经济学家帕累托提出的收入分配公式绘制的描述收入和财富分配性质的一种累计次数曲线图。 原理: 设有10名学生,各持有现金100元。画累计现金分布图。,累计次数曲线的应用洛伦兹曲线,30,累计现金分布图如下。,0,1,2,8,9,10,学生数,累计现金,900,200,100,1000,B,A,基尼系数,基尼系数:20世纪初意大利经济学家基尼,根据洛伦兹曲线找出判断分配平等程度的指标,根据曲线所包含的面积计算: 联合国有关组织规定: 若低于0.2表示收入绝对平均; 0.2-0.3表示比较平均; 0.3-0.4表示相对合理; 0.4-0.5表示收入差距较大; 0.6以上表示收入差距悬殊。,31,次数分布的类型,32,钟型分布(正态分布、偏态分布) U型分布 J型分布,第三节 统计表与统计图,33,一、统计表 (一)定义: 把统计数据按一定的顺序排列在表格上,就形成了统计表。它清楚地、有条理地显示统计资料,直观地反映统计分布特征,是统计分析的一种重要工具。 (二)结构: 总标题、行标题、列标题、指标数值、表外附加 (三)设计基本要求:,34,(三)统计表的设计应注意如下事项: 线条的绘制:表的上下端应以粗线绘制,表内纵横线以细线绘制。表格的左右两端一般不划线,采用“开口式”。 总标题设计:以简练而又准确的文字表述统计资料的内容、资料所属的空间和时间范围。 指标数值的填写:当数字因小可略而不计时,可写上“0”;当缺某项数字资料时,可用符号“”表示;不应有数字时用符号“”表示。 计量单位:统计表必须注明数字资料的计量单位。当全表只有一种计量单位时,可以把它写在表头的右上方。如果表中
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五版二手房购房代理合同
- 杭州全日制劳动合同范例二零二五年
- 二零二五工程招投标与合同管理教材
- 《2025建筑施工合同管理》
- 2025年标准个人住宅租赁合同范本
- 2025私房租赁合同在哪些情况下可以申请变更
- 机械设备销售合同
- 栏目随片广告赞助合同
- 二零二五年度新能源汽车按揭购车服务合同
- 2025年外籍员工劳动合同范本 外籍员工劳动合同模板
- 职业暴露与安全防护ppt
- 抗肿瘤药物处方审核要点
- 2024届北京东城区北京汇文中学化学高一上期末综合测试试题含解析
- 工业用烤箱安全操作规程范本
- 文件资料交接清单
- 人体解剖学与组织胚胎学课件
- 波导圆极化器结构形式的选择
- 交流电的三要素
- 2022-2023学年天津市部分区八年级(下)期中物理试卷(含解析)
- 2022-2023学年北京市101中学教育集团八年级(下)期中物理试卷含答案解析
- 《平移》说课课件
评论
0/150
提交评论