西财向蓉美第二章统计数据的收集与整理.ppt_第1页
西财向蓉美第二章统计数据的收集与整理.ppt_第2页
西财向蓉美第二章统计数据的收集与整理.ppt_第3页
西财向蓉美第二章统计数据的收集与整理.ppt_第4页
西财向蓉美第二章统计数据的收集与整理.ppt_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章 统计数据的收集与整理,Contents,第一节 统计数据的收集 第二节 统计数据的整理 第三节 统计图与统计表,第一节 统计数据的收集,一、统计调查的意义及要求 统计调查就是根据统计研究的目的和任务,运用科学的调查方法,有计划、有组织地收集各种统计资料的过程。 两类: 直接来源初级资料 间接来源次级资料,统计调查的基本要求,统计调查是统计工作的基础环节 统计调查是认识事物的起点 基本要求: 准确性 统计数据质量的生命之本 及时性 统计数据质量的活力之源 完整性,二、统计调查方案,调查项目 调查表,确定调查目的,根本性问题 为什么调查? 要解决什么问题? 调查具有什么样的社会经济意义和作用?,关于当前大学生的消费情况调查方案,调查目的部分: 了解当前大学生的消费情况,分析大学生消费的现状,指出大学生高消费的误区,并提出建设性的对策思考。 在此基础上,提出相应的改进建议,为今后的大学生消费提供一个可供参考的方案。 形成大学生以艰苦奋斗为荣,骄奢淫逸为耻的消费观,创建节约型校园文化。引导他们在考虑个人消费时不忘光荣传统,科学规划安排,使个人消费标准与家庭情况相适应。教育学生要树立勤俭节约、科学的消费意识。,调查对象和调查单位,调查对象:调查研究的总体范围, 即调查总体。 调查单位:调查研究的总体单位, 即要登记的标志的承担者。 可以是调查对象的全部单位(全面调查),也可以是调查对象中的一部分单位(非全面调查)。 填报单位:负责报送 统计数据资料的单位。,举例,搜集某地区国有企业生产情况的资料 调查目的?调查对象? 调查单位?填报单位? 搜集某地区国有企业中高精尖设备使用情况的资料 调查目的?调查对象? 调查单位?填报单位?,举例,北京市大学生消费情况调查方案的调查对象和调查单位: 学校类型,力求涵盖综合性大学以及文、理科大学,选取11所高校为:中央财经大学、北京外国语大学、北京交通大学、北京民族大学、北京理工大学、人民大学、清华大学、北京航空航天大学、北京师范大学、北京林业大学、北京大学。对于抽样方法有以下考虑: 1、大一新生刚入学,代表性较差,因而只调查其他年级,抽样的年级人数比为2:2:1; 2、调查中尽量保证男女比例为1:1; 3、进行整群抽样,即分别在大二和大三中随机抽取两个班,在大四中随机抽取一个班。,大学生消费情况调查,生活方面校内饮食、校外饮食、服装、日化用品及其他 学习方面书籍、考试费、辅导费 休闲娱乐旅游、网上冲浪、电影、音乐、通讯,普查,对调查对象中全部单位无一例外地都进行调查的调查方法。 特点: 通常是一次性的或周期性的; 一般需要统一规定标准调查时点; 普查的资料一般比较准确; 适用范围比较窄。 具体方式: 从上至下 调查表 调查单位自行填报,正确选择普查时期,人口 普查,统计报表,定期 自下而上 统计报表的种类 全面统计报表和非全面统计报表 国家统计报表、部门统计报表和地方统计报表 日报、旬报、月报、季报、半年报、年报 基层报表和综合报表 电讯报表和书面报表 统计报表的特点 统一性 群众性 全面性 经常性,抽样调查,按照随机原则,从总体中抽取一部分单位进行调查,根据调查结果推断总体的调查方法。 应用最广泛 特征: 随机原则 小部分单位深入研究,推算总体,检验产品合格率,典型调查,从调查对象中选择一个或几个具有代表性的单位进行全面深入调查的调查方法。 特点: 深入、细致 代表性程度不好判断 调查结论不一定代表研究问题的本质特征 定性研究,了解某个班同学的学习情况,了解某地区钢铁企业盈利情况,重点调查,从调查对象中选择少数重点单位进行调查,进而了解总体的基本状况的方法。 重点单位:在总体中数目不多,比重不大,但调查的标志值却在总量中占很大比重 优点:较少的人力和时间,取得较好的效果,对全国钢铁产量情况的调查 选取首钢、宝钢、鞍钢、武钢作为重点单位,各种调查方法综合运用,以必要的周期性普查为基础 以经常性的抽样调查为主体 辅之以统计报表、重点调查等多种方法综合运用的统计调查方法体系,其他问题,调查时间 调查资料所属的时点或时期 调查期限 调查工作进行的起止时间 调查经费 调查人员 其他准备,1990年第四次人口普查 规定的调查时间为 “1990年7月1日0时”; 调查期限是 “1990年7月1日至7月10日 完成普查的登记工作”。,练习,一、单选 1.对百货商店工作人员进行普查,调查对象是( ) A各百货商店 B各百货商店的全体工作人员 C一个百货商店 D每位工作人员 2.全国人口普查中,调查单位是( ) A全国人口 B每一个人 C每一户 D工人工资 3.对某城市工业企业的设备进行普查,填报单位是( ) A全部设备 B每台设备 C每个工业企业 D全部工业企业,4.某城市拟对占全市储蓄额五分之四的几个大储蓄所进行调查,以了解全市储蓄的一般情况,则这种调查方式是( ) A普查 B典型调查 C抽样调查 D重点调查 5.统计调查项目是( ) A调查过程中应进行的工作总和 B统计调查计划 C在进行调查过程中必须得到回答的问题目录 D用统计调查的结果来得到答案的项目 6.人口普查规定统一的标准时间是为了( ) A避免登记的重复与遗漏 B确定调查的范围 C确定调查的单位 D登记的方便,二、判断 1.重点调查的重点单位是根据当前的工作重点来确定的( ) 2.调查时间是指进行调查工作所需的时间( ) 3.对变化较小、变动较慢的现象应采用一次性调查来取得资料( ) 4.调查单位就是填报单位( ) 5.调查对象就是统计总体,而统计总体不都是调查对象( ) 6.在统计调查中,调查对象可以同时又是调查单位,调查单位可以同时又是总体单位( ),第二节 统计数据的整理,一、统计数据整理的意义 统计整理:是指根据统计任务要求,对原始资料进行加工和整理,使之条理化、系统化的工作过程。 统计整理是统计调查的继续,是统计分析的基础和前提,在整个统计工作中起到承上启下的作用。 统计整理的方法: 分 组 汇 总 手工汇总:划记法、过录法、折叠法、卡片法 计算机汇总 制表制图,二、统计分组,(一)统计分组的概念和作用,概念:是根据研究任务的需要,按某种标志将总体划分为几个性质不同而又有联系的几个组。,组内同质性 组间差异性,作用:,1、划分社会经济类型,2、研究总体内部的结构,3、分析现象之间的依存关系,注:统计分组的关键在于分组标志的选择和分组界限的确定。,工业企业按从业人员和营业收入标准分类,我国人口年龄构成,工厂按产量分组,(二)统计分组的原则 科学性原则 完备性原则 互斥性原则 (三)分组的类型 1、分组标志的性质 品质标志分组 数量标志分组 2、分组标志的多少 简单分组(按一个标志划分) 复合分组(按二个及以上,层叠分组),例如:对全国的工业企业进行 简单分组: 按轻重工业分:重工业、轻工业 按企业规模大小分:大型企业、中型企业、小型企业 复合分组:,重工业,轻工业,大型企业,中型企业,小型企业,大型企业,中型企业,小型企业,按分组标志的性质分,女,男,学生按考试成绩分组,90分以上 80-90 70-80 60-70 60 分以下,学生按性别分组,学生按民族分组,汉族 回族 苗族 土家族 羌族 壮族 . . .,学生按年龄分组,19岁及以下 20岁 21岁 22岁 23岁 24岁及以上,三、分布数列,(一)分布数列的概念和种类 1、次数分布数列(分布数列、次数分布、次数分配):将总体各单位按某个标志分成若干组,列出各组的总体单位数或各组单位数在总体单位数中所占的比重,形成的数列。 分配数列的要素 总体按某标志分组 各组所占有的单位数,称为次数或频数 频率:又称为比重。是指各组单位数占总体单位数的比重。 注:各组频率之和等于1或100% 每组频率大于0。,分配数列包含的两要素:总体按某标志所分的组和各组所占有的单位数-次数。 统计分配数列的意义:是统计整理结果的一种重要的表现形式,也是统计分析的一种重要方法。 2、分配数列的种类: 品质分配数列:按品质标志分组所编成的分配数列。 变量分配数列:按数量标志分组所编成的分配数列。(又分单项式数列、组距式数列) 分配数列的特点: 品质数列一般比较稳定,通常能够准确地反映总体的分布特征。 变量数列按同一数量标志分组时有出现多种分布的可能。,单项式数列:适合于离散变量,标志表现数量较少时,每个 变量为一组; 组距式数列:变量数量较多,变动较大或连续变量的分组; 等距数列:各组变量之间组距相同; 异距数列:各细变量之间组距不同; 注:在等距分组中,每组的上限不在本组内(P53)。,变量分配数列,离散型变量分组:各组的上下限都可以用确定的数值(整数)表示。 连续性变量分组:相邻组的上限和下限无法用两个确定的数值分别表示,因此上一组的上限同时也是下一组的下限重叠。,例如:企业按工人工资对工人进行分组如下: 500600元 600-700元 700-800元 如果某工人工资为700元,应将他归并到哪一组? “上组限不计入”原则:遇到某单位的标志值刚好等于相邻两组上下限时,一般把此值归并到作为下限的那一组。,上下限不重叠,组限和组中值 组限:在组距分组中,组距两端的数值。小的数值为下限,大的数值为上限。 组距=每组上限 每组下限 组中值:每组上限与下限之间的中点值,代表每组的一般水平。 组中值的计算公式: 闭口组的组中值=(上限+下限)/2 开口组的组中值 缺上限组: 缺下限组: 注:各组组中值之和无意义。,表3-1 某班学生统计学原理考试成绩分布表,(二)次数分布图和类型,直方图 折线图 曲线图,某车间50名工人日加工零件数分组表,分组数据直方图 (直方图的绘制),3,105,110,115,120,125,130,135,140,6,9,12,频数(人),50名工人日产零件分组,15,12,9,6,3,105,110,115,120,125,130,135,140,日加工零件数(个),频 数 (人),某车间工人日加工零件数的折线图,分组数据折线图 (折线图的绘制),钟型分布:一般次数分布呈正态分布曲线,或称正态曲线,对称型,次数分布的主要类型,很多是偏态分布曲线,或称偏态曲线,Y,Y,右偏型 (上偏型),左偏型 (下偏型),X,X,还有其他形态,J型分配曲线,U型分配曲线,(三)累计次数分布 频数和频率,1、概念:变量数列中的各组单位数表示我们所要考察的标志值在各组中出现的次数,称为次数或频数,各组次数占总次数比重称为频率。 2、作用:在变量数列中标志值构成的数列表示标志值的变动幅度,而频数构成的数列则标志相应标志值的作用程度(频数愈大则组的标志值对于全体标志水平所起的作用也愈大,反之,频数愈小则组的标志值所起的作用也愈小) 工资水平 组人数 组人数 2000-3000 15 45 3000-4000 10 30 4000-5000 45 10 5000-6000 30 15,可以判断第 组平均工资比 第组要低),某企业按职工工资分组: 人数(次数) 频率 2000以下 10 10% 20004000 30 30% 40006000 35 35% 60008000 15 15% 8000以上 10 10%,3、频率分布指按顺序列出各组标志值范围(或以各组组中值来代替)和相应的频率形成的统计分布。要求:各组的频率大于0,各组的频率总和等于1 4、累计频数指首先列出各组的组限,然后依次累计到本组为止的各组频数。 累计频率指累计频数除以频数总和。,向上累计是将各组频数和频率由变量值小的组向变量值大的组累计。(是各组上限以下的累计频数或累计频率),向下累计是将各组频数和频率由变量值大的组向变量值小的组累计(是各组下限以上的累计频数或累计频率),第三节 统计图与统计表,一、统计图 柱形图 条形图 圆形图 线图,茎叶图 (扩展的茎叶图),中国人口的年龄构成图,数据类型及图示 (小结),数据类型与展示,品质数据,数值型数据,总计表,分组数据,原始数据,时序数据,条形图,圆形图,环形图,直方图,折线图,茎叶图,趋线图,二、统计表 概念:把统计资料按一定规则在表格上表现出来。 注:数字是统计语言,统计表和统计图是表述统计资料的基本形式。 1. 统计表的构成:总标题、横行标题、纵栏标题、数字资料。 2. 统计表的内容构成:主词部分和宾词部分。 注:统计表的构成和内容构成见表3-2,表3-2 某班统计学原理考试成绩分布表,横行标题,纵栏标题,数值资料,总标题,主词,宾词,(二)统计表的种类 统计表根据其主词是否分组和分组程度分为三种。 简单表:主词未经过任何分组的统计表。(P59) 分组表:主词按某一标志进行分组的统计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论