




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章数据的收集与整理数据的收集统计数据来源统计数据收集的原则和方法统计调查方案统计调查问卷统计数据收集的组织形式2.1.1数据来源
从使用者的角度看,统计数据主要来源于两种渠道:
1、源于直接的调查和科学实验,对使用者来说,这是统计数据的直接来源,我们称之为第一手或直接的统计数据;
2、源于别人调查或实验的数据,对使用者来说,这是统计数据的间接来源,我们称之为第二手或间接的统计数据。在经济活动的分析中,我们通常大量使用二手数据现有统计资料(二手资料)的主要来源:两个途径:一是从相关的年鉴、期刊和有关出版物上获取;二是从有关网站搜寻。(一)统计年鉴1、《中国统计年鉴》2、《国际统计年鉴》3、《地方统计年鉴》4、《中国县(市)社会经济统计年鉴》5、《中国金融年鉴》6、《中国人口统计年鉴》7、《中国统计摘要》(二)有关期刊1、《中国经济数据分析》2、《经济预测分析》(三)相关网站如:1、国家统计局网2、国研网3、中国经济信息网4、中国经济时报网2.1.2统计数据收集的原则和方法统计数据收集的原则:1、准确性原则2、及时性原则3、系统性原则4、完整性原则统计数据收集的方法:观察法、报告法、询问法。
确定调查的时间和方法
拟定调查提纲和调查表4321
统计调查方案
确定调查对象和调查单位
确定调查目的和任务1、确定调查目的
我国于1953、1964、1982、1990、2000年进行过五次人口普查。前四次都是以7月1日零时为标准时间。第一次是为制定第一个五年计划,;第二次是在克服了严重困难后,为制定第三个五年计划;第三次是在结束十年动乱,为国家提供准确、详细人口数据;第四次是为制定“八五”计划,;第五次是为制定人口政策,实现人口与资源环境的协调发展,以2000年11月1日零时为标准时间进行了第五次人口普查。国务院决定于2010年11月1日零时为标准时间开展第六次人口普查。其主要目的是查清我国人口在数量、结构、地区分布、受教育程度、迁移流动和居住环境等方面的变化情况,为编制“十二五”规划提供科学准确的统计信息2、确定调查对象和调查单位调查对象:是指需要调查的现象总体,该总体是由许多性质相同的调查单位组成的。调查单位:是指所要调查的具体单位,它是进行调查登记的标志的承担者。报告单位:报告单位亦称填报单位,它是负责向上报告调查内容、提交统计资料的单位。调查单位与报告单位,有时是一致,有时不一致3.拟定调查提纲和调查表
调查提纲(调查项目):调查中所要登记的调查单位的特征,即调查单位所承担的基本标志,它由一系列品质标志(或称质量标志、属性标志)和数量标志所构成。调查表:将各个调查项目按照一定的顺序排列在一定的表格上,就构成了调查表。
4.确定调查的时间和方法
统计调查时间包括二种涵义,即调查时间和调查期限。
调查时间:是指调查资料所属的时间。调查期限:是进行调查工作的时限,包括搜集资料和报送资料的工作所需的时间。人口普查(每10年进行一次,在逢0的年份实施)经济普查(每10年两次,分别在逢3,8的年份实施)农业普查(每10年进行一次,在逢6的年份实施)
统计调查问卷问卷的类型与结构问卷设计应注意的问题问卷的类型与结构问卷的类型按问卷填写方式划分,可将调查问卷分为自填式问卷和访问式问卷调查问卷的基本结构一份完整的调查问卷,通常由题目、说明信、被调查者基本情况、调查事项的问题和答案、填写说明与解释等5个主要部分构成。问卷设计应注意的问题问卷上所列问题应该都是必要的。所问问题应是被调查者熟悉且易于回答的。注意询问语句的措辞和语气。私人生活问题,最好采用间接提问的方法。所拟答案要有穷尽性,避免重复或相互交叉。问卷纸张质地要良好,不宜破损,字迹印刷清晰。统计数据收集的组织形式统计数据收集的组织形式:统计报表、专门调查。统计报表:报送目录、报表表式、填表说明。专门调查:普查、抽样调查、重点调查、典型调查。数据的整理统计整理的概念和意义统计整理的步骤统计分组次数分布变量数列的编制次数分布的表现形式统计资料的汇总统计表和统计图统计整理的概念和意义统计整理:是根据统计研究的任务与要求,对统计调查所搜集到的原始资料进行科学的综合与加工,使之系统化、条理化的工作过程。
总产值(万元)0-5050-100100-150150-200200-250合计企业数(个)1024352110100表2-12005年12月某市工业企业总产值分布表统计整理的概念和意义统计整理的意义:经过统计整理,实现了从个别单位的数量特征到总体数量特征的第一次综合,得到了描述现象总体数量特征的最初始的综合指标。统计整理的步骤统计整理的步骤包括:1.、制定统计整理方案2、审核、纠正统计数据资料3、进行科学的统计数据分组与汇总4、编制统计表和绘制统计图审核资料的正确性,是检查所填报的资料是否准确可靠。常用的审核方法有三种:(1)逻辑检查首先,从理论上或常识上检查资料是否有悖常理、有无不切实际或不符合逻辑的地方。其次,是检查各项目之间有无相互矛盾的地方。(2)计算检查即检查各项指标的计算口径、计量单位是否符合规定,并通过各种计算方法来检查各指标间的数字是否相互衔接。(3)人机同审2a、资料审核后的订正通过上述审核,如发现有缺报、缺份和缺项等情况,应及时催报、补报;如有不正确之处,则应分别不同情况作如下处理:(1)对于可以肯定的一般错误,应及时代为更正,并通知原报单位。(2)对于可疑之数或无法代为更正的错误,应要求原单位复查更正。(3)如果所发现的差错在其他单位也可能发生时,应将错误情况通报所有单位,以免发生类似错误。(4)对于严重的错误,应发还重新填报,并查明发生错误的原因,若属于违法行为,则应依法严肃处理。统计分组
统计分组的概念与作用分组标志的选择统计分组的方法统计分组的概念与作用统计分组:就是根据统计研究的目的和现象总体的内在特征,按照一定的标志将统计总体划分为若干个性质不同而又有联系的几个部分的一种统计方法。统计分组的概念与作用统计分组的作用:1、统计分组可以划分社会经济现象的类型。2、统计分组可以研究现象的内部结构。3、统计分组可以分析现象之间的相互依存关系。分组标志的选择选择分组标志遵循以下原则;1、穷尽原则2、互斥原则3、科学性统计分组的方法按品质标志分组或按数量标志分组按品质标志分组:是指选择反映事物属性差异的品质标志作为分组标志,并在品质标志的差异范围内划分各组界限,将总体划分为性质不同的组成部分。如职工按性别、文化程度、工种分组;企业按经济类型、地区分组;学生按生源、性别分组等都是按品质标志分组。统计分组的方法按品质标志分组或按数量标志分组按数量标志分组:是指选择反映事物数量差异的数量标志作为分组标志,并在数量标志的变异范围内划分各组界限,将总体划分为若干性质不同的组成部分。如人口按年龄、身高、体重分组;企业按总产值、职工人数、资金利润率分组等。统计分组的方法简单分组和复合分组简单分组:就是按一个标志对总体进行分组。如学生按学习成绩分组,企业按生产规模分组。
统计分组的方法简单分组和复合分组复合分组:是指对总体按两个或两个以上的标志层叠起来进行的分组,即将总体先按一个分组标志进行分组,在此基础上按另一个分组标志把已分成的各个组成部分再分成若干小组。例如,学生先按性别分组,在此基础上,再按年龄分组就是复合分组。进行复合分组时,应根据统计分析的要求确定分组标志的主次顺序。次数分布次数分布的概念次数分布的种类次数分布的概念在统计分组的基础上,将总体的所有单位按组归类整理,所形成的总体单位数在各组之间的分布,称为次数分布。分布在各组的总体单位数叫次数或频数。各组次数与总体总次数之比称为比重或频率。次数分布有两个构成要素:一是总体分成的各个组,二是各组的单位数。次数分布的种类根据分组标志特征的不同,次数分布可以分为品质分布数列和变量分布数列。变量数列按变量的表示方法不同,可分为单项变量数列和组距变量数列两种。品质分布数列按品质标志分组所形成的分布数列,称为品质分布数列,简称品质数列。品质数列由各组名称和次数构成。某企业工人性别构成情况表按性别分组职工人数(人)比重(%)男65065女35035合计1000100各组名称次数频率变量分布数列按数量标志分组所形成的次数分布数列叫变量分布数列,简称变量数列。变量数列由各组变量值和各组次数构成。按成绩分组人数(人)比重(%)60以下41060-7061570-80164080-90102590以上410合计40100各组名称次数频率某班学生统计学成绩分布表变量分布数列单项变量数列
1、单项变量数列是按数量标志分组后,用一个变量值代表一个组所形成的数列,简称单项数列。
2、单项数列适用于变量值个数较少,变量值变动范围较小的离散型变量。平均日产量工人数绝对数(人)比重(%)7816818369193810510合计50100某车间第一季度工人平均日产量变量分布数列组距变量数列
1、组距变量数列是按照数量标志分组后,用变量值变动的一定范围代表一个组所形成的数列。
2、组距变量数列适用于变量值个数较多,变动范围较大的离散型变量以及所有的连续型变量按成绩分组人数(人)比重(%)60以下41060-7061570-80164080-90102590以上410合计40100某班学生统计学成绩分布表组距变量数列在组距数列中,表示各组界限的变量值叫组限,其中较小的变量值称为下限,较大的变量值称上限。各组上限与下限之间的距离叫组距,上限与下限之间的中点值叫组中值。组距=上限-下限组中值=(上限+下限)/2组距变量数列在编制组距数列时,常常使用“某某以上”或“某某以下”,这样不确定组限的组,称为开口组。开口组的组中值按下列公式计算:缺下限的最小组的组中值=上限-相邻的组距/2
缺上限的最大组的组中值=下限+相邻的组距/2某地区100个百货商店月销售额与流通费用情况销售额(万元)商店数(个)每百元商品销售额中支付的流通费(元)50以下50~100100~200200~300300以上102030251514.211.410.19.28.5上组限U下组限L如:组距d=U-L=100-50=50(万元)如:组中值x=(U+L)/2=(100+200)/2=150(万元)某连续变量分组数列,其末组为开口组,下限为500,又知其相邻组的组中值为480,则末组的组中值为()答案:520组距变量数列组距数列根据各组的组距是否相等可以分为等距数列和异距数列。如果各组的组距相等,称为等距数列;如果各组的组距不相等,称为异距数列。一般在社会经济现象性质差异变动比较均衡的条件下使用等距数列。如,学生的学习成绩分组,工人的工资。异距数列则能比较准确反映总体内部各部分之间的性质差异。变量数列的编制编制变量数列,要注意以下问题:
1、确定形式
2、确定组距和组数
3、确定组限次数分布的表现方法次数分布有向上累计和向下累计两种计算方法。频率各组单位数占总体单位总数的比重累计次数(频率)
从变量值低的组开始,将各组次数(频率)逐次向变量值高的组累计,说明某一组上限以下各组的累计次数(频率)。向上累计向下累计
从变量值高的组开始,将各组次数(频率)逐次向变量值低的组累计,说明某一组下限以上各组的累计次数(频率)。
销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)向上累计向上累计5以下5~1010~1515~2020~2525以上41016134382032268641430434750828608694100合计50100——
销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)向上累计向下累计向上累计向下累计5以下5~1010~1515~2020~2525以上410161343820322686414304347505046362073828608694100100927240146合计50100————茎叶图由“茎”和“叶”两部分组成,按“茎”把一组数据分为若干行,“茎”相同的数据分在同一行;(2)图形是由数据构成的;(3)以该组数据的高位数作为茎,低位数(尾数)作为叶,树茎一经确定,树叶自然地长在树茎上了。根据抽样调查,某月某市50户居民购买消费品支出资料如下(单位:元):83088012301100118015801210146011701080105011001070137012001630125013601270142011801030870115014101170123012601380151010108608101130114011901260135093014201080101010501250116013201380131012701250用茎叶图整理数据810306070805930110001010305050708080
9110030405060707080809010120010303050505060607070111310205060708080714102020604151080216301
茎叶次数未分组数据—茎叶图
(扩展的茎叶图)树茎树叶10*10.11*11.12*12.13*13.78802234577788890012222333344455667778890133445799统计资料的汇总统计资料汇总就是在编制次数分布后,汇总计算各组及总体的单位数以及各组及总体的标志总量。统计资料汇总的组织形式一般有:逐级汇总、集中汇总和综合汇总。统计资料的汇总技术有手工汇总和计算机汇总两种。统计资料的汇总逐级汇总就是按照一定的统计组织管理系统,自下而上地逐级汇总本系统、本地区、本单位的调查资料。集中汇总就是将全部调查资料集中到组织调查的最高机关或其指定的机构进行汇总。综合汇总及将逐级汇总和集中汇总两种汇总形式结合起来使用。统计表和统计图数据整理的结果最终表现为统计表和统计图。具有容量大、方便计算等特点统计表以纵横交叉的线条所形成的表格来表现统计资料的形式统计表的优点:1、能有条理、有系统的排列统计资料,使人在阅读时一目了然;2、能合理地、科学地组织统计资料,便于对比分析;3、易于检查统计数字的完整性和正确性。统计表年份第一产业第二产业第三产业合计2005224208736573433183217200624040103162847212119232007280951213811000542495302005-2007年我国国内生产总值亿元表头本表按当年价格计算资料来源:2008中国统计年鉴.北京:中国统计出版社,2008.行标题列标题数据注释统计表的构成如下:统计表式设计注意事项统计表应设计成由纵横交叉线条组成的长方形表格,长与宽之间保持适当的比例;合计栏设计。各纵列须合计时,应将合计列在最后一行,各横行须合计时,将合计列在最前一栏或最后一栏。表的上、下端用粗线或双线封口,左右两端一般不封口;统计表内容设计注意事项标题设计。指标数值。表中数字应该填写整齐,对准位数。当数字因小可略而不计时,可写上“0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年呼和浩特货运从业资格证考试试题和答案
- 食品安全及其相关法律法规标准体系s
- 三农村领导干部教育培训方案与实施细则
- 工程劳务外包协议书
- 传统制造业转型框架智能制造实践
- 化妆品生产中的膏体稳定
- 高效率办公室建设规划表
- 收入支出报表分析
- 2025年廊坊货物从业资格证考试
- 企业供应链金融解决方案实践案例分享
- 新能源汽车产业研究综述
- 2023-2024学年安徽省马鞍山市物理八下期末考试试题及答案解析
- 2024年江苏农牧科技职业学院单招职业适应性测试题库新版
- 第22课《陈涉世家》课件(共71张)
- 新能源汽车产业专利分析综述
- 2010年4月自考00371公安决策学试题及答案含解析
- 实验室仪器借用登记表
- 单肺通气与肺保护通气策略护理课件
- 规培出科小结呼吸内科
- 《钢铁是怎样炼成的》选择题100题(含答案)
- 《房地产行政管理》课件
评论
0/150
提交评论