版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第2章 统计调查与统计整理 如果没有诸如GDP之类的核算经济总量的指标的话,政策制定者们只能在杂乱无章的数据海洋中漂泊。保罗.萨缪尔森主要内容统计调查概述统计调查的方式和方法统计整理的步骤和方法统计分组分配数列及编制()统计表2.1 统计调查2.1.1 统计调查的种类1.统计调查的组织方式统计报表制度(Statistical Report Forms )概念 :基层企业和各级主管机关,按照中华人民共和国统计法的有关规定,按照国家统一规定的表格形式、统一的指标、报送时间和报送程序自下而上定期地向上级统计机关报告基本统计资料的一种报告制度。主要特点:由政府部门组织,采用统一的表格,自上而下布置,自
2、下而上报告。基本任务:搜集国民经济和社会发展基本情况的资料,为制订国民经济和社会发展计划和检查计划执行情况服务。突出优点:精心设计、高度统一、规范。回收率高,内容相对稳定,便于资料积累、对比。层层上报、逐级汇总,可以满足各级部门管理需要。种类 (1)统计报表按实施的范围分:统计报表可以分为基本统计报表(对应国家统计系统)和专业统计报表(对应业务部门统计系统)。后者例如:测绘局统计系统、国土资源部统计系统。(2)统计报表按报送的周期分:统计报表可以分为日报、旬报、月报、季报、半年报、年报。(3)统计报表按填报单位的不同分为基层报表和综合报表。(4)统计报表按报送的方式分:可以分为电讯报表、书面报
3、表及电讯和书面相结合报表。基本统计数据(对应基本统计报表制度)2.1.1 统计调查的种类1.统计调查的组织方式专门调查普查(Census)是对调查对象的全部调查单位逐一进行的调查。如资源调查。 主要特点:工作量大,需要大量人力和财力,非连续性调查。基本任务:搜集重要国情国力和资源状况的全面资料,为政府制定规划、方针政策提供依据。两种方式:建立专门机构,配备专门人员调查。(自上而下)利用基层单位原始记录和核算资料,发表调查。(自下而上)注意原则:规定统一的标准时点规定统一的普查期限规定调查的项目和指标网络链接: 国家统计局普查中心http:/tjsj/pcsj/ 农业普查的标准时间? (国务院第
4、二次全国农业普查领导小组办公室2007-01-09 )第二次全国农业普查的普查时点为2006年12月31日24时。凡是普查表中提到的年末资料,如“2006年年末耕地面积”、“2006年年末拥有住房情况”等,均以普查时点数据为准。(时点数据)第二次全国农业普查的普查时期为2006年1月1日至12月31日。凡是普查表中提到的年度资料,如“2006年在本户实际从事农业时间”、“2006年播种面积”等,均以普查时期全年数据为准。 (时期数据)农业普查的内容是什么? 第二次全国农业普查的具体内容有: (一)农户人口与劳动力就业状况;(二)农户家庭生活设施和生活条件;(三)农户承包与经营的农业用地;(四)
5、农户农业生产条件和农业生产情况;(五)各种企事业单位的农业生产经营情况;(六)乡镇和村的社会经济状况与发展情况。三、重点调查(Key-point Survey) 主要特点:在总体中选择个别或部分重点单位进行调查。但不宜据此推断总体其他单位。 重点单位指在总体中有举足轻重地位的单位,其标志值在总体标志总量中占有绝对比重。基本任务:及时了解总体基本情况,为主管部门指导工作服务。两种方式:一次性调查:专门设计和备配人员现场调查。经常性调查:同报表制度结合,用统计报表调查。举例: 调查我国港口年货物吞吐量,在时间有限的情况下,可只调查一些重点单位:上海、天津、广州、深圳、青岛、大连、烟台港。四、典型调
6、查(Model Survey) 主要特点:在全面分析的基础上,有意识地选择代表性的典型单位进行详细调查。所谓典型单位,是指那些能充分、集中地体现调查对象总体某些方面共性特征的最有代表性的单位。 基本任务:为研究某种特殊的社会经济问题,搜集详细的第一手资料,借以认识事物的本质特征、因果关系、变化趋势。为理论和政策性问题研究提供依据。突出作用:适宜于研究处于萌芽状态事物和倾向性问题;适宜于分析事物的类型,它们之间的差别和关系。选典方法:“解剖麻雀”、“深度访谈”“划类选典”“抓两头”举例:大学生的就业观;五、抽样调查(Sampling Survey ) 定义:是一种非全面调查,它是在全部调查单位中
7、抽取一部分单位作为样本进行调查,再根据调查结果推断总体的一种调查方法。广义的抽样调查包括随机抽样与非随机抽样。特点按随机原则从总体中抽取样本单位;以样本指标(统计量)为依据推断总体参数或检验总体的某种假设。抽样误差可以事先计算并加以控制。2.统计调查包括的范围3. 调查时间的连续性2.1.2 统计调查的方法2.1.2 统计调查的方法优点:收集资料准确缺点:成本较大(耗用人力、物力、财力、时间等较大) ;主观性强。 2.1.2 统计调查的方法被调查者根据统计报表的格式要求,按照隶属关系,逐级向有关部门上报统计资料 。缺点:成本高,费时、费力2.1.2 统计调查的方法优点:省时、省钱、省力,便于定
8、量处理与分析, 可以避免主观偏见、减少误差,匿名性;缺点:回收率以及资料的质量均难以保证。 2.1.2 统计调查的方法通过实验对比获取统计资料。一般作法是,从影响问题的诸多因素中选出一至若干个因素,在设置一定的实验条件下观察其反映,然后对实验结果进行对比分析,并确定是否大规模推广。 2.1.2 统计调查的方法优点:被调查对象的回答率大大高于问卷法,适应性强,调查内容机动性大,访谈者对资料收集过程可进行有效控制;缺点是:访谈成本大,匿名性差,访谈 结果与访谈人员的素质、能力及其现场表现直接相关。 2.3 统计整理的步骤目标:去伪存真、去粗取精、条理化、系统化。步骤:统计资料的审核及编码统计资料分
9、组统计资料汇总编制统计表绘制统计图。 统计资料分组统计资料汇总编制统计表绘制统计图统计资料的审核及编码统计资料分组统计资料汇总编制统计表绘制统计图统计资料的审核及编码核查资料的完整性、正确性、记实性;统计资料分组统计资料汇总编制统计表绘制统计图统计资料的审核及编码区分总体类型 反映总体内部结构 分析总体在数量现象之 间的依存关系 上海市生产总值与增长 上海市六个重点发展工业行业占工业总产值的比重 2.4 统计分组1.概念: 根据事物内在的特点和统计研究的任务,把社会经济现象区分出不同的类型或组。统计分组必须保持各组内的同质性和组与组之间的差别性。分组的关键是分组标志的选择。举例: 研究改革开放
10、以来我国GDP中三次产业结构的变化,分析我国经济的发展阶段。2 .统计分组的作用类型分组例:按所有制性质划分,我国现有8种经济类型:国有经济 联营经济集体经济 股份制经济私营经济 外商投资经济个体经济 港澳台投资经济上海市按GDP计算的三次产业结构(%) 1980年1990年1996年1997年GDP100100100100第一产业2.3第二产业75.763.854.552.2第三产业21.131.943.045.5结构分组中国农民家庭按收入分组的恩格尔系数(1984年) 按收入分组(元)1001502003004005006008001000恩格尔系数(%)68.367.5
11、64.960.256.754.450.549.943.6恩格尔系数(Engels Coefficient)是食品支出总额占个人消费支出总额的比重。简单地说,一个家庭的恩格尔系数越小,就说明这个家庭经济越富裕。反之,如果这个家庭的恩格尔系数越大,就说明这个家庭的经济越困难。现象之间的依存关系3.分组标志的选择与分组的方法 分组标志的选择关键: 服从研究目的,反映总体本质特征。如研究性别对薪酬的影响;学历对薪酬的影响。分组的方法:按品质标志分组:按照事物的性质差异分组 ,如职工按性别、民族、工种分组;有时界限模糊。(如农民工、生产粮食的食品厂) 按数量标志分组:按事物的数量变化分组。通过量的变化反
12、映质的特征。例如,按年龄分组,将全部人口分为少年、青年、中年、老年阶段;一般界限明确。第一标志(职务)第二标志(年龄)第三标志(性别)高级职称(教授、副教授)45岁以上男女45岁以下男女非高级职称(讲师、助教)45岁以上男女45岁以下男女按分组标志的多少,可分为简单分组与复合分组,简单分组是按照一个分组标志对所研究的对象进行分组。复合分组是按照两个或两个以上的分组标志对所研究的对象进行分组。 例:复合分组从三次产业结构看经济阶段年份修订后数据第一产业第二产业第三产业199319.546.633.9199419.746.533.8199519.747.233.1199619.547.533.01
13、99718.147.534.4199817.346.236.5199916.245.838.0200014.845.939.3200200213.544.841.7200312.546.041.520041993年以来我国三次产业结构 部分中下等收入国家三次产业结构 国家2004年三次产业比重()第一产业第二产业第三产业下中等收入国家12.036.951.1中国巴西5.217.277.7哈萨克斯坦7.339.453.3埃及15.532.152.4印度尼西亚16.945.637.6印度21.826.152.2案例根据工业发
14、达国家的经验来看,自从进入后工业化时代以来,西方国家三产业占GDP比重基本趋于一致,并与劳动力就业结构高度一致。从GDP分布比例来看,大多数发达国家第一产业比重均在3%以内,一般不超过5%;第二产业比重一般为30%左右;第三产业比重多为65%以上。 从产业结构的升级换代来讲,西方发达国家的产业结构已从传统工业化时代步入了现代的信息化时代:第三产业(即服务业)已经成为GDP的绝对“统治者”;而工业化的“功臣”第二产业(主要是工业)已经沦为次要产业;传统农业(即第一产业)则是处在“坚守”境地。 2.5 变量数列及其编制2.5.1 分配数列的概念及种类将总体按照一定标志分组,说明个体在各组之间的分配
15、情况的一系列数字,叫做分配数列(或分布数列)。分布在各组中的总体单位数(即个体数),叫做次数,亦称频数;次数与总次数的比值,叫做比率,亦称频率。分配数列组成的表叫次数分布表。分配数列是统计整理的结果,是进行统计描述和统计分析的重要方法和前提。分配数列的种类 由于分组标志不同,分配数列可分为两种:按照品质标志进行分组形成品质数列。用来反映不同属性的各组次数在总体中的分布状况,它由各组名称、各组频数或频率组成;按照数量标志进行分组形成变量数列。用来反映不同变量值的各组次数在总体中的分布状况,它由各组变量值和各组次数或频率组成。 某大学在校学生的性别分布:品质数列性别人数(人)比率(%)男性女性12
16、70107054.2745.73合计2340100.00用来反映:不同属性的各组次数在总体中的分布状况,由各组名称、各组频数或频率组成。某班同学年龄分布:变量数列按年龄分组(岁)人数(人)比率(%)181920212638144110.026.746.713.33.3合计30100.0用来反映:不同变量值的各组次数在总体中的分布状况,由各组变量值、各组频数或频率组成。分布数列的基本形式分组标志次数(频数)比率(频率%) - - 合计 -100.00频数分布 频率分布 变量数列的分类单项变量数列(单项数列/单项式) 单项数列就是每一个组只有一个变量值(标志值)的数列。它是按变量值大小顺序排列的。
17、适用于变量值不多以及变动幅度不大的离散型变量,一般是有多少个变量值就分为多少个组。组距变量数列(组距数列) 组距数列是把变量的取值(标志值)范围划分成若干区间,以一段变动区间为一个组的数列。即组距数列中的每一个组是由一个变量值的区间表示。适用于变量值个数较多、变量值变动幅度较大的离散型或连续型变量时运用,它又分为等距数例和异距数列。2.5.2 组距数列的编制方法(1)组距:分组后每组的距离,即每组中最大的值与最小值的差。(2)组数:分组后得到的组数(分了几组)。组距和组数呈反向关系。(3)下组限:组距的起点,即每组中最小值。(4)上组限:组距的终点,即每组中最大值。(5)组中值:上、下组限的平
18、均值。(6)等距分组:就是每个组的距离都相等。(7)不等距分组:就是每个组的距离不都相等。(8)闭口组:所分的组上限与下限都是齐全的。(9)开口组:所分的组中最初的组只有上限,没有下限或最末的组只有下限没有上限。或首末两组用“*以下”和“*以上”表示。在有开口组时,其组距以邻近一组的组距为准。(10)间断标志:分组的标志值不连续变化。(11)连续标志:分组的标志值连续变化。 01010202030304010以下1015154040以上1561011202110060以下6075758585以上A和B,哪个为等距分组?哪个是开口组、闭口组?B中,第一组和最后一组的组距是什么?C和D,哪个为连续
19、组?在D中,60、75和85分别属于哪一组?B组中,第一组和最后一组的组中值是什么?A B C D 闭口组开口组间断组连续组01010202030304010以下1015154040以上1561011202110060以下6075758585以上等距组不等距组标志值有间断或无法存在小数标志值不间断或存在小数组距为:10组距为25组距为5上组限不在本组内开口组最初、最末两组,其组中值是什么?分别为(10+5)/2=7.5(40+65)/2=52.5它们属于哪一组?2.5.3编制变量数列的步骤(1)单项数列的编制一般的步骤是: 将原始资料按变量值(标志值)大小的顺序排列; 将变量值分为若干组(一个
20、变量值为一组,重复者只取一个); 找出每组变量值出现的次数; 按变量值的大小顺序排列编制出单项数列例:家庭成员个数户数占总户数的百分比%1102.4222053.7314535.44307.3551.2合计410100某住宅小区户人口情况(2)组距数列的编制 将原始资料按变量值大小的顺序重新排列; 计算全距:R=最大变量值最小变量值; 确定组数:可采用斯特基斯公式 K1+3.3221LgN,取整。(N为单位个数) 确定组距:可以编制等距变量数列,采用斯特基斯确定组距公式; 确定组限; 若为连续变量,并确定编制等距数列,应采用重叠式组限;。 计算次数和频率,编制成组距数列(见教材表2-6)。利用
21、Excel中“FREQENCY”函数编制组距数列FREQUENCY函数的格式为:=FREQUENCY(ARRAY,BINS) 其中ARRAY是指原始资料的存放区域,BINS是指统计分组的组上限构成的数值序列。 在使用FREQUENCY函数之前需要做细致分析,了解数据的性质,还要计算一些基础数据,如全距、组数、组距和各个组上限。例题 江浦县苗圃对110株树苗的高度进行测量(单位:厘米)数据如下,要求编制次数分布表。Excel解决方案 输入原始资料 计算基础数据(全距、组距、组数) 输入分组标志;列出各组的上限 用鼠标选定函数返回值存放的区域 输入函数“FREQUENCY(A2:A111, F2:
22、F9)” 同时按下组合键“Ctrl+Shift+Enter”,计算机会将统计出的次数放在G2:G9中编制组距数列和次数分配表次数分配表树苗高度/cm树苗数/次数频率/%累计次数/颗累计频率/%向上累计向下累计向上累计向下累计80-9098.2 91108.2 10090-1001210.9 2110119.1 91.8 100-1102724.5 488943.6 80.9 110-1202623.6 746267.3 56.4 120-1301816.4 923683.6 32.7 130-1401110.0 1031893.6 16.4 140-15065.5 109799.1 6.4 1
23、50-16010.9 11011000.9 合计110100 _2.6 统计表、统计图统计表的概念 统计表是把通过整理的由统计调查所得来的原始资料,使其成为得以说明社会现象及其发展过程的数据,并按一定顺序排列在表格中而形成的。特点:翔实;丰富2. 统计表的结构(1)从外形上看由标题、横标目、纵标目、数字资料四部分组成。标题(总标题):表的名称,扼要地说明表的内容,一般写在表的上端中央。横标目:横行标题,说明横行指标内容的标题,一般写在表左方。纵标目:纵栏标题,说明纵栏指标内容的标题,一般写在表上方。数字资料:用来说明总体特征的各种综合指标。(2)从内容上看统计表包括主词和宾词两部分。主词:是统
24、计表所要说明的对象,也就是被研究的总体、总体各组和总体单位的名称,或者是排列的时期,通常列在表的左方。即横行标题。宾词:是用来说明主词的各个指标,通常列在表的上方。统计表上的宾词是用来说明主词的。在设计统计表时,主词和宾词部位可以互相调换。即纵栏标题。 3.统计表的种类 (1)简单表,是指主词未经任何分组的统计表,也叫做一览表。简单表的主词一般按时间顺序排列,或者按个体的名称排列。它是对原始资料进行初步整理所采用的形式,如表2-9。(2)分组表,是指主词只用一个标志分组形成的统计表。运用分组表可以说明不同类型现象的特征,以揭示现象内部的结构,以便分析现象之间的相互关系,如表2-11所示。(3)
25、复合表,是指主词按两个或两个以上标志进行分组的统计表。复合分组表可以通过更多的标志,对总体进行更深入地分析与研究,如表2-12所示。4 .宾词指标的设计宾词指标的设计分为简单设计和复合设计宾词的简单设计:是将指标作平行配置。宾词的复合设计:是将指标作层叠的配置。5.统计图统计图的概念统计图是统计资料的一种表达方式,它可以简洁直观地表示统计表中枯燥的数据,可以帮助我们从众多的数据中发现规律,可以更迅速、更有效地传递信息,给人以明确而深刻的印象。2. 统计图的结构(1)标题,统计图一般包括图标题、数值轴(X、Y)标题(2)坐标轴和网格线,坐标轴和网格线构造了绘图区的骨架,借助坐标轴和网格线,可以更
26、容易读懂统计图。(3)绘图区,统计图绘制在绘图区内。(4)图例,图例用来标明图表中的数据系列。(5)图线,统计数据的图形描述Excel提供的14种标准图表类型 2005年实际轮入-早籼稻实际轮出-早籼稻1月225316182月5710343月29519914月21456025月154310776月1177147月7651778月21599219月1344134410月11301130小测验一、填空题1、普查通常是_或周期性的。2、统计报表是_或连续性调查。3、随机抽样调查是从调查对象的总体中_抽取一部分单位作为样本进行调查。4、统计表的构成要素包括:总标题、横行标题、纵行标题、_四个部分。5、
27、统计调查误差包括登记误差和代表性误差。其中_是非全面调查所固有的。二、判断题1、单项数列分组通常只适用于离散变量且变量值较少的情况。( )2 、在对连续变量进行统计次数时,一般应遵循“上组限不在内”的原则。( )3 、在统计调查中,调查单位和填报单位两者一致。( )4 、在全距(变量的最大最小值之差)一定的条件下,组数越多,组距越大。( ) 5 、对离散变量进行统计分组,既可用单项分组,也可用组距分组。( )6 、单项数列一定是离散变量数列,而离散变量数列可以是单项数列,也可以是组距数列。( )7 、组距数列只能用来表示连续变量数列,不能表示离散变量数列。( )8、以下调查方式均存在登记误差:统计报表制度、普查、重点调查、抽样调查。 ( )小测验单项数列组距数列连续型
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 淮阴师范学院《统计预测和决策》2023-2024学年第一学期期末试卷
- 淮阴师范学院《化工综合实验》2021-2022学年第一学期期末试卷
- 淮阴工学院《中国文化通论》2023-2024学年第一学期期末试卷
- DB4403T454-2024建设项目环境影响回顾性评价技术指引
- 电力仪表的智能电网技术应用考核试卷
- 天然气防火防爆基础知识考核试卷
- 化学纤维的绿色抗菌处理技术考核试卷
- 卫生材料在特殊环境下的应用考核试卷
- 建筑拆除现场的工程安全监控与建设协调考核试卷
- 家庭清洁小窍门快速去除咖啡渍考核试卷
- DL-T5142-2012火力发电厂除灰设计技术规程
- 江苏省南京市鼓楼区+2023-2024学年九年级上学期期中物理试题(有答案)
- 老年友善医院创建汇报
- 科学素养培育及提升-知到答案、智慧树答案
- 消防设施操作员报名工作证明(操作员)
- 市政道路施工工程重难点分析及对策
- 素描教案之素描基础
- 2024-2030年中国丝苗米行业发展趋势及发展前景研究报告
- JTJ034-2000 公路路面基层施工技术规范
- 《现代控制理论》课程教学大纲
- 《娱乐场所管理条例》课件
评论
0/150
提交评论