大学统计学 第2章 统计数据的搜集、整理与显示_第1页
大学统计学 第2章 统计数据的搜集、整理与显示_第2页
大学统计学 第2章 统计数据的搜集、整理与显示_第3页
大学统计学 第2章 统计数据的搜集、整理与显示_第4页
大学统计学 第2章 统计数据的搜集、整理与显示_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计学统计学xxx xxx 主讲主讲2第二章第二章 统计数据的搜集、整理与显示统计数据的搜集、整理与显示 n第一节第一节 统计数据的搜集统计数据的搜集n第二节第二节 统计数据的整理统计数据的整理 n第三节第三节 统计数据的显示统计数据的显示 3第一节第一节 统计数据的搜集统计数据的搜集 一、一、统计数据的搜集方法统计数据的搜集方法1. 1. 统计数据搜集的概念统计数据搜集的概念n根据统计研究预定的目的和任务,运用科学的方法与根据统计研究预定的目的和任务,运用科学的方法与手段,有计划、有组织地向客观实际采集数据的过程手段,有计划、有组织地向客观实际采集数据的过程2. 2. 统计数据来源:统计数据

2、来源:n原始资料(第一手资料);次级资料(第二手资料)原始资料(第一手资料);次级资料(第二手资料)3. 3. 统计数据的分类统计数据的分类n按其性质不同分为调查数据和试验数据按其性质不同分为调查数据和试验数据 4. 4. 统计数据的搜集方法统计数据的搜集方法n对搜集原始资料而言,常用的方法有:对搜集原始资料而言,常用的方法有:n直接观察法、报告法(通讯法)、采访法、实验调查直接观察法、报告法(通讯法)、采访法、实验调查设计等。设计等。4二、二、 统计调查组织形式统计调查组织形式1 1普查普查 2 2抽样调查抽样调查 3 3重点调查重点调查 4 4典型调查典型调查5 5统计报表制度统计报表制度

3、 51.1.普查普查n普查普查:是专门组织的一种全面调查,它主要是用以:是专门组织的一种全面调查,它主要是用以搜集某些不能或不宜用定期报表搜集的统计资料。搜集某些不能或不宜用定期报表搜集的统计资料。对国情国力的调查一般采用普查。对国情国力的调查一般采用普查。n普查的特点普查的特点: 一是一种非经常性的全面调查;一是一种非经常性的全面调查;二比任何一种调查形式更能掌握大量、详细、二比任何一种调查形式更能掌握大量、详细、 全面的统计资料。全面的统计资料。 6n第一次第一次5353年年n目的:为全国人大及地方人大的选举做好选民登记工作;为国家的经济、目的:为全国人大及地方人大的选举做好选民登记工作;

4、为国家的经济、社会发展提供准确的人口数字。社会发展提供准确的人口数字。n项目:六项(与户主的关系,姓名,性别,年龄,民族,本户住址)项目:六项(与户主的关系,姓名,性别,年龄,民族,本户住址)n第二次第二次6464年年n目的:为编制国民经济建设的第三个五年计划和长远规划提供依据。目的:为编制国民经济建设的第三个五年计划和长远规划提供依据。n项目:九项(增加三项,文化程度,本人成份,职业,但后两项只登记项目:九项(增加三项,文化程度,本人成份,职业,但后两项只登记不统计)不统计)n第三次第三次8282年年n目的:为进行社会主义现代化建设,统筹安排人民的物质和文化生活,目的:为进行社会主义现代化建

5、设,统筹安排人民的物质和文化生活,制定人口政策和规划,提供人口资料。制定人口政策和规划,提供人口资料。n项目:项目:1919项(又增加了常住人口的户口登记状况,在业人口项(又增加了常住人口的户口登记状况,在业人口 的行业,职的行业,职业和不在业人口状况,婚姻状况,生育子女数,存活子女数等。业和不在业人口状况,婚姻状况,生育子女数,存活子女数等。n第四次第四次9090年年n目的:为准备查清我国人口在数量、地区分布、结构和素质方面的变化;目的:为准备查清我国人口在数量、地区分布、结构和素质方面的变化;为国家进一步实行改革开放,科学地制定国民经济和社会发展战略与规为国家进一步实行改革开放,科学地制定

6、国民经济和社会发展战略与规划,统筹安排人民的物质和文化生活,检查人口政策的执行情况,提供划,统筹安排人民的物质和文化生活,检查人口政策的执行情况,提供可靠的资料。可靠的资料。n项目:二十一项(又增加常住地状况,迁移原因)项目:二十一项(又增加常住地状况,迁移原因)7n第五次第五次20002000年年n目的:为查清十年来我国人口在数量、结构、分布和目的:为查清十年来我国人口在数量、结构、分布和居住环境等方面的变化情况,全面检查居住环境等方面的变化情况,全面检查“九五九五”计划计划的执行情况,为科学地制定国民经济和社会发展的执行情况,为科学地制定国民经济和社会发展“十十五五”计划以及年远景规划提供

7、可靠的依据,计划以及年远景规划提供可靠的依据,统筹安排人民的物质和文化生活,实现可持续发展战统筹安排人民的物质和文化生活,实现可持续发展战略。略。n项目:项目: 4949项,其中:按人填报项目为项,其中:按人填报项目为2626项,即姓名、项,即姓名、与户主关系、年龄、民族、户口登记状况、户口性质、与户主关系、年龄、民族、户口登记状况、户口性质、出生地、何时来本乡镇街道居住、从何地来本乡镇街出生地、何时来本乡镇街道居住、从何地来本乡镇街道居住、迁出地类型、迁移原因、道居住、迁出地类型、迁移原因、5 5岁及以上的人五年岁及以上的人五年前常住地、前常住地、6 6岁及以上的人填:是否识字、受教育程度、

8、岁及以上的人填:是否识字、受教育程度、学业完成情况、学业完成情况、1515岁及以上的人填:是否有工作、工岁及以上的人填:是否有工作、工作时间、行业、职业、未工作情况、未工作者主要生作时间、行业、职业、未工作情况、未工作者主要生活来源、婚姻状况、初婚年月、活来源、婚姻状况、初婚年月、15-5015-50岁妇女填:生育岁妇女填:生育子女数、子女数、1999.11.1-2000.10.311999.11.1-2000.10.31生育状况;按户填报生育状况;按户填报的有的有2323项,即户编号、户别、本户普查登记人数、本项,即户编号、户别、本户普查登记人数、本户户籍人口中外出不满半年人数、本户户籍人口

9、中外户户籍人口中外出不满半年人数、本户户籍人口中外出半年以上人数等出半年以上人数等8n中国的人口总量中国的人口总量 n大陆大陆2000年第五次人口普查结果现有人口数的年第五次人口普查结果现有人口数的126583万;万;n 香港特别行政区政府于香港特别行政区政府于2000年年6月月30日公布的香日公布的香港现有人口数为港现有人口数为678万;万; n 澳门特别行政区政府于澳门特别行政区政府于2000年年9月月30日公布的澳日公布的澳门现有人口数为门现有人口数为44万;万; n 台湾当局于台湾当局于2000年年12月公布的中国台湾省和金门、月公布的中国台湾省和金门、马祖等岛屿的人口数为马祖等岛屿的

10、人口数为2228万;万; n所以,所以,2000年年底中国的人口总量应是年年底中国的人口总量应是129533万万人。人。n性别构成性别构成 n中国当前的人口性别比为中国当前的人口性别比为106.74,男性占总人口,男性占总人口的的51.63%;女性占总人口的;女性占总人口的48.37%。92抽样调查抽样调查 n抽样调查:是按随机原则从调查对象中抽取一部分抽样调查:是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据样本数据去推算单位作为样本进行观察,然后根据样本数据去推算调查对象的总体特征。调查对象的总体特征。 n概率抽样的特点:概率抽样的特点:一样本单位按随机原则抽取,排除了主观

11、因素对一样本单位按随机原则抽取,排除了主观因素对选样的影响。选样的影响。二根据部分调查的实际资料对调查对象总体的数二根据部分调查的实际资料对调查对象总体的数量特征作出估计。量特征作出估计。三抽样误差可以事先计算并加以控制。三抽样误差可以事先计算并加以控制。n抽样调查的适用场合:抽样调查的适用场合: 一不可能或不必要进行全面调查的社会现象,一不可能或不必要进行全面调查的社会现象,二对普查资料进行必要的修正。二对普查资料进行必要的修正。 103重点调查重点调查 n重点调查:在调查对象中,只选择一部分重重点调查:在调查对象中,只选择一部分重点单位进行的非全面调查。点单位进行的非全面调查。n重点单位:

12、它们在所研究现象的标志总量中重点单位:它们在所研究现象的标志总量中却占有绝大的比重,在总体中具有举足轻重却占有绝大的比重,在总体中具有举足轻重的作用。的作用。n特点:可以了解较详细的情况,但无法对现特点:可以了解较详细的情况,但无法对现象总体的数量特征作出准确的推算,也无法象总体的数量特征作出准确的推算,也无法测算调查误差。测算调查误差。n适用场合适用场合 :当调查任务只要求掌握基本情况,:当调查任务只要求掌握基本情况,而部分单位又能比较集中地反映研究的项目,而部分单位又能比较集中地反映研究的项目,宜采用重点调查。宜采用重点调查。114典型调查典型调查n1 1)定义:是根据调查目的,在对总体进

13、行全面)定义:是根据调查目的,在对总体进行全面分析的基础上,从中有意识地选择具有代表性分析的基础上,从中有意识地选择具有代表性的若干单位进行调查。的若干单位进行调查。n2 2)目的:进行深入细致的研究,以掌握有关现)目的:进行深入细致的研究,以掌握有关现象的具体情况。象的具体情况。n3 3)典型调查的关键是选择典型单位)典型调查的关键是选择典型单位n二种方式:二种方式:na a、划类选典式、划类选典式nb b、解剖麻雀式、解剖麻雀式n特点:特点:n由点到面,个别到一般;机动灵活,省时省力,由点到面,个别到一般;机动灵活,省时省力,提高调查效率;是一种深入细致的调查方式;提高调查效率;是一种深入

14、细致的调查方式;可以研究新生事物。可以研究新生事物。125统计报表制度统计报表制度 n统计报表制度:依照国家有关法规,自上而下地统统计报表制度:依照国家有关法规,自上而下地统一布置,以一定的原始记录为依据,按照统一的表一布置,以一定的原始记录为依据,按照统一的表式,统一的指标项目,统一的报送时间和报送程序,式,统一的指标项目,统一的报送时间和报送程序,自下而上地逐级地定期提供统计资料的一种调查方自下而上地逐级地定期提供统计资料的一种调查方式。式。 n统计报表的主要特点:统计报表的主要特点:一一报表资料的来源是建立在报表资料的来源是建立在各个基层单位的原始各个基层单位的原始记记的基的基础上;础上

15、;二由于统计报表是逐级上报和汇总的,各级领导二由于统计报表是逐级上报和汇总的,各级领导部门能获得管辖范围内的报表资料;部门能获得管辖范围内的报表资料;三是一种经常性的(连续性)调查,调查项目相三是一种经常性的(连续性)调查,调查项目相对稳定,有利于积累资料,并进行动态对比分析。对稳定,有利于积累资料,并进行动态对比分析。13 统计调查形式示意图统计调查形式示意图普普 查查全面报表全面报表抽样调查抽样调查重点调查重点调查典型调查典型调查周期性调查周期性调查一次性调查一次性调查普普 查查抽样调查抽样调查重点调查重点调查典型调查典型调查全面调查全面调查非全面调查非全面调查连续连续(经常性经常性)调查

16、调查不连续调查不连续调查定期报表定期报表专门调查专门调查调 查调 查范范 围围调 查调 查时时 间间组 织组 织形形 式式统统计计调调查查形形式式14三、统计调查体系三、统计调查体系 n统计调查体系:统计调查体系:一个国家开展统计调查方法和制一个国家开展统计调查方法和制度的总称。度的总称。 n我国的统计调查体系:我国的统计调查体系: 建立以必要的周期性的普查为建立以必要的周期性的普查为基础基础,经常性的,经常性的抽样调查为抽样调查为主体主体,同时辅之以重点调查、科学推算,同时辅之以重点调查、科学推算和部分全面报表综合运用的统计调查方法体系。和部分全面报表综合运用的统计调查方法体系。15四、统计

17、调查方案的设计四、统计调查方案的设计 一明确调查目的。一明确调查目的。 二确定调查对象和调查单位。二确定调查对象和调查单位。n调查对象,是指需要调查的现象总体调查对象,是指需要调查的现象总体。n调查单位,是指所要调查的具体单位调查单位,是指所要调查的具体单位。n报告单位亦称填报单位,它是负责向上报告调查报告单位亦称填报单位,它是负责向上报告调查内容、提交统计资料的单位。报告单位一般是在内容、提交统计资料的单位。报告单位一般是在行政上、经济上具有一定独立性的单位。行政上、经济上具有一定独立性的单位。 三设计调查项目。三设计调查项目。 四设计调查表格和问卷四设计调查表格和问卷16五确定调查时间。五

18、确定调查时间。n调查时间调查时间是指调查资料所属的时间,在统计调是指调查资料所属的时间,在统计调查中,如果所调查的是时期现象,就要明确规查中,如果所调查的是时期现象,就要明确规定调查资料所反映的起止日期。如果所要调查定调查资料所反映的起止日期。如果所要调查的是时点现象,调查时间就是规定的统一标准的是时点现象,调查时间就是规定的统一标准时点。时点。n调查期限调查期限是进行调查工作的时限,包括搜集资是进行调查工作的时限,包括搜集资料和报送资料的工作所需的时间。料和报送资料的工作所需的时间。 六组织实施调查计划。六组织实施调查计划。 七调查报告的撰写。七调查报告的撰写。17五、二手资料的主要来源渠道

19、五、二手资料的主要来源渠道1统计年鉴统计年鉴2有关期刊有关期刊3有关网站有关网站:http:/ http:/ 统计数据的整理统计数据的整理 一、数据整理概述一、数据整理概述 n1 1数据整理的含义:数据整理的含义:n对统计调查所搜集到的各种数据进行分类和汇总,对统计调查所搜集到的各种数据进行分类和汇总,又称为汇总性整理。又称为汇总性整理。n2 2统计数据整理的内容:统计数据整理的内容:n(1 1)如何对所要研究的总体进行统计分组;)如何对所要研究的总体进行统计分组;n(2 2)确定描述总体数量特征的统计指标体系。)确定描述总体数量特征的统计指标体系。19二、统计分组基本理论二、统计分组基本理论

20、 1.1.统计分组的概念统计分组的概念根据统计研究的目的和客观现象的内在特点,按某个标志根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。的组,称为统计分组。2.2.分组的性质分组的性质n兼有分和合双重含义兼有分和合双重含义, ,对于现象总体,是对于现象总体,是“分分”,对于单,对于单位,是位,是“合合”。3.3.统计分组的目的:组内同质性,组间差异性统计分组的目的:组内同质性,组间差异性4.4.统计分组的种类统计分组的种类n(1 1)按分组标志的多少,分为简单分组和复合分组)按

21、分组标志的多少,分为简单分组和复合分组n(2 2)按分组的标志的性质不同,分为品质分组(或称属)按分组的标志的性质不同,分为品质分组(或称属 性分组)和数量分组(或称变量分组)。性分组)和数量分组(或称变量分组)。20三、统计分组的原则和方法三、统计分组的原则和方法 1 1统计分组的原则:统计分组的原则:穷尽原则、互斥原则穷尽原则、互斥原则2 2统计分组的方法统计分组的方法 (1 1)品质分组:按品质标志分组)品质分组:按品质标志分组 (2 2)数量分组:按数量标志分组)数量分组:按数量标志分组(a a)单项式分组与组距式分组)单项式分组与组距式分组(b b)间断组距式分组和连续组距式分组)间

22、断组距式分组和连续组距式分组“上限不在内上限不在内”原则原则(c c)等距分组与异距分组)等距分组与异距分组213组距式分组的相关概念(1 1)组距)组距n连续组距分组的组距连续组距分组的组距= =本组上限本组上限本组下限本组下限 n间断式组距且等距分组的条件下:间断式组距且等距分组的条件下: 组距组距=本组上限本组上限前组上限前组上限 或或= =本组下限本组下限前组下限前组下限 或或= =本组上限本组上限本组下限本组下限+1+1(2 2)组数)组数(3 3)(4 4)开口组的组距与组中值)开口组的组距与组中值2上限下限组中值22四、频数分布四、频数分布1频数分布的基本理论频数分布的基本理论(

23、1)频数分布的定义)频数分布的定义(2)分布数列的两个要素)分布数列的两个要素n总体按某标志所分的组,若总体按数量标志分组,总体按某标志所分的组,若总体按数量标志分组,分组标志在各组有不同的数量表现,形成标志值分组标志在各组有不同的数量表现,形成标志值数列,亦称变量,一般用数列,亦称变量,一般用x 表示;表示;n各组所出现的单位数,即频数,亦称次数,用各组所出现的单位数,即频数,亦称次数,用f 表示。表示。23 (3 3)相关的概念:相关的概念: 频率频率 fi :第:第i组频数组频数 频率的性质频率的性质 (a a) ; (b b) 。 频数密度与频率密度:频数密度与频率密度: (a a)频

24、数密度)频数密度= =频数频数/ /组距组距 (b b)频率密度)频率密度= =频率频率/ /组距组距iiff频率01iiff1iiff24n例:某班36名同学统计学考试成绩如下:n56,79,86,56,80,86,86,80,64,65,81,87,87,82,67,68,83,88,90,84,71,73,84,92,74,85,92,93,85,76,76,85,94,79,97,86。试编制变量数列。2变量数列的编制方法25n解:解:1)排队:)排队:n 2)求全距)求全距r=9756=41n 3)确定组数:)确定组数:nm取整为取整为6。n 4)求组距:)求组距:nh取整为取整为1

25、0(实际情况是分数的档次是(实际情况是分数的档次是10分)分)n5)确定上、下限和次数:)确定上、下限和次数:13. 636lg3 . 31lg3 . 31nm83.6641mrh2627n例:某班组例:某班组40名工人日产量资料如下:名工人日产量资料如下:n54,85,83,79,78,92,80,95,62,68,72,83,85,64,73,60,84,108,81,78,99,74,81,70,77,66,71,83,75,34,78,83,88,86,83,74,89,68,74,87。n试编制变量数列。试编制变量数列。28n1)排队:)排队: 2)求全距)求全距r=10834=74

26、n3)确定组数:)确定组数: m取整为取整为7n4)求组距:)求组距: nh取整为取整为10n5)确定组限及次数(最终结果)确定组限及次数(最终结果)32. 640lg3 . 31lg3 . 31nm5710774. mrh29合并成一组60以下, 次数为2 可合并也可不合并, 视具体情况定,若合并,则为90以上, 次数为4 30n(最终结果)(最终结果)日产量(件)日产量(件)人数(人)人数(人)f f6060以下以下 6060707070708080808090909090100100100100以上以上2 26 6131315153 31 1合计合计40403132333435书上书上p

27、31案例案例36五、累计频数与累计频率五、累计频数与累计频率n1向上累计频数(或频率)分布向上累计频数(或频率)分布n2向下累计频数(或频率)分布向下累计频数(或频率)分布37日产量(件)日产量(件)人数(人)人数(人)f f向上累向上累计计向下累向下累计计6060以下以下 2 22 24040606070 70 6 68 83838707080 80 131321213232808090 90 1515363619199090100 100 3 339394 4100100以上以上1 140401 1合计合计404038 第三节第三节 统计数据的显示统计数据的显示一、统计表一、统计表1 1统计表的定义和结构统计表的定义和结构 (1 1)统计表的定义)统计表的定义 (2 2)统计表的结构)统计表的结构 (a a)从表式上看,表格包括总标题、横行标从表式上看,表格包括总标题、横行标题、纵栏标题和指标数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论