版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一节统计调查方案第二节统计调查的组织形式第三节统计分组第四节分配数列第五节统计表主要内容第二章统计调查与整理1第二章统计调查与整理第一节统计调查方案统计调查的意义和要求统计调查方案设计2第二章统计调查与整理一、统计调查的意义和要求统计调查的定义
统计调查是按照统计任务的要求,运用科学的调查方法,有组织地向社会实际搜集各项原始资料的过程。统计调查的意义社会调查是人们认识社会的基本方式统计调查是统计工作中的基础环节统计调查理论和方法在统计学原理中占有重要地位3第二章统计调查与整理
原始数据的来源
调查观测实验
次级数据的来源
统计年鉴有关期刊相关网站4第二章统计调查与整理统计调查的要求准确性统计数据采集、核算、传递的真实性,是统计数据质量的生命之本(基础)。及时性统计资料应当及时满足领导需要和及时完成各项调查资料的上报任务,是统计数据质量的活力之源。统计数据公布的及时性受多种因素制约,如资料整理和计算手续的繁简、数据公布的形式等。完整性在规定时间内对调查资料毫无遗漏地搜集起来。5第二章统计调查与整理
1994年末,墨西哥发生了严重的金融危机,导致国际金融市场剧烈动荡。IMF由于没有掌握墨西哥经济金融的统计数据,错误地判断墨西哥经济状况良好。金融危机爆发后,IMF不知所措,直到危机持续一个多月后才制定出援助计划和墨西哥经济调整方案。1997年金融危机波及到其他亚洲国家,给亚洲经济乃至世界经济造成重创。
IMF认为,经济缺乏透明度是新兴市场经济国家发生金融危机的重要原因,稳健、透明的宏观经济政策和全面、及时的经济、金融数据是降低金融风险的根本保证。为督促各成员国普遍改进数据质量,提高数据透明度,IMF加速制定了数据公布通用系统——GDDS(GeneralDataDisseminationSystem)。GDDS:告诉世界一个透明的中国6第二章统计调查与整理2002年,美国《商业周刊》对中国最大的家电厂家海尔集团财务状况提出质疑,海尔的神秘令投资者在逻辑上怀疑它的不稳定。海尔称对价格战没有兴趣,但它生产的“迷你冰箱”却清晰地指向低端市场。海尔以700万美元并购的意大利冰箱厂,根本不能生产出物美价廉的产品。海尔在国际上的现金流一定是负数,他们必须从中国公司抽调资金,但会损耗市场份额。同时,里昂信贷证券亚洲基地对亚洲上市公司的管理水平和透明度做出评判的结果是,包括中联通、中移动、中石化在内的一批中国企业名列榜尾。美国《商业周刊》质疑海尔7第二章统计调查与整理二、统计调查方案设计
在实施统计调查之前,调查者首先要制定科学的调查方案,调查方案主要包括下列六项内容:确定调查目的确定调查对象和调查单位确定调查项目确定调查时间和调查期限制定调查的组织实施计划选择调查方法8第二章统计调查与整理
(一)确定调查目的就是明确为什么要进行调查,调查要解决什么问题?例:2000年全国人口普查的目的:“为了科学地制定国民经济和社会发展战略与规划,制定人口政策,统筹安排人民的物质和文化生活,实现人口与资源、环境的协调发展。”
(二)确定调查对象和调查单位:主要是解决向谁调查,由谁来具体提供资料的问题。调查对象:就是我们需要进行研究的总体范围,即调查总体。例:2000年人口普查规定:“人口普查对象是具有中华人民共和国国籍并在中华人民共和国境内常住的人”。9第二章统计调查与整理调查单位调查单位:是构成调查对象的每一个单位,即总体单位。需要进行登记的标志(项目)的承担者。说明谁来提供资料的问题。举例:人口普查中上述总体中的每个人。填报单位(报告单位):是指负责向上级汇报调查内容、提交统计资料的单位。二者的关系:填报单位一般在行政上、经济上具有一定独立性的单位,而调查单位可以是人、单位、也可以是物。两者有时一致,有时不一致。如:工业企业普查,每个工业企业既是调查单位又是填报单位。10第二章统计调查与整理
(三)确定调查项目(调查方案设计的核心)
调查项目就是所要调查的具体内容,调查项目所要解决的问题是向被调查者调查什么,也就是须被调查者回答什么问题。列出调查项目的表格形式就是调查表,也即调查问卷。设计调查问卷应当注意的问题:调查问卷的结构:封面信、指导语、问题、答案(问卷的主体)、编码等。编码:即赋予每一个问题及其答案一个数字作为它的代码。这是为了将被调查者的回答转换成数字,以便输入计算机进行处理和定量分析。11第二章统计调查与整理提问问题的格式非限定回答式:给出一个问题让回答者自由回答限定回答式填空式:在问题后面划一条横线。二项式或是否式:即问题可供选择的答案只有两个,被调查者只能填其中一个答案。多项式:问题可供选择的答案在两个以上,回答者根据问卷要求可单选或多选。矩阵式:把两个或两个以上的问题集中起来,用一个矩阵来表示。直线式:直线式一般适用于主观态度方面的问题。序列式:要求被调查者对所给出的全部答案做出反应,并区分出重要程度。12第二章统计调查与整理问卷的注意事项问题的选择:所选问题一定是能获得真正需要的数据,且能得获得可靠信息的问题。否则,应从问卷中剔除。问题的表述:用词确切、通俗;语句简短、完整。
满足6w准则
Who(谁),When(何时),Where(何处),What(什么),Why(为什么),How(如何)。答案的设置:应遵循穷尽原则和互斥原则,即所列选项要包括对问题的所有可能的回答,且不同选项之间互不重叠、互不包容。题量的控制:力争问题无遗漏但不贪多,一般情况:甄别部分1~3题,主题部分10~15题,背景部分3~5题,答卷时间一般控制在10~20分钟内。问卷的修改:设计好的问卷一定要通过小规模的访谈进行预测试,发现问题及时修改。13第二章统计调查与整理量表(scales):用来测量人们的态度、看法、意见、性格等内容的一种量化工具。总加量表(SummatedRatingScales):也称做总和量表或总合评量,它由一组反映人们对事物的态度或看法的陈述构成,根据回答者同意或不同意计分,将回答者在全部陈述上的得分加起来,就得到了该回答者对这一事物的态度得分。得分的高低就代表了回答者个人在态度量表上的位置。李克特量表(Likertscale):是总加量表的一种特定形式。它是由美国社会心理学家李克特于1932年在原有的总加量表基础上改进而成的。该量表也由一组对某事物的态度或看法的陈述组成,回答者对这些陈述的回答分成:“非常同意”、“同意”、“中立”、“不同意”、“非常不同意”五类,分别记1~5分。由于答案类型的增多,人们在态度上的差别就能更清楚地反映出来。14第二章统计调查与整理
(四)确定调查时间和调查期限调查时间调查时间就是指调查资料所属的时点或时期。时期现象:明确规定资料所反映的调查对象从何年月日至何年月日止的资料时点现象:规定统一的标准时间。例如2000年第五次人口普查的标准时间是11月1日0时。调查期限
调查期限是指进行调查工作的时间,包括搜集资料和报送资料的整个工作所需要的时间。15第二章统计调查与整理
(五)制定调查的组织实施计划
调查工作的组织计划包括调查机构、调查步骤、人员及组织训练、经费等问题。
(六)选择调查方法
统计调查方法是指搜集调查对象原始资料的方法。直接观察法:由调查人员到现场对被调查对象进行直接点数和计量。报告法:报告单位利用原始记录和核算资料作基础,向有关单位提供统计资料。采访法:又可分为询问法和通讯法。网上调查法:利用现代信息网络来收集统计资料的方法。16第二章统计调查与整理统计调查的方法
访问调查
邮寄调查
电话调查
CATI调查
网络调查
17第二章统计调查与整理访问调查又称派员调查,是调查者与被调查者通过面对面交谈从而得到所需资料的调查方法。适用场合:社会调查和市场调查
访问调查
邮寄调查是通过邮寄、宣传媒体和专门场所等将调查表或问卷送至被调查者手中,由被调查者填写,然后将调查表寄回或投放到收集点的一种调查方法。适用场合:统计部门进行的统计报表调查市场调查机构进行的问卷调查
邮寄调查
18第二章统计调查与整理电话调查是调查人员利用电话同受访者进行语言交流,从而获得信息的一种调查方法。适用场合:样本单位十分分散的情况电脑辅助电话调查就是在电话调查时,调查的问卷、答案都由计算机显示,整个调查过程,包括电话拨号、调查记录、数据处理等也都借助于计算机来完成的一种调查方法。适用场合:发达国家和地区
电话调查
CATI调查
19第二章统计调查与整理网上调查:是调查人员利用互联网与被调查者进行交流,从而获得信息的一种调查方法,具有传统调查方法无法比拟的优越性。特点:及时性和共享性、便捷性和低费用性、交互性和充分性、可靠性和客观性、无时空和地域限制
网络调查
20第二章统计调查与整理网上直接调查的途经和方法:1、将调查表或问卷放置在网站点上,等待访问者访问时填写问卷;2、通过E-mail方式将问卷发送给被调查者,被调查者完成后将结果通过E-mail返回。网上间接调查的渠道和方法:主要有www、Usernet、News、BBs、E-mail通过搜索引擎搜索有关站点的网址,然后访问所想查找信息的网站或网页。返回21第二章统计调查与整理北京市“保姆荒”现状调研承德市健身娱乐市场现状调查及发展对策研究城市旅游居民对传统节事的感知及态度大学生旅游市场调查研究户外漂流游客体验的实证研究高职旅游管理专业毕业生就业情况调查与分析兰州市大学生“手机依赖”状况调查报告中国网上购物成功因素实证研究消费者对餐饮营养信息标注态度及理解的调查研究酒店实习生工作满意度调查问卷调查参考题目22第二章统计调查与整理范例:消费者对餐饮营养信息标注态度及理解的调查研究
据2002年全国营养与健康调查的结果,我国有外出就餐频率提高和慢性疾病患病率增加的趋势,如何帮助消费者改善外餐时的食物选择具有重要的社会意义。本调查的主要目标是研究消费者对餐馆菜单上标注营养信息的认识和态度,以便为政府和行业制定相关政策法规提供参考信息。为确保消费者心理状态的稳定性和一致性,调查对象全部选择在餐馆就餐完毕的消费者。调查时间为2008年7~8月,调查地点为北京市海淀区和朝阳区部分中式餐馆。采用自行设计的问卷,请调查对象当场填答并回收。共发放问卷1100份,回收有效问卷1004份,回收率为91.3%。问卷分为两部分,其中第一部分内容为个人基本情况,第二部分包括餐馆营养信息标注的态度调查和给出营养信息标注菜单后被调查者的点菜选择调查。23第二章统计调查与整理第二节统计调查的组织形式按调查对象包括的范围分类按调查的组织形式分类按登记事物的连续性分类各类统计调查的特点24第二章统计调查与整理统计调查的方式
普查
抽样调查
重点调查
典型调查
统计报表制度
25第二章统计调查与整理概念:是为某一特定目的而专门组织的一次性全面调查方式。目的:为了收集有关国情国力的基本统计数据为国家制定有关政策或措施提供依据特点:是一次性或周期性的需要规定统一的标准时间普查数据全面、系统、准确、可靠适用面比较窄
普查
26第二章统计调查与整理我国的普查类型和周期性人口普查每十年进行一次农业普查每十年进行一次经济普查每十年进行两次末尾为“0”的年份进行人口普查末尾为“6”的年份进行农业普查末尾为“3”和“8”的年份进行经济普查经济普查:包括工业普查、第三产业普查、基本单位普查以及建筑业普查27第二章统计调查与整理概念:抽样调查也是一种非全面调查,它是在全部调查单位中按照随机原则抽取一部分单位进行调查,根据调查的结果推断总体的一种调查方法。是为某一特定目的而专门组织的一种非全面调查类型:概率型抽样和非概率型抽样目的:概率型抽样主要是为了推断总体的数量特征非概率型抽样主要是为了了解总体的基本情况特点:经济性好、时效性强、适用面广、准确性高抽样调查的基本特征(两项)1.按照随机原则抽选单位,排除个人主观意图的影响;2.对一小部分单位做深入细致的调查研究,取得数据,并据此从数量上推算总体。
抽样调查
28第二章统计调查与整理概念:重点调查是在调查对象范围内选择部分重点调查单位(单位数目尽可能少,标志值所占比重尽可能大)搜集统计资料的非全面调查。从全部总体单位中选择少数重点单位进行调查。
是指在所要调查的数量特征上占有很大比重的单位
特点:属于非概率型抽样调查目的:
为了了解总体的基本情况
重点调查
29第二章统计调查与整理概念:典型调查是在调查对象中有意识地选取若干具有典型意义的或有代表性的单位(典型单位)进行非全面调查。
具有所研究问题的本质属性或特征的单位类型:解剖麻雀式和划类选典式特点:属于非概率型抽样调查目的:为了描述或揭示事物的本质或规律
典型调查
30第二章统计调查与整理例:某县根据去年的统计共有24.86万户,15个乡镇,按照各乡镇农民的年纯收入可分为高、中、低三类,各有农户7.10、10.96和6.80万户。现采用典型调查了解农民家庭彩色电视机的拥有量和需求量,拟调查300户,按照划类选典的办法,高、中、低三类农户各调查86、132和82户。通过问卷测试,所得资料如下表:
某县农民家庭彩电需求测算表31第二章统计调查与整理概念:是按照国家有关法规规定,自上而下统一布置,自下而上逐级提供基本统计数据的一种调查方式。目的:收集宏观经济统计资料特点:所收集的数据比较完整准确所收集的数据涵盖国情国力和国家宏观决策方面主要适用于国有企业、事业单位以及国家机关和团体
统计报表制度
32第二章统计调查与整理一、按调查对象包括的范围分类全面调查全面调查是指对构成调查对象总体的所有单位一一进行调查,具体包括普查和全面统计报表。
思考:除了人口普查,还有没有其他方面的普查?非全面调查非全面调查是取被研究对象中的一部分单位进行调查,具体包括抽样调查、重点调查、典型调查以及非全面统计报表。33第二章统计调查与整理典型调查——空置率统计
有报道说社科院城调队从各地“查电表”的数据算出,全国空置房共有6540万套。6540万的说法如今已被“辟谣”,但是疑团仍未明了,谁也弄不清这个有零有整的说法从何而来,是谁造的谣。
6540万套的谜团难以解开,不过空置房究竟有多少,似乎要有眉目了。据国家统计局透露,将利用人口普查的机会,在北京、上海、广州等部分城市进行空置住房方面的调查。权威部门透露,此次调查只是一个“典型调查”而非“抽样调查”。34第二章统计调查与整理非全面调查的必要性①节省人力、物力、财力和时间②有时不需要全面调查只要了解基本情况时——重点调查只要了解典型情况时——典型调查从部分推断总体时——抽样调查③很难或不可能进行全面调查35第二章统计调查与整理二、按调查的组织形式分类统计报表制度:根据统计法规的规定,按一定的表式和要求,自上而下统一部署,自下而上逐级提供统计资料的一种统计调查方法。
A农林牧渔企业报表B工业企业报表
C建筑企业报表D交通运输企业报表
E批发零售贸易及餐饮业企业报表
F服务业企业报表
G行政事业单位报表专门调查:是为了一定目的,研究某些专门问题所组织的一种调查方式。专门调查有普查、重点调查、典型调查、抽样调查等。36第二章统计调查与整理三、按登记事物的连续性分类经常调查
经常调查是指随着调查对象的变化,连续不断地进行调查登记,以了解事物在一定时期内发生、发展的全部过程。这种调查在工业等物质生产活动中应用广泛,如工业产品产量调查、主要原材料、动力、燃料消耗等。一时调查
一时调查是指隔一段较长的时间对事物的变化进行一次调查,用以了解事物在一定时点上的状态,是不连续的调查。如人口可隔一段时间进行一次普查。37第二章统计调查与整理统计调查的种类全面调查非全面调查经常性调查一次性调查专门调查统计报表制度按调查组织方式按调查范围大小按登记事物的连续性38第二章统计调查与整理调查方式小结统计报表制度普查抽样调查重点调查典型调查全面调查非全面调查制度化的经常性调查专门组织的一次性调查返回39第二章统计调查与整理四、各类统计调查的特点40第二章统计调查与整理第三节统计分组统计整理的意义和内容统计分组的意义和作用分组标志的选择41第二章统计调查与整理一、统计整理的意义和内容意义
统计整理是统计工作的第二阶段,它是根据统计研究的任务,对统计调查阶段所搜集到的大量原始资料进行加工汇总,使其系统化、条理化、科学化,以得出反映事物总体综合特征的资料的过程。统计整理是人们对社会经济现象从感性认识到理性认识的过渡阶段,是统计工作中一个十分重要的中间环节,起着承前启后的作用,即既是统计调查阶段的继续和深入,又是统计分析阶段的基础。42第二章统计调查与整理1.原始数据的审核:完整性准确性2.次级数据的审核:完整性准确性
适用性时效性
逻辑检查准确性审核的方法
计算检查
数据的审核
内容:
&对调查来的资料首先要进行审核43第二章统计调查与整理1.将某些不符合要求的数据或有明显错误的数据予以剔除;
2.将符合某种特定条件的数据筛选出来,不符合特定条件的数据予以剔除。
数据的筛选
数据的排序
1.升序2.降序44第二章统计调查与整理Excel在统计数据预处理中的应用
利用Excel的相关命令可以自动完成数据的预处理
有效性命令
“数据”菜单筛选命令(自动筛选和高级筛选)
排序命令45第二章统计调查与整理按照综合表的要求进行分组或分类;对各单位的指标进行汇总和必要的加工计算;将汇总整理的结果编制成统计表;做好统计资料的系统积累工作。
以上几方面中,最重要的问题是在于确定对总体进行分组和如何分组,即确定分组体系,力求分组方法科学,能反映现象的客观过程。46第二章统计调查与整理二、统计分组的意义和作用概念
统计分组就是根据统计研究的需要,将统计总体按照一定的标志区分为若干组成部分的一种统计方法。意义统计分组是基本的统计方法之一,在资料整理和统计分析中都要广泛应用分组。分组的好坏直接关系到统计能否整理出正确的、中肯的统计资料,关系到统计能否得出正确的结论。从某种意义上讲,没有统计分组,就没有科学的统计资料的整理,也就没有科学的统计分析。47第二章统计调查与整理作用划分现象的类型:分组标志多为品质标志揭示现象内部结构:分组标志可为品质标志,也可为数量标志分析现象之间的依存关系
相关与回归分析法(第七章)、指数因素分析法(第五章)、统计分组分析法等。其中,统计分组分析法是最基本的分析方法,是进行其他分析法的基础。
总结:统计分组的上述三方面作用是分别从类型分组、结构分组和分析分组角度来说明的,它们不是彼此孤立的,而是相辅相成、相互补充、配合运用的。48第二章统计调查与整理
依存关系中的两个基本概念影响因素:表现为事物变化发展原因的因素结果因素:表现为事物发展结果的因素依存关系的分类正依存关系负依存关系
49第二章统计调查与整理三、分组标志的选择
分组标志是统计分组的依据,正确选择分组标志应考虑以下三点:根据研究问题的目的来选择要选择最能反映被研究现象本质特征的标志要结合现象所处的具体历史条件或经济条件来选择(列宁)
规模以上企业:这是一个统计术语。一般以年产量作为企业规模的标准,国家对不同行业的企业都制订了一个规模要求,达到规模要求的企业就称为规模以上企业,规模以上企业也分若干类,如特大型企业、大型企业、中型企业、小型企业等。规模以上工业企业是指全部国有企业(在工商局的登记注册类型为“110”的企业)和当年产品销售收入500万元以上(含)的非国有工业企业。50第二章统计调查与整理《福布斯》“中国家族企业调查”(2010年9月)从第一代企业家的年龄分布来看,47%的家族第二代出生于1970年代,只有不足30%的人出生于1960年代,而近年来被议论较多的“80后”仅占不到20%的比例,可见“70后”才是当今第二代企业家的主力。中国上市家族企业中有夫妻关系的企业为110个、有兄弟关系的企业为133个,是中国上市家族企业中为数最多的两类家族关系。台塑集团(王永庆)鸿海集团(郭台铭)
有一个人去请教某富翁如何致富,富翁说:“请您等一下,故事很长,我把电灯关了再说。”51第二章统计调查与整理统计分组的核心:选择分组标志统计分组的标志:品质标志数量标志统计分组的结果:组内具有同质性组间具有差异性统计分组的原则:穷尽原则:使总体中的每一个单位都有组可归互斥原则:使总体中的每一个单位只有一组可归四、简单分组、复合分组和分组体系52第二章统计调查与整理
指根据社会经济现象的特点和统计研究的任务,按某种标志把总体分成若干部分的科学分类。分组前分组后25%33%42%分组后:组间差异大,组内具有同质性。说明总体单位属性特征的名称53第二章统计调查与整理按分组标志的多少按分组标志的性质不同按分组的作用和任务不同统计分组的种类54第二章统计调查与整理
简单分组按年龄分组:按文化程度分组:20岁及20岁以下大专及大专以上21-35岁中专、技工36-50岁高中51-55岁初中56-60岁小学、识字不多或文盲1、简单分组:
即总体按一个标志进行分组。它只能从某一方面说明总体的分布状况和内部结构。
55第二章统计调查与整理对教师的分类按性别分类男性女性按职称分类按年龄分类高级中级初级青年中年共计7组2+3+2
简单分组56第二章统计调查与整理
复合分组和复合分组体系按经济类型分组按投资规模分组国有经济投资:大型中型小型集体经济投资:大型中型小型外商经济投资:大型中型小型其他经济投资:大型中型小型2、复合分组:复合分组是指对所研究的总体按两个或两个以上的标志层叠起来分组。可用于对事物多方面、多层次的分析研究。57第二章统计调查与整理按性别分类按职称分类按年龄分类男女高级中级初级青年中年共计12组2×3×2对教师的分类
复合分组58第二章统计调查与整理1、单项分组指用单一个数值作为分组标志的分组。每个数值作为一个组。
如某班学生按年龄分组:17岁,18岁,19岁,20岁,21岁,22岁。2、组距分组将作为分组依据的数量标志的整个取值范围依次划分为若干个满足互斥性和包容性的区间,用这些数值区间作为组的名称。某班学生统计学成绩分组60分以下60—70分70—80分80—90分90分以上59第二章统计调查与整理讨论:统计分组是否合适?期末考试结束了,四位任课老师分别对学生(35个)的考试成绩进行了以下分组:60第二章统计调查与整理Answer第一种分类
将同质的标志值分入不同的组,无法体现组间资料的差异性第二种分类
将不同质的标志值分入同一组,无法体现组内资料的同质性第三种分类不具有完备性第四种分类基本可以61第二章统计调查与整理第四节分配数列分配数列的概念和种类组距数列的编制累计次数分布次数分布的主要类型62第二章统计调查与整理一、分配数列的概念和种类概念
分配数列是统计分组的一种重要形式,是指在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体中各个单位在各组间的分布,称为次数分配或分配数列。分布在各组的个体单位数叫次数或频数,各组次数与总次数之比叫比率或频率。种类
根据分组标志的不同,分配数列可分为两种:品质分配数列(简称品质数列);变量分配数列(简称变量数列)。63第二章统计调查与整理品质数列
按品质标志分组形成的分配数列称为品质数列。品质数列由各组名称(属性)和次数组成。各组次数可以用绝对数表示,即次数或频数;也可以用相对数表示,即比率或频率。具体见下表:
64第二章统计调查与整理变量数列
按数量标志分组形成的分配数列称为变量数列,变量数列也是由各组名称(由变量值表示)和次数(或频率)组成。65第二章统计调查与整理单项数列单项数列是总体按单项式分组而形成的变量数列,每个变量值是一个组,在组数不多和组值变动幅度不大时采用。组距数列组距数列是总体按组距式分组而形成的变量数列,每个组是由若干个变量值形成的区间表示,在变量个数较多、变动幅度较大时采用。思考:(p65)计算题1中的灯泡耐用时间能否编制成单项数列,为什么?66第二章统计调查与整理判断右边两个数列的类型67第二章统计调查与整理二、组距数列的编制组距和组数全距:最大值-最小值组距:在组距数列中是用变量变动的一定范围代表一个组,每个组的最大值为组的上限,最小值为组的下限。每个组上限和下限之间的距离称为组距。组数:组数的确定和组距有密切联系。组距大则组数少,组距小则组数就多,两者成反比例的变化。在具体确定组距时,应使组距能体现组内资料的同质性和组间资料的差异性。
按经验的看法,组数过多过少都不妥,一般情况可分5~7组。组数的确定:史特吉斯(Sturges)经验公式,即组数m=1+3.322lgn
三者的关系:组距=全距/组数68第二章统计调查与整理等距分组和异距分组
组距数列根据组距是否相等,分为等距数列和异距数列两种。等距数列中各组组距都是相等的;异距数列中每组的组距不全相等。等距数列等距数列适用于标志变异比较均匀的现象,或者说,各组性质差异是由变量值均匀增加或减少而引起的。人口按身高、体重的分组等,一般均采用等距数列。异距数列
有许多社会经济现象的分布存在明显的偏斜状况,这时变量不适合等距分组,必须采用异距分组。如,人口总体的年龄分布。69第二章统计调查与整理人口老龄化问题
西方国家进入老龄时期一般都花费一百年左右的时间,而中国从控制生育到进入老龄化只用了18年时间。我们这个社会“未富先老”,所承担的养老责任越来越繁重。2000年我国的人均GDP按当年价仅为950美元左右,换算成1990年的美元仅为828美元。而一些发达国家在1900年左右进入人口老龄化社会时,人均GDP均已超过了2500美元(1990年的美元)。目前中国60岁以上的人口已经超过了14%,到2030年,中国人口结构将从现在的15个劳动力供养1个老人变为3.3个劳动力供养1个老人。老龄化社会的到来将使得养老成为一个大问题。
“社会统筹和个人账户相结合”的基本养老保险体制模式存在的主要问题是社会统筹账户亏空较大,导致个人账户空转,无法形成必要的积累,形成了巨额的“隐形债务”。数据显示,截至2005年底,中国社会养老保险个人账户的亏空达8000亿元,且每年以1000多亿元的规模持续扩大。70第二章统计调查与整理
某地区人口分布状况人口按年龄分组人口数(万人)1岁以下(婴儿组)11~7岁(幼儿组)67~17岁(学龄儿童组)1217~55岁(有劳动能力的人口组)24.655岁以上(老年组)8.1合计51.771第二章统计调查与整理标准组距次数标准组距,即为数列中最小组组距。在研究各组次数实际分布时,要消除组距不同的影响,这就要将不等组距的次数换算为标准组距次数(计算教材P51表2-12中的标准组距人数)。次数密度
标准组距次数的计算72第二章统计调查与整理组限和组中值确定组距和组数之后,还有确定组限的问题。基本概念组限:组距两端的数值称组限。闭口组:组距的上限、下限都齐全的组。开口组:有上限缺下限,或有下限缺上限的组。组限的表示方法连续变量分组:采用重叠式组限。为避免重复,一般规定“上组限不在内”。离散变量分组:相邻两组的上限与下限通常是以两个确定的不同整数值来表示,故相邻两组的上下限可以不重合;也可以按“上组限不在内”的原则写为重叠式组限。73第二章统计调查与整理粮食按亩产量分组:400斤以下400-600斤600-800斤800-1000斤1000斤以上工业企业按职工人数分组:100人以下或:100人以下101-500人100-500人501-1000人500-1000人1001-3000人1000-3000人3001人以上3000人以上连续变量离散变量74第二章统计调查与整理组中值
组距数列是按变量的一段区间来分组,掩盖了分布在各组内的单位的实际变量值。为了反映分在各组中个体单位变量值的一般水平,统计工作中往往用组中值来代表它。组中值:即各组变量范围的中间数值,通常可以根据各组上限、下限进行简单平均,即:组中值=(上限+下限)/2。两种特殊情况下组中值的计算:
缺上限的开口组组中值=下限+邻组组距/2
缺下限的开口组组中值=上限-邻组组距/275第二章统计调查与整理组限上限下限区间数值的最大值区间数值的最小值组距每一组的区间长度组距=上限-下限组中值每一组中点位置的数值组中值=(上限+下限)÷2等距分组在组距数列中各组组距均相等的分组异距分组在组距数列中各组组距不完全相等的分组组距分组中的一些概念小结76第二章统计调查与整理注意开口组以相邻组的组距作为该组的组距,确定其下限或上限,再计算组中值。全距=最大值-最小值缺少上限数值或下限数值的组每组都有上限数值和下限数值的组
确定组数和各组的组距:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按Sturges提出的经验公式来确定组数K开口组全距(极差)闭口组77第二章统计调查与整理某地区100个百货商店月销售额与流通费用情况销售额(万元)商店数(个)每百元商品销售额中支付的流通费(元)50以下50~100100~200200~300300以上102030251514.211.410.19.28.5上组限U下组限L如:组距d=U-L=100-50=50(万元)如:组中值x=(U+L)/2=(100+200)/2=150(万元)78第二章统计调查与整理例如60分以下60—70分70—80分80—90分90分以上组中值=上限-邻组组距/2=60-(70-60)/2=55组中值=上限-邻组组距/2=90+(90-80)/2=95上限不在内原则79第二章统计调查与整理计算下表中各组的组中值:
某工厂工人完成生产定额情况表工人完成生产定额分组组中值?第一组90以下第二组90~100第三组100~110第四组110~120第五组120以上80第二章统计调查与整理组距数列编制的步骤先对数据进行排序,以了解全部数据的变动范围;根据Sturges经验公式计算经验组距和经验组数;确定分组的组限;对各组数值所出现的频数进行计数;编制成组距数列。81第二章统计调查与整理组距数列的编制原始数据计算组中值排序确定组限计算全距确定组数、组距汇总组单位数制作组距数列统计表编制步骤或内容82第二章统计调查与整理等距分组适用于总体单位的标志值变动比较均匀的情况实例己知某班35个学生统计学期末考试成绩如下,单位(分)44505660626365656969697074767778787980838485858687888990919192939494要求等距分组。83第二章统计调查与整理⒈求全距⒉确定组距及组数确定组距的原则:要能区分各组的性质差异要能反映总体资料的分布特征为方便计算,尽可能为5或10的整数倍R≤组距(d)×组数(m)等距分组步骤84第二章统计调查与整理计算组数(组数不宜过多,也不宜太少)上例中,取d=10(一般取5或10的倍数),则有85第二章统计调查与整理⒊确定组限对于离散变量,相邻组组限可以间断,也可重叠;对于连续变量,相邻组组限必须重叠;符合“上限不计入”原则;首末两组可使用“××以下”及“××以上”的开口组。组限的表示方法86第二章统计调查与整理4、计算各组次数5、制作组距数列
按考试成绩分组(分)学生人数(人)60以下60~7070~8080~9090以上38897合计35某班统计学考试成绩表87第二章统计调查与整理作业某生产车间50名工人日加工零件数原始资料(单位:个)117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121试采用组距数列(等距数列)分组法编制频数分布表88第二章统计调查与整理下列数据是80个工人的月收入(单位:元),绘制直方图,观察月收入的分布状况1027130215731658170517941920204010501356157816651712180019342070110914351579167017301830194020761154145216001670175018541958214012001452163016781753186019652143123515431630167917581870197322701237154316451690177918701987230012601546164916901780187019982354128015601652169917841890200024781298157016521700179318932038259589第二章统计调查与整理三、累计次数分布次数分布
总体中各单位数在各组间的分布,称为次数分布。通过次数的分布规律,可以研究大量现象的统计规律性。累计次数分布
将变量数列各组的次数和比率逐组累计相加,即成为累计次数分布。累计次数的计算方法向上累计:又称以下累计,或称较小制累计,是将各组次数和比率由变量值低的组向变量值高的组逐组累计。组距数列中的向上累计,表明各组上限以下总共所包含的总体次数和比率有多少。向下累计:又称以上累计,或称较大制累计,是将各组次数和比率由变量值高的组向变量值低的组逐组累计。组距数列中的向下累计,表明各组下限以上总共所包含的总体次数和比率有多少。90第二章统计调查与整理累计次数的特点
同一数值的向上累计和向下累计次数之和等于总体总次数,而累计比率之和等于1(或100%)。如下表的“某班统计学考试成绩次数分配”:考分次数向上累计向下累计人数(人)比率(%)人数(人)比率(%)人数(人)比率(%)50~6025.025.040100.060~70717.5922.53895.070~801127.52050.03177.580~901230.03280.02050.090~100820.040100.0820.0合计40100.0————91第二章统计调查与整理总结当我们所关心的是标志值比较小的现象的次数分配情况时,通常用次数向上累计,以表明在这些数值以下所有数值所占的比重。当我们所关心的是标志值比较高的现象的次数分配情况时,通常用次数向下累计以表明在这些数值以上所有数值所占的比重。92第二章统计调查与整理洛伦茨曲线洛伦茨曲线是美国统计学家洛伦茨(M·Lorenz)提出来的,专门用以检定社会收入分配的平等程度。洛伦茨曲线运作的条件:居民或家庭按收入水平分组,计算各组居民或家庭的比重;计算各组收入的比重。从统计学概念上说,前者就是概率,即各组单位数占总体单位数的比重;后者就是各组标志总量占总体标志总量的比重。据此,可推断洛伦茨曲线是次数分布曲线中的累计次数曲线。洛伦茨曲线与基尼系数93第二章统计调查与整理基尼系数
G=A/(A+B)
当基尼系数=0时,表明社会分配绝对平均;当基尼系数=1时,表明社会分配绝对不平均;
G<0.2,社会收入分配绝对平均;
0.2<G<0.3,社会收入分配基本平均;
0.3<
G<0.4,社会收入分配基本合理;
0.4<
G<0.5,社会收入分配差距较大;
G>
0.5,社会收入分配差距悬殊。
94第二章统计调查与整理《财富》杂志为了了解美国和加拿大的订阅者进行了一次调查。调查问题之一是询问订阅者的投资证券组合(股票、公司债券、互助基金、存款)的价值。下列频率分布是调查的结果:
投资价值(美元)频率(%)25000以下1725000~50000950000~10000012100000~25000020250000~50000013500000~13以上16合计100Q1:订阅者中投资少于100000美元的百分比有多大?Q2:订阅者中投资在100000~美元间的频率有多大?Q3:订阅者中投资在500000美元以上的频率有多大?Q4:频率分布是以816个回答为基础得到的,报道中回答投资在100000~250000美元的有多少个?Q5:估计报道中投资少于100000美元的回答数?习题一95第二章统计调查与整理习题二96第二章统计调查与整理四、次数分布的主要类型
各种不同性质的社会经济现象都有着特殊的次数分布,常见的主要有三种类型:钟型分布、U型分布、J型分布。钟型分布钟型分布的特征钟型分布的特征是“两头小,中间大”,即靠近中间的变量值分布的次数多,靠近两端的变量值分布的次数少。属于钟型分布的社会经济现象很多,如农作物亩产量、市场价格、学生的成绩、职工的工资等。97第二章统计调查与整理钟型分布的种类
对称分布(特征)偏态分布(特征)对称分布右偏分布左偏分布变量值存在极端大值变量值存在极端小值98第二章统计调查与整理正态分布是最重要的对称分布。正态分布概念是由德国的数学家和天文学家Moivre于1733年受次提出的,但由于德国数学家Gauss率先将其应用于天文学研究,故正态分布又叫高斯分布。高斯这项工作对后世的影响极大,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。现今德国10马克的印有高斯头像的钞票,其上还印有正态分布的密度曲线。这传达了一种想法:在高斯的一切科学贡献中,其对人类文明影响最大者,就是这一项。99第二章统计调查与整理U型分布
U型分布的特征是“两头大,中间小”,即靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 全面详尽装饰工程劳务分包合同
- 物流配送服务合同书
- 重返校园学习保证
- 电信使用协议
- 民间贷款合同范本模板
- 牛饲料购销合同模板
- 个人借款协议书模板
- 桥梁工程脚手架分包协议分析
- 奶粉代理合同范本
- 电力线路工程分包协议
- who实验室生物安全手册
- 集体林权制度改革总结(优选3篇)
- 可编程控制器课程设计报告可编程控制器课程设计报告八篇
- 2401危险化学品岗位安全生产操作规程编写导则
- 年度供应商审核计划表
- 不便的便利店
- 题型汇编丨2023届高考化学反应原理综合题图像说理总结
- niren w5500模块用户手册adobe reader打开
- 初中生物新《课程标准》测试题库及答案
- 结婚函调报告表
- 房地产市场报告 -威海房地产市场月报2023年02月
评论
0/150
提交评论