版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章统计资料的搜集与整理一、统计调查的意义第一节统计资料及其搜集方法统计调查就是按照统计任务的要求,运用科学的调查方法,有组织地向社会实际搜集资料的过程。应当正确理解社会调查在人们认识中的地位;应当正确理解统计调查在统计工作中的地位;应当正确理解统计调查理论和方法在统计学原理中的地位。例:企业生存取决于市场。对企业来说,生产什么?售价多少?何地销售?如何推广?产品市场份额多大?产品发展潜力多深?竞争对手会有什么应对策略?等等,一系列问题均要通过市场调查。请看目前:各国企业和研究机构全年投资于每个消费者的平均调查费单位:美元英国22.9美国16.5日本8中国0.1统计资料的三个基本性质:数量性总体性客观性二统计资料的搜集准确性要求和及时性要求是相互结合相互依存的,及时性在准确性要求的前提下才有意义,而准确性也不能损害及时性的要求。准确性及时性原始资料:是通过统计调查或试验所取得的统计资料,都属于第一手资料;次级资料:来源与别人通过统计调查或试验所取得并已经加工整理过的统计资料,都属于第二手资料。原始资料的收集方法:
1访问调查
2电话调查
3邮寄问卷
4观测
5互联网调查1涉及范围要适度2事先进行规划3注意版权问题三、搜集资料的注意事项进行统计调查一方面要选择恰当的调查方式;另一方面要在调查之前通盘设计好调查的活动方案第二节调查方式与调查方案普查抽样调查统计报表重点调查典型调查普查涵义:普查是专门组织的,一般用来调查属于一定时点上社会经济现象数量的全面调查。普查是专门调查特点普查是全面调查普查是一种不连续调查普查通常是一次性的或周期性的普查必须规定标准调查时间作用:普查主要用来搜集那些反映国情国力方面的基本统计资料。例如:人口普查、工业普查、物资库存普查、乡镇企业普查、商业饮食业普查等等。统计调查方法
抽样调查抽样调查是一种非全面调查,它是按照随机原则从总体中抽取部分单位进行观察,用以推断总体数量特征的一种调查方式。是一种非全面调查,但是又要达到对总体数量特征的认识。按照随机原则抽选调查单位。经济性、时效性、准确性、灵活性能够解决全面调查无法或难以解决的问题。可以补充和订正全面调查的结果。可以用于对总体的某种假设进行检验。简单随机抽样类型随机抽样等距随机抽样整群随机抽样组织形式对总体不进行任何整理,直接从总体中按照随机原则抽选调查单位。作用特点涵义优点先对总体各单位按主要标志进行分类,再按随机原则抽选调查单位。将总体各单位按某一标志大小顺序排列,然后依一定间隔抽取样本单位进行调查。先将总体各单位划分为许多群,再以群为单位,从中随机抽选部分群,对中选群的所有单位进行调查。统计报表什么是统计报表?基本特点是什么?有何作用?有哪几种类型?重点调查与典型调查都属于非全面调查二者共同点根据客观标准选择重点单位在对现象分析的基础上有意识地选择典型单位调查目的不同选择调查单位的方法不同重点调查典型调查重点调查的目的是反映总体的基本情况典型调查的目的是推算总体的数量特征二者区别1.统计报表统计报表分为:按报送周期长短不同统计报表分为:分为普查、重点调查、抽样调查、典型调查。
普查为全面调查,后三者为非全面调查。
2.专门调查普查:为专门组织的一次性调查,用来调查属于一定时点的社会现象的总量。例:每5年进行一次的经济普查,包括工业普查、三产普查、基本单位普查、建筑业普查。这种普查制度在周期安排上和国家编制五年计划相衔接。重点调查:对重点单位进行调查。重点单位指的是这些单位数占总体的很少部分,而研究的标志总量占绝大部分(或绝大比重)。例:某地区为了掌握该地区水泥生产的质量情况,拟对占该地区水泥总产量80%的五个大型水泥厂的生产情况进行调查,属于重点调查。抽样调查:按随机原则从总体中抽取一部分单位进行调查。
例,对一批灯泡的合格率进行调查,应该采用抽样调查方式。典型调查:先对总体进行分析,然后选择有代表性的单位进行调查。
例,选取部分企业进行调查,以了解企业股份制改革后的成果及问题。三统计调查的设计(即统计调查方案)调查对象就是我们需要进行研究的总体范围,即调查总体。它是由性质相同的许多调查单位所组成的。作为调查单位乃是进行登记的标志表现的直接承担者。例:人口普查的调查单位是每一个人1.确定调查的目的
——即为什么调查2.确定调查对象和调查单位
——即向谁做调查3.调查内容和调查表
——即用什么方法调查拟订调查项目时要注意几个原则:-调查项目要少而精;-调查项目含义要明确;-尽可能做到各个调查项目之间有一定的联系。调查活动的核心是要进行调查的内容,
也就是需要想调查单位了解的情况和问题。调查表分为:一览表把许多调查单位和相应的项目按次序登记在一张表格里。这便于汇总,但缺点是分不开,故调查深度不够;单一表将一个调查单位的项目登记在一份表或一种卡片上。这便于容纳较多的项目,且便于整理、分类,缺点是繁琐。调查表是把所调查的内容具体化为一些明确的项目或指标,并恰当排列制成表格。4.其他内容
调查内容的时间特征;调查工作的时间限制;搜集数据的具体方法;调查的具体组织实施工作。第三节统计调查误差一、统计调查误差的种类登记误差;代表性误差二、产生误差的客观原因
客观随机性操作不当计算中的舍入错误故意制造的误差第三节统计调查误差三、怎样看待误差
第一,误差降低了统计数据的质量。第二,误差是难以避免的。第三,人们对准确性的要求是相对。第四,追求过高的准确性往往得不偿失。第四节统计数据的整理统计调查搜集上来的资料,不论是哪一种类型的资料都必须经过整理才能进一步进行分析。资料的类型不同,研究的目的不同,资料整理的方法也不同。统计整理是根据统计研究任务的要求,对调查所搜集到的原始资料进行分组、汇总,使其条理化、系统化的工作过程。一统计数据整理的意义和步骤第四节统计数据的整理1.目的数据简单化、系统化。一统计数据整理的意义和步骤2.方法分组3.步骤:
对原始资料进行审核;对原始资料进行分组和汇总;经汇总结果用统计表或统计图的方式表现出来,为统计资料的使用和分析做好准备。1.概念把同质总体中的具有不同特点的
单位分开,从而正确地认识事物
的本质及其规律性。二统计分组2.分组的关键:
选择恰当的分组标准准确地划分组的界限统计分组的意义根据统计研究任务的要求和现象的内在特点,把统计总体按照某一标志划分为若干性质不同又有联系的几部分,称为统计分组。统计分组可以按分组的任务和作用、分组标志多少以及分组标志的性质等方面进行分类。品质标志分组——反映事物属性差异(二)统计分组的类型1.按分组标志的特征不同分为:-简单分组。如人口按性别分组。-复杂分组,亦称分类。如人口按职业分组。-单项式数量分组
——运用于变量变动幅度小、项目少的分组。-组距式分组
——运用于变量变动幅度大、项目多的分组。数量标志分组——反映事物数量差异统计总体按照某一标志分组以后,用以反映总体各单位分配情况的统计数列,称分配数列,又可称次数分配,或次数分布。(一).概念三次数分布例月工资分组(元)工人数(人)占总数比重(%)2000以下210
39.62000-250018735.32500以上133
25.1合计530100.0
组别(变量)
次数(频数)频率(比率)(二)数量分组的次数分布组限组距两端的数值。分为上限和下限。组距某一组的上限和下限的距离,分等距和异距。全距分组数列中最大值的上限与最小值的下限之差。组中值组的上限和下限的中间值。因数列两端组限形式不同分:开口式组距:最低组与最高组不封口。例:成绩60分以下,90分以上。闭口式组距:例40-60分,90-100分。组距=上限-下限1.分组方法考试成绩(分)人数(人)56-602
60-10038合计40例若将考试成绩仅分为不及格与及格两组,则可编成如下组距数列:
某班学生统计学考试成绩表若把上表改变为如下统计表,则基本上能准确反映总体的分布特征。某班学生统计学考试成绩表考试成绩(分)人数(人)比重(%)50-6025.060-70717.570-801127.580-901230.090-100820.0合计40100.02.分组组距和组中值
⑴关于组限问题组距分组通常有等距分组和不等距分组两种。等距分组即标志变量在各组保持相等组距。反之为不等距分组。在分组标志变更比较均匀的情况下适用等距分组。标志变异差别急剧升降时,就应按不等距分组,不等距分组更多的应根据事物性质变化的数量界限来确定组距。例已知组距为5,组数为7,最大值39,最小值5,怎样分组?按分法(a)较合适(a)(b)(c)3-84-9
5-10
8-13
9-1410-1513-1814-1915-2018-2319-2420-2523-2824-2925-3028-3329-3430-3535-4033-3834-39上组限不在内适用于越大越好的变量,如产值。适用于越小越好的变量,如成本。下组限不在内对连续变量,组数也要连续。在登记次数时,习惯上遵守:对不连续变量,组与组间是间断的。⑵关于组中值问题闭口式分组的组中值求法:
⑵关于组中值问题开口式分组的组中值求法:
在组距数列中,每组的最大变量值(终点值)为上限,最小变量值(起始值)为下限。连续变量数列中小组中(上一组)的上限也是大组中(下一组)的下限。在分组时如果遇到变量值恰好等于相邻两组的组限时,一般把此值归入大组中。上限与下限的中点数值为组中值。它是各组上下限数值的简单平均数。即组中值=(上限+下限)/2。组中值用以代表多组标志值的平均水平。现在举例说明变量数列编制的过程。例如根据抽样调查,1995年某城镇50户居民家庭平均每人每月生活费收入的资料如下:3670
32202940273023703980327029802760246031103550
24002750296032403820229026402880235027102910319036002260262028603090352033702220260028403040343021702590283030302000253028103010329021202570281030303320
将这些数字从小到大排列起来:2000212021702220226022902350237024002460253025702590260026202640271027302750276028102810
2810283028402860280029102940296029803010303030403090311031903220324032703290332033703430352035503600367038203980计算全距。3980-2000=1980
根据这50户居民家庭人均月生活费收入序列化后所呈现出一定规律性的认识,参照上面所说一系列分组方法的原理,我们假定把变动全距分为8个相等的组距,则组距为:1980/8=247.5元,化整为250元。这里第一组的下限应为2000元,于是上下限化整为2000—2250元,2250—2500元……。分组情况见下表:居民家庭人均月生活费收入(元)户数(频数)户数的比重
(%)(频率)2000——2250482250——25006122500——27508162750——300012243000——32509183250——35005103500——3750483750——400024合计50100三次数分布的特征1.次数分布的表示方法
⑴表示法——即用统计表来表示次数分布。例考分次数以上累计次数
(上限)以下累计次数
(下限)人数(人)比率(%)人数(人)比率(%)人数(人)比率(%)50-602
5.0
2
5.040100.060-707
17.5
9
22.538
95.070-8011
27.520
50.031
77.580-9012
30.032
80.020
50.090-1008
20.040100.0
8
20.0合计40100.0----某班统计学考试成绩次数分配以上累计次数(上限)——即较小制累计。每一组的累计次数表示小于该组上限(变量)值的次数共有多少。以下累计次数(下限)——即较大制累计。每一组的累计次数表示大于该组下限(变量)值的次数共有多少。⑵图示法即用统计图来表示次数分布直方图折线图曲线图直方图(或次数分配曲线图)仍以上例考试成绩数据,画成如下直方图:405060708090100110若组距不等的话,用标准组距人数,然后据此画直方图:按工人年龄分组(岁)组距人数(人)标准组距人数(人)频数密度=频数/组距15-20
5
1717
3.420-25
5
2828
5.625-30
5
4040
8.030-35
5
707014.035-4510
6532.5
6.545-50
5
1010
2.0合计-230-
-直方图例10152025303540455055折线图在直方图的基础上连接各条形顶边的中点成折线图。如下图红笔围成的,即为次数分配曲线图:405060708090100110折线图还可用来表示累计次数分布(仍以上例数据):曲线图是组数趋向于无限多时折线图的极限描绘,是一种理论曲线。向下累计向上累计2.次数分布的主要类型一般次数分布呈正态分布曲线,或称正态曲线对称型YY右偏型(上偏型)
左偏型(下偏型)
XX很多是偏态分布曲线,或称偏态曲线
还有其他形态J型分配曲线U型分配曲线双峰曲线一、判断对错1、全面调查和非全面调查是根据调查结果所得到的资料是否全面来划分的。()2、对某市下岗职工生活状况进行调查,要求在一个月内报送调查结果。所规定的一个月时间是调查时间。()3、我国人口普查的总体单位和调查单位都是每一个人,而填报单位是户。()4、采用重点调查搜集资料时,选择的调查单位是标志值较大的单位。()5、统计调查误差就是指由于错误判断事实或者错误登记事实而发生的误差。()6、典型调查既可以搜集数字资料,又可以搜集不能用数字反映的实际情况。()7、重点调查与抽样调查的目的是一致的,即都是通过对部分单位的调查,来达到对总体数量特征的认识。()××√××√×8、对统计资料进行分组的目的就是为了区分各组单位之间质的不同。()×9、组中值是根据各组上限和下限计算的平均值,所以它代表了各组的平均分配次数。()×10、分配数列的实质是把总体单位总量按照总体所分的组进行分配。()√11、某企业职工按文化程度分组形成的分配数列是一个单项式分配数列。()×12、对资料进行组距式分组,是假定变量值在各组内部的分布是均匀的,所以这种分组会使资料的真实性受到损害。()√13、任何一个分布都必须满足:各组的频率大于0,各组的频数总和等于1或100%()×14、统计分组后掩盖了各组内部各单位的差异,而突出了各组之间单位的差异。()√二、单项选择题1、统计整理的关键是()A、对调查资料进行审核B、对调查资料进行统计分组C、对调查资料进行汇总D、编制统计表B2、下列分组中属于按品质标志分组的是()A、学生按考试分数分组B、产品按品种分组C、企业按计划完成程度分组D、家庭按年收入分组B3、有一个学生考试成绩为80分,在统计分组中,这个变量值应归到()组。A、60—70分B、70—80分C、80—90分D、90—100分C4、某主管局将下属企业先按轻、重工业分组,再按规模分组,这种分组属于()分组。A、简单分组B、复合分组C、分析分组D、结构分组B三、多项选择题部分1、在工业设备普查中()A、工业企业是调查对象B、每个工业企业是填报单位C、每台设备是填报单位D、每台设备是调查单位
E、工业企业的全部设备是调查对象BDE2、制定统计调查方案,应确定()A、调查目的和调查对
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 化工合同审批管理
- 食品文化节采暖系统施工合同
- 水产养殖防水保温施工协议
- 艺人演出教育推广协议
- 农业科技招投标与合同履约分析
- 婚庆策划公司租赁合同
- 建筑工程水电站施工合同样本
- 绿色商业植草砖施工合同
- 电影院干挂石材施工协议
- 洗衣服务公司人事经理聘用合同
- 七年级上册道德与法治2023-2024期末试题附答案系列
- 代账公司会计主管年终总结
- 创新思维训练学习通超星期末考试答案章节答案2024年
- 网络与信息安全管理员(高级技师)资格理论考试题及答案
- 广东省肇庆市2023-2024学年高二上学期期末教学质量检测试题 政治试题 附答案
- 街道社区城管工作目标考核细则
- 国开电大专科《Dreamweaver网页设计》2023-2024期末试题及答案(试卷号:2445)
- 体育概论(第二版)课件第三章体育目的
- 2024年《中华人民共和国监察法》知识测试题库及答案
- 科学与文化的足迹学习通超星期末考试答案章节答案2024年
- 2025届高考语文复习:散文阅读 课件
评论
0/150
提交评论