版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章统计数据的整理第一节数据的预处理一、统计资料整理的必要性概念:也称统计整理,是依据统计探讨的任务与要求,对调查得来的各种原始资料,进行科学的综合与加工,使之系统化,从而得出反映总体的综合资料的过程必要性:表现在以下方面:1.统计调查搜集到的大量原始资料是分散的、不系统的,只能说明总体单位的个别特征和属性(被调查单位的具体状况)。必需依据科学的原则加以整理,使之简化和系统化。2.统计资料整理,是统计调查的接着,也是统计分析的前提和基础,在整个统计工作中具有承前启后的作用。二、数据的预处理统计整理的步骤:审核、筛选、排序、分组(类)、频数分布表(图)1.审核对于第一手资料:1)完整性(两方面)2)精确性(两方面)对于其次手资料:1)完整性2)精确性3)适用性4)时效性2.筛选
1)剔除
2)挑出3.排序
1)升序
2)降序其次节统计分组(类)是依据现象总体内在特点和统计工作任务的要求,依据某种标记,把总体划分为不同类型或者性质不同的几部分的一种统计方法。思索:为什么可以对总体进行分组?一、分组的种类1.类型分组依据不同的标记把社会经济现象划分为性质不同的类型,以说明不同社会经济现象的性质、特点及其相互联系2.结构分组依据某种标记,把社会经济现象总体分成若干组成部分,以分析其构成。如表1.3.分析分组为探讨现象总体诸标记依存关系而进行的分组如表2
表1中国农村居民纯收入构成(按收入来源分)单位:%
年份工资性收入经营性收入财产性收入转移性收入20002001200220032004200531.232.633.935.034.036.163.361.760.058.859.556.72.02.02.02.52.62.73.53.74.03.73.94.5表2家庭人均生活费与就业人品数依存关系按人均月生活费分组(元)平均每户就业人数(人)200以下200-250250-350350-500500-600600以上1.781.962.122.332.592.82二、分组的方法1.按品质标记分组2.按数量标记分组1)单项式分组每个变量值列为一个组的分组方法适合数量标记的变更范围不大、总体单位数不多的离散型变量的分组。2)组距式分组把整个变量值依次划分为几个区间,各个变量值则按其大小确定所归并的区间的分组方法。相关概念:全距、组距(等距、不等距)、组限(上限值、下限值)、组中值、开口组、闭口组分组步骤:第一步:确定组数其次步:确定各组的组距组距=全距/组数习惯上的做法是:取5或10的倍数第三步:将分组结果整理成频数分布表注:1.依据须要,实际中往往还有更困难的分组方法。如复合分组法。2.不管何种分组方法,都要遵循“不重不漏”的原则。“不重”:“下组限在内”或“上组限不在内”“不漏”:重叠法(离散变量、连续变量)顶针法(离散变量)三、频数分布表1.频数分布表的结构及组成要素例1.某生产车间50名工人日加工零件数如下(单位:个)
1081081101121121131141151171171181181181191201201221221221221231231231231241241251251261261271271281281291301311331331341341351371391391)单项式分组某车间50名工人日加工零件数零件数(个)频数零件数(个)频数零件数(个)频数1071081101121131141151171181212111331191201211221231241251261271214432231281291301311331341351371392111221122)组距分组按零件数分组频数(人)频率(%)105-110110-115115-120120-125125-130130-135135-140合计358141064506101628201281002.累计频数(附:洛沦茨曲线)按零件数分组频数(人)频率(%)向上累积向下累积频数(人)频率(%)频数(人)频率(%)105-110110-115115-120120-125125-130130-135135-14035814106461016282012838163040465061632608092100504742342010410094846840208合计50100--------四、统计表统计表是用来显示统计资料的基本工具。以上调查表、频数分布表都是统计表。(一)统计表的作用(优点)1.能使统计资料条理化2.比用叙述的方式表现统计资料更简明易懂,节约篇幅3.便于比较各项目之间的关系,便于计算4.便于检查统计数字的完整性和正确性(二)统计表的构成
1.由表头、(横)行标题(纵)列标题、数字资料四部分组成。另外,必要时可加上表外附加。
2.从内容上看,统计表包括主词和宾词两个部分。
主词是统计表所要说明的总体或总体单位或各组的名称,通常排在表的左方,即列于横行,
宾词是用来说明主词的各种指标,通常排在表的右方即列于纵栏例:见下表
中国农村居民纯收入构成(按收入来源分)单位:%
资料来源:《中国农村统计年鉴》
注:本表数据为抽样调查材料年份工资性收入经营性收入财产性收入转移性收入20002001200220032004200531.232.633.935.034.036.163.361.760.058.859.556.72.02.02.02.52.62.73.53.74.03.73.94.5(三)统计表的种类A.按用途的不同,可以分为调查表、整理表、分析表1.调查表:在统计调查中,用于登记、搜集和表现原始统计资料的表格2.整理表:在统计整理过程中用于统计汇总和用于表现统计汇总结果的表格3.分析表:在统计分析中用于对汇总结果进行定量分析的表格。B.按主词是否分组,可以分为简洁表、分组表、复合表(四)编制统计表的规则:1.总体要求:内容紧凑、重点突出、简洁明白,便于分析和比较2.表头要以概括、简练的文字反映表中资料的基本内容(what)及资料所属的时间(when)和空间(where)范围;表头一般放在表的上端中心;表头一般应包括表号、总标题和表中数据的单位等。若表中数据单位不同,则应将计量单位放在每个指标后或单列出一列标明3.统计表中各主词项目之间和宾词项目之间的依次,应依据时间的先后、数量的大小、空间位置的依次等合理编排。4.统计表中横行合计一般在最终一列,而纵栏合计一般列在最前一行。5.统计表中假如栏数较多,习惯上对主词各栏接受甲、乙……次序编栏,对宾词各栏接受1、2、3……次序编栏,若各栏统计指标值之间有确定的计算关系,还可用等式表示。6.表中数据一般应右对齐,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电蒸锅市场需求与消费特点分析
- 2024年度城市轨道交通建设及运营合同
- 轴间隙测试仪市场发展预测和趋势分析
- 自行车用驮篮市场发展现状调查及供需格局分析预测报告
- 2024年度光学仪器玻璃制造与安装合同
- 健身用拉筋板市场发展现状调查及供需格局分析预测报告
- 血管加压药市场需求与消费特点分析
- 2024年度版权许可使用合同termsandconditions
- 2024年度便利店财务管理加盟合同
- 自行车车把市场需求与消费特点分析
- 油船在港作业安全要求-编辑说明
- 2024年《建筑节能》理论考试题库(浓缩500题)
- 某监控中心管理制度全套
- 药物引起的过敏性休克的应急预案及护理流程
- 水塘租赁合同样本范本版
- 特种设备安全总监岗位职责
- DB3306T 070-2024产品碳足迹评价技术规范 棉面料
- 学习心理完整版本
- 低压电工安全技术培训课件
- (高清版)JTG 3363-2019 公路桥涵地基与基础设计规范
- 出口农产品的市场营销策略
评论
0/150
提交评论