高等数学第三章-统计数据的整理课件_第1页
高等数学第三章-统计数据的整理课件_第2页
高等数学第三章-统计数据的整理课件_第3页
高等数学第三章-统计数据的整理课件_第4页
高等数学第三章-统计数据的整理课件_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章统计数据的整理第三章统计数据的整理1第一节数据的预处理一、统计资料整理的必要性

概念:也称统计整理,是根据统计研究的任务与要求,对调查得来的各种原始资料,进行科学的综合与加工,使之系统化,从而得出反映总体的综合资料的过程必要性:表现在以下方面:1、统计调查搜集到的大量原始资料是分散的、不系统的,只能说明总体单位的个别特征和属性(被调查单位的具体情况)。必须按照科学的原则加以整理,使之简化和系统化。2、统计资料整理,是统计调查的继续,也是统计分析的前提和基础,在整个统计工作中具有承前启后的作用。第一节数据的预处理2二、数据的预处理统计整理的步骤:审核、筛选、排序、分组(类)、频数分布表(图)1.审核对于第一手资料:1)完整性(两方面)2)准确性(两方面)对于第二手资料:1)完整性2)准确性3)适用性4)时效性二、数据的预处理32.筛选1)剔除2)挑出3.排序1)升序2)降序2.筛选4第二节统计分组(类)是根据现象总体内在特点和统计工作任务的要求,按照某种标志,把总体划分为不同类型或者性质不同的几部分的一种统计方法。

第二节统计分组(类)5(一)分组的种类1.类型分组根据不同的标志把社会经济现象划分为性质不同的类型,以解释不同社会经济现象的性质、特点及其相互联系2.结构分组根据某种标志,把社会经济现象总体分成若干组成部分,以分析其构成。如表1.3.分析分组为研究现象总体诸标志依存关系而进行的分组如表2

(一)分组的种类6表1中国农村居民纯收入构成(按收入来源分)单位:% 年份工资性收入经营性收入财产性收入转移性收入20002001200220032004200531.232.633.935.034.036.163.361.760.058.859.556.72.02.02.02.52.62.73.53.74.03.73.94.5表1中国农村居民纯收入构成(按收入来源分)单位:% 年7表2家庭人均生活费与就业人品数依存关系按人均月生活费分组(元)平均每户就业人数(人)200以下200-250250-350350-500500-600600以上1.781.962.122.332.592.82表2家庭人均生活费与就业人品数依存关系按人均月生活费8(二)分组的方法1.按品质标志分组2.按数量标志分组(书61)1)单项式分组每个变量值列为一个组的分组方法适合数量标志的变化范围不大、总体单位数不多的离散型变量的分组。2)组距式分组把整个变量值依次划分为几个区间,各个变量值则按其大小确定所归并的区间的分组方法。

(二)分组的方法9相关概念:全距、组距(等距、不等距)、组限(上限值、下限值)、组中值、开口组、闭口组分组步骤:第一步:确定组数5≦k≦15第二步:确定各组的组距,(一个组的上下限之差)组距=全距/组数习惯上的做法是:取5或10的倍数相关概念:10第三步:将分组结果整理成频数分布表注:1.根据需要,实际中往往还有更复杂的分组方法。如复合分组法。2.不管何种分组方法,都要遵循“不重不漏”的原则。为解决“不重”的问题,在分组时必须做到:“下组限在内”或“上组限不在内”第三步:将分组结果整理成频数分布表11五、频数分布表1.频数分布表的结构及组成要素例1.某生产车间50名工人日加工零件数如下(单位:个)

108108110112112113114115117117118118118119120120122122122122123123123123124124125125126126127127128128129130131133133134134135137139139五、频数分布表121)单项式分组某车间50名工人日加工零件数零件数(个)频数零件数(个)频数零件数(个)频数1071081101121131141151171181212111331191201211221231241251261271214432231281291301311331341351371392111221121)单项式分组零件数(个)频数零件数(个)频数零件数(个)频132)组距分组按零件数分组频数(人)频率(%)105-110110-115115-120120-125125-130130-135135-140合计358141064506101628201281002)组距分组按零件数分组频数(人)频率(%)105-1103142.累计频数2.累计频数15按零件数分组频数(人)频率(%)向上累积向下累积频数(人)频率(%)频数(人)频率(%)105-110110-115115-120120-125125-130130-135135-14035814106461016282012838163040465061632608092100504742342010410094846840208合计50100--------按零件数分组频数(人)频率(%)向上累积向下累积频数(人)频16六、统计表统计表是用来显示统计资料的基本工具。以上调查表、频数分布表都是统计表。(一)统计表的作用(优点)1.能使统计资料条理化2.比用叙述的方式表现统计资料更简明易懂,节省篇幅3.便于比较各项目之间的关系,便于计算4.便于检查统计数字的完整性和正确性六、统计表17(二)统计表的构成1.由表头、(横)行标题(纵)列标题、数字资料四部分组成。另外,必要时可加上表外附加。

2.从内容上看,统计表包括主词和宾词两个部分。

主词是统计表所要说明的总体或总体单位或各组的名称,通常排在表的左方,即列于横行,

宾词是用来说明主词的各种指标,通常排在表的右方即列于纵栏例:见下表(二)统计表的构成18中国农村居民纯收入构成(按收入来源分)单位:% 资料来源:《中国农村统计年鉴》注:本表数据为抽样调查材料年份工资性收入经营性收入财产性收入转移性收入20002001200220032004200531.232.633.935.034.036.163.361.760.058.859.556.72.02.02.02.52.62.73.53.74.03.73.94.5中国农村居民纯收入构成(按收入来源分)单位:% 年19(三)统计表的种类A.按用途的不同,可以分为调查表、整理表、分析表1.调查表:在统计调查中,用于登记、搜集和表现原始统计资料的表格2.整理表:在统计整理过程中用于统计汇总和用于表现统计汇总结果的表格3.分析表:在统计分析中用于对汇总结果进行定量分析的表格。B.按主词是否分组,可以分为简单表、分组表、复合表(三)统计表的种类20(四)编制统计表的规则:1.总体要求:内容紧凑、重点突出、简洁明了,便于分析和比较2.表头要以概括、简练的文字反映表中资料的基本内容(what)及资料所属的时间(when)和空间(where)范围;表头一般放在表的上端中央;表头一般应包括表号、总标题和表中数据的单位等。若表中数据单位不同,则应将计量单位放在每个指标后或单列出一列标明3.统计表中各主词项目之间和宾词项目之间的顺序,应根据时间的先后、数量的大小、空间位置的顺序等合理编排。(四)编制统计表的规则:214.统计表中横行合计一般在最后一列,而纵栏合计一般列在最后一行。5.统计表中如果栏数较多,习惯上对主词各栏采用甲、乙……次序编栏,对宾词各栏采用1、2、3……次序编栏,若各栏统计指标值之间有一定的计算关系,还可用等式表示。6.表中数据一般应右对齐,若是小数,应保留相同的小数点后的位数,并以小数点对齐;不要求填写或无数字的空格,用短线“—”表示,不能空着或写成“0”;若上、下、左、右数字相同,则必须将数字写出,不得用“同上”等表示。7.表格一般采用“三线”形式,上下两条横线用粗线,中间的其他线用细线。左右两边不封口。8.必要时可在表的下方加上必要的注释,特别要注明资料来源,以对他人劳动成果的尊重和备读者查阅使用。高等数学第三章--统计数据的整理课件22七、统计图

1.条形图(柱形图):适合时间序列、空间或类别数据

七、统计图

1.条形图(柱形图):适合时间序列、空间或类别数232.直方图:适合组距分组数据2.直方图:适合组距分组数据243.拆线图(一般形式、累计拆线图)适合时间序列、组距分组数据3.拆线图(一般形式、累计拆线图)254.圆形图(饼图):适合结构研究4.圆形图(饼图):适合结构研究265.环形图:比较研究5.环形图:比较研究276.散点图6.散点图287.K线图7.K线图298.茎叶图(书66)9.饼图10.锥形图8.茎叶图(书66)30八、频数分布类型1.钟型分布:正态、左偏、右偏2.U型分布:人口死亡率3.J型分布:一定时期内学生按时到课次数八、频数分布类型31练习:一、判断题1.能够对统计总体进行分组,是由统计总体中的各单位所具有的“同质性”特点决定的2.由于离散变量不能用小数表示,因此只能进行单项式分组练习:一、判断题32二、单选题1.分组标志一经确定后就______.A.掩盖了总体单位在此标志下的性质差异B.突出了总体单位在此标志下的性质差异C.突出了总体单位在其他标志下的性质差异D.使得总体内部的差异消失了2.为了反映商品价格与需求之间的关系,在统计中应采用______A.划分经济类型的分组B.说明现象结构的分组C.分析现象间依存关系的分组D.上述都不正确3.划分离散变量的组限时,相邻两组的组限______A.必须是间断的B.必须是重叠的C既可以是不重合的,也可是重叠的D应当是相近的二、单选题334.某管理局对其所属企业的生产计划完成百分比采用如下分组,正确的是____

A.80%~89%,90%~99%,100%~109%,110%以上B.80%以下,80.1%~90%,90.1%~100%,100.1%~110%C.90%以下,90%~99%,100%~110%,110%以上D.85%以下,85%~95%,95%~105%,105%~110%4.某管理局对其所属企业的生产计划完成百分比采用如下分组,正34三、多选题1.我国第四次人口普查的标准时间是1990年7月1日零时,下列情况应统计人口数的有:A.1990年7月2日出生的婴儿B.1990年6月29日出生的婴儿C.1990年6月29日死亡的人D.1990年7月1日1时死亡的人E.1990年6月29日出生、7月1日6时死亡的婴

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论