数据分析基础_第1页
数据分析基础_第2页
数据分析基础_第3页
数据分析基础_第4页
数据分析基础_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据分析基础以分析大数据时代对大学生就业能力基本要求出发,以数据处理与数据分析为重点,采取案例教学模式组织内容,将理论融入案例。第1页目录/Contents1.1 什么是数据分析1.2 统计学几个基本概念第一章 数据分析概述1.3 统计指标分类第2页1.1 什么是数据分析数据分析是指对大量数据进行整理后,利用适当统计分析方法,把隐藏在数据背后信息提炼出来,并加以概括总结过程。数据分析包含以下几个主要内容。 现实状况分析:分析已经发生了什么。 原因分析:分析为何发生某一现实状况。 预测分析:分析未来可能发生什么。第3页1.1 数字通信系统基本概念1.1.1 数据分析过程数据分析过程主要包含6个既

2、相对独立又相互联络阶段,下面分别进行介绍。1确定分析目标2搜集数据3数据处理4数据分析5数据展现6撰写汇报4第4页1.1.2 数据分析工具数据分析相关工具能够分成以下3种。(1)存放数据工具。(2)分析数据工具。(3)做分析汇报工具。第5页1.2 统计学几个基本概念1.2.1 现象总体和现象个体现象总体(以下简称总体)是由客观存在、含有某种共同性质又有差异许多个别单位所组成整体。组成总体每一个事物或基本单位,叫现象个体(以下简称个体)。原始资料最初就是从每个个体中取得,所以个体是各项统计数字最原始负担者。第6页依据表1-1数据,深入了解什么是总体,什么是个体。姓名性别身高(cm)体重(kg)兴

3、趣张三男17568篮球李四男17270唱歌王二女16350舞蹈表1-1 某学校全体学生资料一览表第7页总体必须具备3个特征:大量性、同质性和变异性。(1)大量性:是总体量要求性,即指总体形成要有一个相对规模量,仅仅由个别单位或极少许单位不足以组成总体。(2)同质性:是指组成总体各个单位最少有一个性质是共同,同质性是将总体各单位结合起来组成总体基础,也是总体质要求性。(3)变异性:是指总体各个单位除了含有某种或一些共同性质以外,在其它方面则各不相同,含有质差异和量差异,这种差异叫变异。第8页比如:在研究江西省全部工业企业工业总产值时(见表1-2),每个企业工业总产值都是个体,但在研究其中某一个企

4、业工业总产值时,则该企业又成了总体。企业名称工业总产值(万元)企业14000企业26000企业39000表1-2 江西省工业企业总产值一览表第9页1.2.2 标志和标志表现通常,每个个体含有许多属性和特征。这些属性或特征叫标志。标志属性或数量在每个个体详细表现,叫标志表现。标志按其性质能够分为数量标志和品质标志。 数量标志:以数量多少来表示标志,表示事物量特征。 品质标志:不能用数量而只能以性质属性上差异即文字来表示标志,表示事物质特征。第10页1.2.3 统计指标假如经过对表1-1统计计算,可能得出以下统计结果: 学校总人数5000人 男生人数2600人 女生人数2400人 男女性别比1.0

5、8:1 平均身高172cm 平均体重62kg这些数据在统计学上都称为统计指标。统计指标就是反应总体数量特征概念和详细数值。通常,一个完整统计指标包含指标名称和指标数值两部分。第11页1.3 统计指标分类1按反应内容或数值表现形式划分按照其反应内容或其数值表现形式,可划分为总量指标、相对指标和平均指标。(1)总量指标:反应总体规模统计指标,通常以绝对数形式来表现,所以又称为绝对数。总量指标是人们认识总体起点,是计算其它统计指标基础。(2)相对指标:是两个总量指标之比,所以又称相对数。(3)平均指标:平均指标又称平均数,是总体在某一空间或时间上平均数量情况。第12页2按所反应数量特点与内容划分按照

6、其所反应数量特点和内容,可划分为数量指标和质量指标。(1)数量指标:反应总体范围广度、规模大小和数量多少指标。它表示事物外延量大小,通常有计量单位,用绝对数表示。其指标数值大小随总体范围大小而增减变动。(2)质量指标:反应总体质量、强度、经济效果等统计指标。它表示事物内涵量情况,通惯用相对数或平均数表示。其指标数值大小与总体范围大小没有直接关系。第13页1.3.1 总量指标总量指标是指统计汇总后得到含有计量单位统计指标,反应研究总体在一定时期或时点总规模、总水平或性质相同总体规模数量差异。按总量指标所反应时间情况来划分,总量指标能够分为时期指标和时点指标。(1)时期指标:是反应总体在一段时间内

7、累计总和。(2)时点指标:是反应总体在某一时点上状态总数。1时期指标与时点指标区分(1)性质相同时期指标数值能够相加,而时点指标相加则无意义。(2)同类时期指标数值大小与时期长短有直接关系,而时点指标则没有这种关系。(3)时期指标数值是经常登记取得,而时点指标则不是。第14页2指标与标志区分(1)标志是用于描述个体,指标是用于描述总体。(2)标志只是一个名称,不含数值(标志表现);指标既含名称又含数值。3指标与标志联络(1)含有对应关系。标志与指标名称往往是同一概念。(2)含有汇总关系。统计指标数值由标志表现汇总得来。(3)含有变换关系。伴随研究目标变换,原有总体转变为个体,对应统计指标名称也

8、就成为标志;反之亦然。第15页1.3.2 相对指标相对指标分为结构相对指标、对比相对指标、完成程度相对指标等。1结构相对指标结构相对指标又称结构相对数或比重指标,是在统计分组基础上,总体中某一组数值与总体指标数值比值,以说明总体内部组成情况,普通用百分数表示。第16页比如,表1-3为我国第二次农业普查农业生产经营户数量及组成表,其中第3列数据就是结构相对指标。表1-3 我国第二次农业普查农业生产经营户数量及组成第17页结构相对指标含有以下特点。(1)分子分母不能交换。(2)指标值1。(3)指标值之和1。惯用合格率、恩格尔系数都属于结构相对指标。第18页2对比相对指标任何事物都是现有共性特征,又

9、有个性特征,只有经过对比,才能分辨出事物性质、改变、发展规律。数据分析亦如此,对庞大数据做单独分析,通常极难发觉其意义,只有将不一样数据进行对比,才能发觉更多本质现象。这种分析数据方法就叫对比分析法。通常情况下,数据对比能够分成静态对比和动态对比。第19页(1)静态相对指标静态相对指标是指同一总体在相同时间下不一样组(部门、单位、地域)数据对比,通惯用比值、倍数、系数或百分数表示。静态相对指标有以下特点。 同一总体、同一指标、同一时间、不一样组数值对比。 分子、分母能够交换。第20页(2)动态相对指标动态相对指标是指同一总体在不一样时间下数据对比,以说明总体在不一样时间上发展改变情况,所以也叫发展速度,通惯用百分数表示。比如同比发展速度和环比发展速度。动态相对指标有以下特点。 同一总体、同一指标、不一样时间数值对比。 分子、分母不能够交换。第21页3完成程度相对指标完成程度相对指标是实际完成值与目标计划值进行对比,通惯用百分数表示。其计算公式为:第22页1.3.3 平均指标平均指标又叫平均数,是指反应总体各单位某一数量标志值在详细时间、地点、条件下到达普通水平综合指标。平均指标按计算和确定方法不一样,分为算术平均数和几何平

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论