《应用统计学》第一章_第1页
《应用统计学》第一章_第2页
《应用统计学》第一章_第3页
《应用统计学》第一章_第4页
《应用统计学》第一章_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章绪论引导案例大数据时代带来的大变革国际数据公司定义了大数据的特征:海量的数据规模、快速的数据流转、动态的数据体系、多样的数据类型和巨大的数据价值。仅从海量的数据规模来看,全球IP流量达到1EB所需的时间,在2001年需要1年,在2013年仅需1天,到2016年则仅需半天。全球新产生的数据年增40%,全球信息总量每两年就可翻番。而根据2012年互联网络数据中心发布的《数字宇宙2020》报告,2011年全球数据总量已达到1.87ZB(1ZB=10万亿亿字节),如果把这些数据刻成DVD,排起来的长度相当于从地球到月亮一个来回的距离,并且数据以每两年翻一番的速度飞快增长。预计到2020年,全球数据总量将达到35~40ZB。需要强调的是,所谓大数据并不仅仅是指海量数据,而更多的是指这些数据都是非结构化的、残缺的、无法用传统方法进行处理的数据。基于互联网技术而发展起来的大数据应用,将会对人们的生产过程和商品交换过程产生颠覆性的影响。大数据的本质是基于互联网基础的信息化应用,其真正的“魔力”在于信息化与工业化的融合,使工业生产效率得到大规模提升。肯尼思•库克耶和维克托•迈尔•舍恩伯格指出,数据出现了三大变化:第一,人们处理的数据从样本数据变成全部数据;第二,由于是全样本数据,人们不得不接受数据的混杂性,而放弃对精确性的追求;第三,人们通过对大数据的处理,放弃对因果关系的渴求,转而关注相互联系。这一切代表着人类告别总是试图了解世界运转方式背后深层原因的态度,而走向仅仅需要弄清现象之间的联系并利用这些信息来解决问题。我们急需拥有从各种数据中快速获得有价值的信息的能力,统计学就是培养这种能力的学科。第一节统计指数概述第三节统计学的基本概念第二节统计数据的类型第一节统计指数概述第三节统计学的基本概念第二节统计数据的类型一、统计与统计学的概念统计学是指收集、处理、分析、解释数据,并从数据中得出结论的科学。统计学是关于数据的科学,统计研究的是来自各领域的数据。大量观察法(一)二、统计学的研究方法所谓大量观察法,是指对所研究的事物的全部或足够多的数量进行观察的方法。社会现象或自然现象都受到各种社会规律或自然规律的相互交错作用的影响。在现象总体中,个别单位往往受偶然因素的影响,如果任选其中之一进行观察,其结果不足以代表总体的一般特征。只有观察全部或足够多的单位并加以综合,影响个别单位的偶然因素才会相互抵消,现象的一般特征才能显示出来。实验设计法(二)实验设计法是指根据统计研究的目的,事先设计合理的实验程序,在实验过程中排除可控因素的差异,显示出不可控(随机)因素的差异,使得收集到的统计数据符合统计分析方法的要求,以便有效地揭示客观现象的特征。实验设计法主要适用于工程技术、生物医药、心理学、教育学、管理学等领域的统计数据的收集。321与匹配原则随机化原则重复性原则统计分组法(三)统计分组法是指根据统计研究的目的和统计总体的内在特点,按一定的统计标志将总体划分为性质不同的组或类的方法。统计总体的变异性是统计分组的前提条件,由于研究现象本身的复杂性、差异性及多层次性,需要对研究现象进行分组或分类研究,以期在同质的基础上探求不同组或类之间的差异性。综合指标法(四)综合指标法是指运用各种统计指标来反映和研究客观总体现象的一般数量特征和数量关系的方法。统计研究现象的数量方面的特征是通过统计综合指标来反映的。通过综合指标的计算,可以显示出现象在具体时间和地点条件下的总量规模、相对水平、集中趋势、变异程度,并进一步从动态上研究现象的发展趋势和变化规律。如何最真实客观地记录、描述和反映所研究现象的数量特征和数量关系,是统计指标理论研究的一大课题。指数分析法(五)指数分析法主要用于描述和分析事物数量方面的相对变化程度。由于现象的总体非常复杂,发展变动受其构成要素变动的影响,而这些构成要素往往具有不同的性质而不可以直接相加,因此不能进行直接的比较观察。指数分析法正是通过同度量因素,把不能直接相加的要素转化为可以相加的现象总量,并计算出指数来反映复杂现象的总量的变动。另外,还可以对现象的各个构成要素进行因素分析,以显示它们的变动对总体变动的影响程度和方向。抽样推断法(六)统计学在研究现象的总体数量特征时,需要了解的总体对象的范围往往是很大的,有时甚至是无限的。而由于经费、时间和精力等各方面的原因,以致在客观上难以实现,往往只能对部分单位或有限单位进行计算和分析,根据局部观察结果来推断总体。统计模型法(七)在以统计指标反映所研究现象的数量特征的同时,还需要经常对相关现象之间的数量变动关系进行定量研究,以了解某一(些)现象数量变动与另一(些)现象数量变动之间的关系及变动的影响程度。统计模型法是综合指标法的扩展,是指根据一定的理论和假定条件,用数学方程模拟客观现象相互关系的一种研究方法。

统计学与数学的关系(一)三、统计学与其他学科的关系统计学与数学有着密切的关系。由于现代统计学用到了较多数学知识,研究理论统计学的人需要有较深的数学功底,应用统计方法的人也要具备良好的数学基础,这就给人造成了一种错觉,似乎统计学是数学的一个分支,这种理解是不妥当的。实际上,数学只是为统计理论和统计方法的发展提供了数学基础,而统计学的主要特征是研究数据;另一方面,统计方法与数学方法一样,并不能独立地直接研究和探索客观现象的规律,而是给各学科提供了一种研究和探索客观规律的数量方法。

统计学与会计学的关系(二)统计学和会计学都是具有典型计量特征的应用科学,二者都是以数据为语言,揭示其研究对象的特征,并实行有效的监督或管理。但是,会计学主要应用于社会经济领域,而统计学的应用领域更为广阔。社会经济的数量信息主要分为会计信息和统计信息两大类,会计学主要提供货币尺度方面或价值指标的信息,统计学则提供多种指标尺度方面的信息。但是,统计学中所处理的货币方面的信息,又是由会计学提供的;会计学中所用的实物量指标等,又是由统计学提供的。第一节统计指数概述第三节统计学的基本概念第二节统计数据的类型一、按所采用的计量尺度划分分类数据是指只能归于某一类别的非数字型数据,是对事物进行分类的结果。分类数据表现为类别,是用文字表述的。顺序数据是指只能归于某一有序类别的非数字型数据。顺序数据也是对事物进行分类的结果,且这些类别具有顺序。(一)分类数据(二)顺序数据数值型数据是指使用自然或度量衡单位对事物进行计量的结果,其结果表现为具体的数值。(三)数值型数据二、按数据收集方法划分观测数据是指通过调查或观测而收集到的数据。有关社会经济现象的统计数据几乎都是观测数据,这类数据是在没有对事物进行人为控制的条件下得到的。实验数据是指通过在实验中控制实验对象而收集到的数据。自然科学领域的数据大多都是实验数据,如生物实验数据、产品性能实验数据、药物实验数据等。随着实验方法在其他领域的拓展,心理学、教育学、经济学、管理学等领域也出现了实验数据。(一)观测数据(二)实验数据三、按描述对象与时间的关系划分截面数据是指在相同或近似相同的时间点上收集的数据,它所描述的是现象在某一时刻的变化情况。例如,2016年我国各地区的地区生产总值就是截面数据。时间序列数据是指在不同时间点上收集到的数据,它所描述的是现象随时间变化而变化的情况。例如,2010~2016年我国城镇和农村居民年平均收入就是时间序列数据。(一)截面数据(二)时间序列数据第一节统计指数概述第三节统计学的基本概念第二节统计数据的类型一、总体和样本总体(一)总体又称样本空间,是指包含研究者感兴趣的全部个体(数据)的集合。总体通常由所研究的许多个体组成,组成总体的每一个元素称为个体。总体是随着统计研究目的的不同而确定的不同集合。例如,研究某企业生产的十万只灯泡的使用寿命,那么这十万只灯泡就是一个总体,这十万只灯泡中的每一只为一个个体;如果想进行某种科学实验从而得到某个结论,那么所有的实验数据就是一个总体,而每一次的实验数据就是一个个体。样本(二)样本是与总体相对应的概念,几乎所有的统计理论和方法都是建立在样本之上,而统计实践研究现象的数据也总是由样本开始的。所谓样本,是指从总体中按随机原则抽取的一部分个体的集合,也称子样。构成样本的个体的数目称为样本量。从理论上看,样本可以大到与总体容量相同,也可以小到只包括一个个体。但在实践中,样本大小总是处于总体容量和1之间,因此,样本是一个来自总体的有限小总体。一般来说,当样本量达到30时,称为大样本;若样本量小于30,则称为小样本。总体和样本的关系(三)首先,总体是要观测的全部数据的集合,而样本是要观测的部分数据的集合。统计数据的规律性着眼于总体,但由于多数情况下不可能或没必要进行全面观测,所以只能从样本着手,期望通过样本的数据特征来认识总体的数据特征,也就是通过样本来研究总体。其次,样本是用来推断总体的。对样本进行观测的目的是要对总体特征进行估计和判断,即通常所说的用样本来估计和推断总体。最后,总体和样本的角色是可以改变的。根据不同的研究目的,一个总体也可以成为另一个研究意义上某个总体的一个样本。二、参数和统计量参数是用来描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。研究者所关心的参数主要有总体均值、总体标准差、总体比例等。在统计中,总体参数通常用希腊字母表示。例如,总体均值用表示,总体标准差用表示,总体比例用表示。

参数(一)统计量是用来描述样本特征的概括性数字度量,是根据样本数据计算出来的一些量,是样本的函数。研究者所关心的样本统计量有样本均值、样本标准差、样本比例等。在统计中,样本统计量通常用小写英文字母表示。例如,样本均值用表示,样本标准差用s表示,样本比例用p表示。

统计量(二)三、标志和指标每个个体都有许多独特的特征和属性,而标志就是说明个体特征和属性的名称。例如,A市一家民营企业作为个体,其企业性质、企业类型、生产能力、年产值、销售收入、职工人数、工资总额等都是标志。

标志(一)标志的分类11)按性质划分按性质划分,标志可分为品质标志和数量标志。品质标志:是说明个体属性特征的名称。品质标志只能用文字表示,而不能用数值表示。数量标志:是说明个体数量特征的名称。数量标志既可以用文字表示,也可以用数值表示。2)按总体中各单位表现划分按总体中各单位表现划分,标志可分为不变标志和可变标志。标志表现2标志表现是指在标志名称后面所表明的属性或数值。标志表现可分为品质标志表现和数量标志表现。因为数量标志表现都是用数值表示的,所以又称为标志值。例如,某职工的性别是“女”,婚姻状况是“已婚”,这里的“女”和“已婚”分别是品质标志“性别”和“婚姻状况”的属性。又如,某职工的年龄是20岁,则“20岁”就是数量标志“年龄”的数值表现。指标(二)指标的构成1单就指标本身而言,其由指标名称和指标数值两部分构成。由于社会经济现象中的事物都是具体的,都是在一定的地点、时间、条件下发生的,其量的表现就必然带有特定场合和特定历史的痕迹。所以,一个完整的统计指标除了包括指标名称和指标数值外,还应包括计量单位、时间范围、空间范围及计算方法等要素。指标的分类2(1)按对象性质划分按对象性质划分,统计指标可分为实体指标和行为指标。(2)按取值依据划分按取值依据划分,统计指标可分为客观指标和主观指标。(3)按功能划分按功能划分,统计指标可分为描述指标、评价指标和预警指标。(4)按内容划分按内容划分,统计指标可分为数量指标和质量指标。

标志与指标的关系(三)区别1(1)标志是说明个体特征的,而指标是说明总体特征的。(2)标志中的数量标志可以用数值表示,品质标志不能用数值表示;而所有的指标都是用数值表示的,不存在不能用数值表示的指标。(3)标志中的数量标志不一定经过汇总,可以直接取得;而指标是由数量标志汇总得来的。(4)标志一般不具备时间、地点等条件;而一个完整的统计指标一定要有时间、地点、范围。联系2(1)有许多统计指标的数值是从个体数量标志值汇总

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论