第2章  概率论和统计学基础知识_第1页
第2章  概率论和统计学基础知识_第2页
第2章  概率论和统计学基础知识_第3页
第2章  概率论和统计学基础知识_第4页
第2章  概率论和统计学基础知识_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2章 概率论和统计学基础知识,若要利用Excel进行统计分析,需要以一定的概率论和统计学的基础知识为基础,便于完成更高层次的统计分析任务,本章将从概率基本理论开始,介绍各种随机变量的概率分布、各种统计量及其分布等知识,并介绍统计数据的来源和整理得相关内容。,2.1 概率论基本知识,概率论起源于16世纪与赌博有关的问题,发展至今主要研究事件发生的可能性,概率论的基础知识是理解统计知识的桥梁,要利用Excel进行统计分析,对概率论的掌握,在很大程度上决定了对统计知识的理解,因此,本书用一个小节专门介绍概率论最为基本的知识。,2.1.1 概率基本理论,2.1.2 离散型随机变量概率分布,下面就介绍几种常见的离散型随机变量的分布。1两点分布2二项分布3泊松分布4几何分布,2.1.3 连续型随机变量概率分布,2.2 统计学中的基本概念,在本小节中,会承接上节介绍统计学的基本知识,从而明确统计学的任务,理解统计学中的基本概念,了解统计中最基本的统计量及其计算方法,并对统计学中的基本分布函数进行阐述。掌握这些基本知识,便于对今后的统计任务进行理解和操作。,2.2.1 统计的概念及基本任务,统计学是一门研究客观事物数量方面的方法论科学,其研究对象是大量现象的数量方面。包括数量特征、数量关系、数量界限等。统计学的基本任务是通过收集、整理、分析观测大量随机现象所得的实验数据,来研究如何进行观测以及如何根据观测得到的统计资料,对被研究的随机现象的一般概念特征做出科学的推断。,2.2.2 总体与样本,分析一个事物的特征,往往需要了解描述事物不同性质的数据,要完全地了解这个事物,就需要对所有的数据进行了解,也就是了解事物性质的总体。但是,现实中并不是所有情况下都能够了解所有总体的,在这时,就可以通过分析总体的一部分性质来推断总体的性质,这一部分就是样本。关于样本和总体的定义,下面将一一介绍。1总体总体统计研究所确定的客观对象,是具有共同性质的许多单位组成的整体,总体既可以指客观事物本身,也可以是反映该事物某重要数量特征的一组数据的集合。该集合中的每个元素就是总体单位,即个体。根据个体的数量,总体可以分为无限总体和有限总体,前者含无限多个单位,后者蚝邢薷龅弧逡部梢缘贸觯芴寰哂幸韵铝礁鎏卣鳎同质性:总体中各个单位具有某种共同的性质。大量性:总体总是包含大量的单位。2样本样本是从总体中随机抽取部分单位所构成的集合体,必须取自所要研究的总体。从一个总体中可抽取许多个样本,这些样本的数值是不同的,也即存在着随机的差异。尽管如此,样本的选取仍要满足两个基本要求,即代表性和客观性。样本中包含的个体的个数称为样本容量。,2.2.3 常用统计量及其计算方法,2.3 常用的统计分布,在基础的统计任务中,统计量的计算只是一部分,还要明确各个统计量的统计规律及性质,在这方面运用最多的有分布、t分布和F 3个比较重要的分布函数,用来对样本的统计量进行估计、检验等,本小节会逐个介绍这3个分布。,2.3.1 2分布(卡方分布),2.3.2 t分布,2.3.3 F分布,1分位数2正态分布总体的抽样分布介绍,2.4 统计数据,有了统计学的基础知识作为统计工具,还需要统计数据作为统计工具实现其价值的前提。本节会介绍统计数据的来源和统计数据的大体分类,对统计数据进行大体了解,并介绍Excel中数据类型的表达情况。,2.4.1 数据的来源,统计数据的获取,首先要通过一定的测定方式产生原始信息,还要通过一定的统计调查方式,才能后将这些信息组合成为统计数据。统计调查就是使用明确的概念、方法和程序,以有组织、有条理的方式,从一个总体的部分或所有单元中收集感兴趣的指标信息,并将这些信息综合编辑成有用的简要形式的所有活动。统计调查可以科学地反映客观情况,为解决问题、制定政策或策略提供依据。可以说,调查是认识客观世界的一种手段,通过调查获取信息,对于了解现状,进行管理决策和探索未来发展均具有要意义。调查的组成形式一般有以下5种: 统计报表:是按照国家统一规定的表格形式、统一规定的指标内容,统一规定的报送程序和报送时间,由填报单位自下而上逐级提供统计资料的一种统计调查方式。我国各种的统计年鉴就属于统计报表的范畴。普查:普查是指一个国家或一个地区为详细地了解某项重要的国情、国力而专门组织的一次性、大规模的全面调查,其主要用来收集某些不能够或不适宜用定期的全面调查报表收集的信息资料,以搞清重要的国情、国力。人口普查是比较常见的普查。重点调查:重点调查是一种非全面调查,它是在调查对象中,选择一部分重点单位作为样本进行调查。重点调查的主要作用在于反映调查总体的主要情况或基本趋势。重点调查投入少、调查速度快、所反映的主要情况或基本趋势比较准确。典型调查:也是一种非全面调查,它是从众多的调查研究对象中,有意识地选择若干个具有代表性的典型单位进行深入、周密、系统地调查研究。可以在特定的条件下用于对数据的质量检查,了解与数字相关的生动具体情况。抽样调查:抽样调查是一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象做出估计和推断的一种调查方法。抽样调查,要按随机原则抽选样本,总体中每一个单位都有一定的概率被抽中,还可以用一定的概率来保证将误差控制在规定的范围之内。可以分为简单随机抽样、分层抽样、整体抽样、多阶段抽样等几种类型,其中简单随机抽样也称为单纯随机抽样,是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式,应用范围最广。,2.4.2 数据的整理,统计整理:就是对搜集得到的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的综合数据的工作过程,而且,对已整理过的资料(包括历史资料)进行再加工也属于统计整理。统计整理是整个统计工作和研究过程的中间环节,起着承前启后的作用,同时也是统计调查的继续,又是统计分析的基础,还是积累历史资料的必要手段。本着目的性、联系性、简明性三大原则,统计整理可以分为3类,分别是定期统计报表数据的整理、专题性统计数据的整理和历史统计数据的整理。数据整理的一般过程有以下5部组成:(1)对搜集到的资料进行全面审核,以确保统计资料符合统计研究目的的要求,资料准确无误,这是数据整理的起点、也是数据分析的重要环节。(2)根据研究目和统计分析的需要,选择整理的标志,并进行划类分组,这部分将在下一小节有所介绍。(3)在分组的基础上,将各项资料进行汇总,得出反映各组和总体数量特征的各种 指标。(4)统计资料的显示:即通过编制统计表和绘制统计图,将整理出的资料简捷明了、系统有序地显示出来。(5)对统计数据分门别类地系统积累。整理完毕的数据即可进行预处理工作及后续的分析。,2.4.3 数据的分组,根据社会经济现象的特点和统计研究的目的要求,按照某个重要标志(或几个标志)把总体划分为若干不同性质的组,称为统计分组。进行统计分组可以划分社会现象的不同类型、揭示社会现象的内部结构、分析社会现象之间的依存关系。分组时也要做到将所有数据全部分入各个组中,并且每个组中没有重复的数据。分组要有一定的分组标志,分组标志要符合统计研究的目的和要求,要选择最能说明事物本质特征的标志,还要考虑到现象所处的具体历史条件,在Excel中,数据的分组往往是根据行或列为分组标志进行区分的。分组的方法一般根据分组标志的性质分为属性分组和变量分组两种方法:属性分组的方法:是针对事物进行属性分组的方法,其组数的多少首先取决于事物本身的特点。对于有些事物构成比较复杂,组数可多可少的情况,就需要考虑统计研究任务的具体要求。人口统计时,性别比例的统计就属于属性分组方法。变量分组的方法:是按数量标志分组的方法,分组时各组数量界限的确定必须能反映事物质的差别,而且,应根据被研究的现象总体的数量特征,采用适当的分组形式,确定相宜的组距、组限。人口统计中的年龄结构计算应属于变量分组方法的应用范畴。,2.5 本章小结,本章介绍了概率论和数理统计的一般知识,明确了统计任务中经常会遇到的如数学期望、方差等统计量,还有统计中重要的3个抽样分布。这些基础的知识,需要深入理解,熟练掌握,才能轻松胜任

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论