经典统计学课件_第1页
经典统计学课件_第2页
经典统计学课件_第3页
经典统计学课件_第4页
经典统计学课件_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数 理 统 计 学 开课院系:统计学院 教师: 赵煜E-mail: 教 材概率论与数理统计(第三版)茆诗松 周纪芗 编著 中国统计出版社 参考书概率论与数理统计陈希孺 编著 科学出版社参考书概率论与数理统计盛骤等 编著 高等教育出版社参考书概率论与数理统计李贤平等 编著 复旦大学出版社学习要求1、本课程属于专业基础课开蒙领航.2、课程成绩由两部分组成:平时成绩与期终考试成绩.其中,平时成绩占30%;期终考试成绩占70%.3、平时成绩包括考勤成绩、作业(实践)成绩与期中成绩,实践能力突出的同学可享总评直接加分的奖励. 4、强调学习态度,“师父领进门,修行在个人”.第一章 绪论1.1 关于统计学1

2、.3 统计学基本概念1.2 统计数据的类型一、统计数据与统计学(一)神马不都是浮云,可以是统计数据新住房的销售速度是每年703000套.原油的平均价格是每桶42.37美元.失业率下降到5.9%.通用汽车37%的销售额来自于北美地区.道-琼斯工业股平均指数接近8909.43点.主要航空公司中1997年最好的正点记录是西北航空公司81.9%的正点率.When you analyze any topic, you are involved in statistics.(二)什么是统计学? 统计学是一门收集、整理、描述、显示和分析数据的方法科学,其目的是探索数据内在的数量规律性,以达到对客观事物的科学

3、认识“数据的科学”.Statistics: the science of collecting, analyzing, presenting, and interpreting data. (不列颠百科全书)统计学者据数计统数据内在的数量规律性巧妇难为无米炊之统计数据的内在规律 正常条件下新生婴儿的性别比为107:100; 投掷一枚均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现16点的频率各为1/6; 农作物的产量与施肥量之间存在相关关系.1、统计学的含义 统计的含义包括三个方面: 统计实践工作 统计数据 统计学统计实践活动(统计工作) 就是人们认识客观事物,通过试验或调查搜集有

4、关数据,并加以整理、归纳和分析,而后对事物规律性的数量表现做出统计上的解释. 统计实践活动可分为三阶段:统计调查、统计整理、统计分析统计数据 是统计实践活动所得的成果. 统计数据的要求:客观性、准确性、及时性统计是以数据为食物的动物 统计的本业是消化数据,并产生有营养的结果.它的本质,和母牛相差不多. Grass Cow MilkData StatisticsInformation 2、无处不在的统计 用统计识别作者 17871788年,三位作者Alexander Hamilton,John Jay和James Madison为了说服纽约人认可宪法,匿名发表了著名的85篇论文.这些论文中的大多

5、数作者已经得到了识别,但是,其中的12篇论文的作者身份引起了争议. 通过对不同单词的频数进行统计分析,得出的结论是,James Madison最有可能是这12篇论文的作者. 现在,对于这些存在争议的论文,认为James Madison是原创作者的说法占主导地位,而且几乎可以肯定这种说法是正确. 用统计识别作者 1981年,首届国际红楼梦研讨会在美国召开,威斯康星大学讲师陈炳藻独树一帜,宣读了题为从词汇上的统计论红楼梦作者的问题的论文.他从字、词出现频率入手,通过计算机进行统计、处理、分析,对红楼梦后40回系高鹗所作这一流行看法提出异议,认为120回均系曹雪芹所作. 用简单的描述统计量得到一个重

6、要发现 费舍(RAFisher)在1952的一篇文章中举了一个例子,说明如何由基本的描述统计量的知识引出一个重要的发现.20世纪早期,哥本哈根卡尔堡实验室的施密特(J.Schmidt)发现不同地区所捕获的同种鱼类的脊椎骨和鳃线的数量有很大不同;甚至在同一海湾内不同地点所捕获的同种鱼类,也发现这样的倾向. 然而,鳗鱼的脊椎骨的数量变化不大.施密特从欧洲各地、冰岛、亚速尔群岛以及尼罗河等几乎分离的海域里所捕获的鳗鱼的样本中,计算发现了几乎一样的均值和标准偏差值.由此,施密特推断所有各个不同海域内的鳗鱼是由海洋中某公共场所繁殖的.后来名为“戴纳(Dana)”的科学考察船在一次远征中发现了这个场所.

7、你相信这样的一些统计结论吗?吸烟对健康是有害的,吸香烟的男性减少寿命2250天.不结婚的男性会减少寿命3500天,不结婚的女性会减少寿命1600天.身体超重30%会使寿命减少1300天.每天摄取500毫升维生素C,生命可延长6年.身材高的父亲,其子女的身高也较高.第二个出生的子女没有第一个聪明,第三个出生的子女没有第二个聪明,依此类推学生们在听了莫扎特钢琴曲10分钟后的推理测试会比他们听10分钟娱乐磁带或其他曲目做得更好.上课坐在前面的学生平均考试分数比坐在后面的学生高.练就一双统计的慧眼吧!2010年3月9日,某学者利用“Google” 对互联网进行搜索,得到的结果是:包含 “统计”这一词汇

8、的网页高达269,000,000项.在诺贝尔经济学获奖者中,三分之二以上的研究成果与统计和定量分析有关.因此,著名经济学家萨缪尔森在其经典的教科书,经济学12版中特别提到:“在许多与经济学有关的学科中,统计学是特别重要的” .美国杜邦公司的总经理理查德曾经指出“现代公司在许多方面是根据统计来行事的.”(转引自马夸德特谈统计学家的重要作用,统计教育1994年第3期) .美国前总统布什的年薪达到40万美元,在各国元首中名列首位,但根据美国工作等级年鉴一书的排名,总统一职并未进入最好工作之列.根据该书的统计,在美国,工作环境最好的工作是:统计学家. (转引自2002年3月7日扬子晚报) 这是事实数量

9、性:统计数据是客观事物量的反映.总体性:统计的数量研究是对现象总体中各单位普遍存在的事实进行大量观察和综合分析.变异性:总体各单位的特征表现存在着差异,而且这些差异并不是事先可以预知的. 3、统计研究对象的特点: 每一个个体都是那么地鲜活,可是,记住,作为统计学者,我们更关注总体的普遍特征,或者,我们关注总体中的个体差异是否到了“难以容忍”的地步.(三)统计学的应用领域企业发展战略产品质量管理市场研究财务分析经济预测人力资源管理呵呵有数据的地方就有统计学的用武之地!(二)统计学的近代时期(18世纪末19世纪末)1、数理统计学派 代表人物:拉普拉斯、凯特勒(被称为统计学之父)2、社会统计学派 代

10、表人物:尼克斯、恩格尔、梅尔(三)统计学的现代时期(20世纪初至今)戈赛特提出了小样本t统计量;费希尔提出了F统计量、方差分析等方法;奈曼和皮尔逊提出了置信区间和假设检验;统计学的主流以描述统计学转为推断统计学.60年代后,统计学的发展有三个明显趋势:1统计学依赖和吸收数学更多;2以统计学为基础的边缘学科不断形成;3与计算机技术相结合,应用范围更广,作 用更大.(一)统计研究基本过程1收集数据:取得数据2处理数据:图表展示 3分析数据:利用统计方法分析数据4数据解释:结果的说明5得到结论:从数据分析中得出客观结论三、统计学研究过程与方法统计研究基本过程收集数据(取得数据)整理数据(处理数据)解

11、释数据(结果说明)分析数据(研究数据)实际问题1、描述统计和推断统计 描述统计是收集数据,然后用图形、表格和概括性的数字对数据进行描述的统计方法. 推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法.(统计学的核心) (二)数据分析一般方法2、数据分析一般方法 根据数据容量(数据所包含信息量),可选用相应统计分析方法全部数据描述统计结 论部分数据描述统计推断统计描述统计方法统计学概论推断统计基础统计实践Excel与Spss的初步应用(三)本课程内容安排 任何一门科学,随着人们对它的研究逐步深入,总是在不断地发展与进步。由于研究人员观察的角度不同,研究的重点不同,必然会出现

12、各个相互联系而又有区别的分支,统计学也不例外,大致有以下几种分类:四、统计学研究分支(一)按统计研究的发展阶段划分描述统计学与推断统计学 描述统计学研究所搜集数据的合理归整与有效表达; 推断统计学研究如何利用部分数据来推断全局情况; 描述统计学是统计学的基础,而推断统计学则是统计学的核心.(二)按统计研究的内容侧重划分理论统计学与应用统计学 以概率论为基础,从理论上分析并构建随机现象的有效研究工具,这属于理论统计学,一般归于数学学科; 将统计学的基本原理应用于各个领域可形成各种各样的应用统计学; 理论统计学指导应用统计学,而应用统计学通过具体领域对理论的实践,反过来又促进理论统计学的进一步发展

13、. 在统计实践中常常会遇到一些新问题,使原有的统计方法不适应,需要统计学家针对新问题去建立一个与实际情况相适合的统计模型,创造新的统计方法去分析,这就要靠统计理论来指导. 应用统计学包括一整套统计分析方法,有的是般性的统计方法,它适用于各个领域,如参数估计、假设检验、方差分析、相关与回归等;有的则是某一专业领域中特有的分析方法,例如经济统计学中的指数分析法等.1收集数据环节:抽样调查:社会科学领域实验设计:自然科学领域2整理数据环节:描述统计(探索性数据分析)(三)按统计研究的环节划分每一环节又有不同分类3分析数据环节:(1) 与特定的统计推断形式有关的参数估计和假设检验;(2) 与特定的统计

14、观点有关的贝叶斯统计和统计决策理论;(3) 与特定的理论模型或样本结构有关的非参数统计、多元统计分析、相关分析、回归分析、方差分析、序贯分析、时间序列分析和随机过程统计.推断统计学抽样前抽样后抽样技术试验设计假定不同信息不同数据不同参数统计学非参数统计学经典统计学贝叶斯统计学多元统计分析时间序列分析推断统计学内容体系宏观应用领域:如经济统计学、生物统计学、医学统计学、气象统计学、地质统计学、教育统计学、经济计量学、社会计量学、政治计量学、语言计量学、历史计量学等。这类分支学科所讨论的是统计方法在某一特定学科中的应用.(四)按统计研究的应用领域划分分支众多微观应用领域:是一些针对特殊的应用问题而

15、发展起来的分支学科,如产品抽样检验、可靠性统计、统计质量管理等.这类分支学科都不涉及或很少涉及任何一种专门学科的知识,但一般需要考虑数据的收集和统计推断两方面的问题.五、统计学和其他学科的关系数学与统计学:数学与统计学都是研究数量规律的,都要利用各种公式进行运算。数学中的概率论,为统计学提供了数量分析的理论基础。统计学中的理论统计学以抽象的数量为研究对象,其大部分内容也可以看作是数学的分支.统计学与数学的区别从研究对象看,数学以最一般的形式研究数量的联系和空间形式.统计学特别是应用统计学则总是与客观的对象联系在一起的.从研究方法看,数学主要是逻辑推理和演绎论证的方法.而统计本质上是归纳的方法.

16、统计学家特别是应用统计学家需要深入实际,进行调查或实验去取得数据,研究时不仅要运用统计的方法,而且还要掌握某一专门领域的知识.统计学与相关的实质性学科如经济学等,有密切的联系.统计学是开展经济研究不可或缺的重要工具.通过统计的实证研究,可以帮助人们认识有关的数量规律,同时检验经济学理论的真实性和完善程度.经济学等实质性学科对经济统计学起着重要的指导作用.不仅统计指标的设定离不开实质性学科的指导,而且应用统计方法也在很大的程度上受所研究对象性质的影响.统计学与相关实质性学科的区别.实质性学科研究该领域现象的本质关系并对有关规律作出合理的解释和论证.而统计学只是为实质性学科研究和认识数量规律提供专

17、门的方法和工具,并不直接对规律产生的原因和机理作进一步的分析.Thank you,see you next time! 1.2 统计数据的类型一、对统计数据的理解二、统计数据的分类一、对统计数据的理解对现象进行计量的结果; 不是指单个的数字,而是由多个数据构成的数据集;不仅仅是指数字,它可以是数字的,也可以是文字的.什么是统计数据?统计数据的分类按计量尺度分类的数据顺序的数据数值型数据按时间状况截面的数据时序的数据按收集方法观察的数据试验的数据二、统计数据的分类(一)按计量尺度划分的数据 定类数据定性数据: 定序数据 定距数据定量数据:数值型数据 定比数据定类数据(categorical da

18、ta) 只能归于某一类别的非数字型数据对事物进行分类的结果,数据表现为类别,用文字来表述例如,人口按性别分为男、女两类定序数据(rank data) 只能归于某一有序类别的非数字型数据对事物类别顺序的测度,数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品数值型数据(metric data) 按数字尺度测量的观察值结果表现为具体的数值,对事物的精确测度例如:身高为175cm、168cm、183cm 温度(二)按收集方法划分的数据 直接数据观察数据: 间接数据 实验数据:直接数据 观察数据(observational data) 通过调查或观测而收集到的数据在没有对事物人为控

19、制的条件下而得到的有关社会经济现象的统计数据几乎都是观测数据实验数据(experimental data) 在试验中控制试验对象而收集到的数据比如,对一种新药疗效的试验,对一种新的农作物品种的试验等自然科学领域的数据大多数都为试验数(三)按时间状况划分的数据 横剖面数据(静态数据) 纵剖面数据(动态数据) 动态数据(time series data) 在不同时间上收集到的数据描述现象随时间变化的情况比如,2000年至2005年国内生产总值数据静态数据(cross-sectional data) 在相同或近似相同的时间点上收集的数据描述现象在某一时刻的变化情况比如,2005年我国各地区的国内生产

20、总值数据1.3 统计学基本概念一、变量(指标)二、总体、个体与样本三、统计量一、变量(指标)广义地说,变量就是可变的量;变量包括定性变量与数值变量;变量是说明现象某种特征的概念,其特点是从一次观察到下一次观察结果会呈现出差别或变化. 如“商品销售额”、“受教育程度”、“产品的质量等级”等都是变量.变量的具体取值称为变量值.比如商品销售额可以是20万元、30万元、50万元等等,这些数字就是变量值.1、变量(variable) 统计数据就是统计变量的某些取值.2、统计数据与变量3、变量的分类根据取值特点,变量可以分为以下几种类型:定性变量定量变量离散变量连续变量确定性变量随机变量经验变量理论变量研

21、究对象的全体称为总体(母体);总体中所包含的个体的个数称为总体容量.总体中每个成员称为个体;二、总体、个体与样本(一)总体与总体分布1、总体、个体、总体容量总体可以包含有限个个体,也可以包含无限个个体.有限总体在个体相当多的情况下,可以作为无限总体进行研究.2、总体的分类有限总体与无限总体总体特征:同质性、大量性、差异性.总体可以是具体事物的集合.如一批产品;也可以是关于事物的度量数据集合,如长度测量. 总体中的个体,应当有共同的可观察的特征.该特征与研究目的有关.3、总体的特点【例如】总体个体特征一批产品每件产品等级一批灯泡每个灯泡寿命一年的日平均气温每天日平均气温 度数数轴上某一线段 线段

22、中每一点 坐标一批彩票每张彩票号码 人们感兴趣的是总体的某一个或几个数量指标的分布情况.每个个体所取的值不同,但它按一定规律分布. 由于每个个体的出现是随机的,所以相应的数量指标的出现也带有随机性.从而可以把这种数量指标看作一个随机变量X,因此随机变量X的分布就是该数量指标在总体中的分布. 总体就可以用一个随机变量或其概率分布来描述.因此在理论上可以把总体与概率分布等同起来.4、总体分布 【例如】研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量X表示,或用其分布函数F(x)表示.某批灯泡的寿命总体 寿命 X 可用一概率(指数)分布来刻划 鉴于此,常用随机变量的记号或用

23、其分布函数表示总体.如记总体X或总体F(x).寿命总体X是指数分布总体 类似地,在研究某地区中学生的营养状况时,若关心的数量指标是身高和体重,我们用X 和Y 分别表示身高和体重,那么此二维总体就可用二维随机向量(X,Y)或其联合分布函数 F(x,y)来表示.统计中,总体这个概念的要旨是总体就是一个概率分布.5、总体分布中的参数(parameter)描述总体分布特征的概括性数字度量,是研究者想要了解的总体的某种特征值所关心的参数主要有总体均值()、标准差()、总体比例()等与概率论中分布的“参数 ”含义相同在统计推断中,总体分布一般是未知的,或总体分布已知,而分布中所含参数未知.(二)样本与样本分布 为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为“抽样”,所抽取的部分个体称为样本.样本中所包含的个体数目称为样本容量.1、抽样、样本、样本容量 【例如】从国产轿车中抽5辆进行耗油量试验,抽到哪5辆是随机的进行.选取样本是为了从样本的特征对总体特征做出估计和推断;抽样必须尽可能多地反映总体的特征;最常用的一种抽样叫作“简单随机抽样”,其特点:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论