总体与样本讲稿_第1页
总体与样本讲稿_第2页
总体与样本讲稿_第3页
总体与样本讲稿_第4页
总体与样本讲稿_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、关于总体和样本第一张,PPT共二十九页,创作于2022年6月但是当时的统计, 只是对有关事实的简单记录和整理,从历史的典籍中人们不难发现许多关于钱粮、户口、地震、水灾等等的记载, 说明人们很早就开始了统计的工作. 到了十九世纪末二十世纪初,随着近代数学和概率论的发展, 才真正诞生了数理统计学这门学科.而没有在一定理论的指导下,作出超越这些数据范围之外的推断. 数理统计不同于一般的资料统计, 它更侧重于应用随机现象本身的规律性进行资料的收集、整理和分析.第二张,PPT共二十九页,创作于2022年6月数理统计基础 【数理统计简史】 相对于其它许多数学分支而言,数理统计是一个比较年轻的数学分支多数人

2、认为20世纪40年代克拉美(H.Carmer)的著作统计学的数学方法,使得1945年以前25年间英、美统计学家在统计学方面的工作与法、俄数学家在概率论方面的工作结合起来,从而形成数理统计这门学科数理统计有很多分支,但其基本内容为采集样本和统计推断两大部分发展到今天的现代数理统计学,已经历了各种历史变迁第三张,PPT共二十九页,创作于2022年6月 1. 近代统计学时期 18世纪末到19世纪,是近代统计学时期这一时期的重大成就是大数定律和概率论被引入统计学之后最小二乘法、误差理论和正态分布理论等相继成为统计学的重要内容这一时期有两大学派:数理统计学派和社会统计学派【数理统计简史】第四张,PPT共

3、二十九页,创作于2022年6月【数理统计简史】 数理统计学派始于19世纪中叶,代表人物是比利时的凯特莱(A.Quetelet,1796-1874),著有概率论书简社会物理学等,他主张用研究自然科学的方法研究社会现象,正式把概率论引入统计学,并最先用大数定律证明了社会生活中随机现象的规律性,提出了误差理论凯特莱的贡献,使统计学的发展进入个了一个新的阶段第五张,PPT共二十九页,创作于2022年6月 社会统计学派始于19世纪末,首创人物是德国的克尼斯(K. G. A. Knies),他认为统计学是一个社会科学,是研究社会现象变动原因和规律性的实质性科学各国专家学者在社会经济统计指标的设定与计算、指

4、数的编制、统计调查的组织和实施、经济社会发展评价和预测等方面取得了一系列的重要成果德国统计学家恩格尔(C.L.E.Engel,1821-1896)提出的“恩格尔”系数,美国经济学家库兹涅茨和英国经济学家斯通等人研究的国民收入和国内生产总值的核算方法等,都是伟大的贡献【数理统计简史】第六张,PPT共二十九页,创作于2022年6月 18世纪到19世纪初期,高斯从描述天文观测的误差而引进正态分布,并使用最小二乘法作为估计方法,是近代数理统计学发展初期的重大事件,对社会发展有很大的影响【数理统计简史】第七张,PPT共二十九页,创作于2022年6月用正态分布描述观测数据的应用是如此普遍,以至在19世纪相

5、当长的时期内,包括高尔顿(Galton)在内的一些学者,认为这个分布可用于描述几乎是一切常见的数据直到现在,有关正态分布的统计方法,仍占据着常用统计方法中很重要的一部分最小二乘法方面的工作,在20世纪初以来,经过一些学者的发展,如今成了数理统计学中的主要方法【数理统计简史】第八张,PPT共二十九页,创作于2022年6月 2. 现代统计学时期 从19世纪末到现在,是现代统计学时期这一时期的显著特点是数理统计学由于同自然科学、工程技术科学紧密结合并被广泛应用于各个领域而获得迅速发展各种新的统计理论和方法、尤其是推断统计理论与方法得以大量涌现【数理统计简史】第九张,PPT共二十九页,创作于2022年

6、6月 例如英国统计学家卡尔.皮尔逊(K.Pearson,1857-1936)的2分布理论,统计学家戈赛特(W.S.Gosset,1876-1937)的小样本t分布理论,统计学家费歇尔(R.A.Fisher,1890-1962)的F分布理论和试验设计方法,波兰统计学家尼曼(J.Neyman)和英国统计学家皮尔逊(E.S.Pearson,1895-1980)的置信区间理论和假设检验理论,以及非参数统计法、序贯抽样法、多元统计分析法、时间序列跟踪预测法都应运而生,并逐步成为现代统计学的主要内容【数理统计简史】第十张,PPT共二十九页,创作于2022年6月在20世纪初年,摆在数理统计学面前的重大问题是

7、建立一个理论(数学)上的框架。它不仅能包容已有的成果,而且还要对未来努力的方向起指引的作用,这个任务由以费歇尔为代表的一班统计学大师出色地完成了。因而他也被称为是“统计学的凯撒”。1940年,以克拉美的统计学的数学方法一书的出版为标志,数理统计学被公认为已形成为了一门严整的数学学科。 第十一张,PPT共二十九页,创作于2022年6月 现代统计学时期是数理统计发展的辉煌时期,数理统计不仅在理论上取得重大进展,其方法在生物、农业、医学、社会、经济、工业和科技等方面得到愈来愈广泛的应用另外,计算机的应用对统计学的产生了巨大的影响,需要大量计算的统计方法,有了计算机,这一切都不成问题【数理统计简史】第

8、十二张,PPT共二十九页,创作于2022年6月对象:抽样所获得的数据(带有随机性)数理统计学研究的对象及任务任务:如何有效地收集、整理和分析 数据,并对所观察的问题做出 推断或预测,为采取的决策提 供依据和建议。第十三张,PPT共二十九页,创作于2022年6月数理统计基础 在数理统计中,我们所研究的随机变量的分布往往是未知的,通过对随机变量进行多次独立重复的试验和观测,获取数据,利用实际观测数据研究随机变量的分布,对其分布函数、数字特征等进行估计和推断 本章作为数理统计基础,学习总体、样本、统计量与抽样分布等有关概念,以及有关正态总体的重要的抽样分布定理第十四张,PPT共二十九页,创作于202

9、2年6月国内外有关经典著作1. 统计学数学方法H. 克拉默著 1946年版数理统计最早著作2.数理统计引论陈希儒著 科学出版社 1981年版3.概率论与数理统计教程魏宗舒等编 高等教育出版社 1982年版第十五张,PPT共二十九页,创作于2022年6月第1章 基本概念与抽样调查第十六张,PPT共二十九页,创作于2022年6月 总体容量有限的称为有限总体, 总体 一个统计问题总有它明确的研究对象.1.总体研究对象的全体称为总体(母体),总体中每个对象称为个体.研究某批灯泡的质量总体考察国产 轿车的质量1 总体和样本 不过在统计研究中,人们关心总体仅仅是关心其每个个体的一项(或几项)数量指标和该数

10、量指标在总体中的分布情况. 该批灯泡寿命的全体就是总体 灯泡的寿命 每公里的耗油量所有国产轿车每公里耗油量的全体就是总体这时,每个个体具有的数量指标的全体就是总体. 称总体中所含个体的数目为总体容量, 总体容量无限的称为无限总体. 第十七张,PPT共二十九页,创作于2022年6月 那么, 此总体就可用描述其寿命的随机变量 X 或用其分布函数 F(x)表示. 因此在理论上可以把总体与概率分布等同起来.概率分布是刻划这种集体性质最适当的工具. 统计的任务,是根据从总体中抽取的样本, 去推断总体的性质. 由于我们关心的是总体中的个体的某项指标(如人的身高、体重,灯泡的寿命,汽车的耗油量),从另一方面

11、看:如研究某批灯泡的寿命时, 关心的数量指标就是寿命, 所谓总体的性质,无非就是这些指标值集体的性质. 我们用X和Y分别表示身高和体重,那么此总体就可用二维随机变量(X,Y)或其联合分布函数 F(x, y)来表示.总体概念的要旨: 总体就是一个概率分布 再如, 若研究某地区中学生的营养状况时, 关心的数量指标是身高和体重,第十八张,PPT共二十九页,创作于2022年6月 样本中所包含的个体数目称为样本容量.但是,一旦取定一组样本,得到的是 n 个具体的数 x1, x2, , xn , 按一定规则从总体中抽取若干个体进行观察试验以获得有关总体的信息. 为推断总体分布及各种特征, 从国产轿车中抽5

12、辆进行耗油量试验样本容量为 5 2. 样本样本是随机变量抽到哪 5 辆是随机的!容量为 n 的样本可以看作一 n 维随机变量(X1, X2, , Xn). 所抽取的部分个体称为样本. 这一抽取过程称为抽样, 称为样本(X1, X2, , Xn)的一组观测值,简称样本值 .第十九张,PPT共二十九页,创作于2022年6月 它要求抽取的样本X1, X2, , Xn 满足下面两点: 它可以用与总体同分布的 n 个相互独立的随机变量 X1, X2, , Xn 表示.2.代表性: Xi (i =1,2,n) 与所考察的总体 X 同分布. 为了使抽取的样本能很好地反映总体的信息,必须考虑抽样方法. 最常用

13、的一种抽样方法叫作简单随机抽样,1.独立性: X1, X2, , Xn 是相互独立的随机变量 ;抽样的目的是为了对总体进行统计推断,由简单随机抽样得到的样本称为简单随机样本, 今后, 说到 “X1, , Xn 是取自某总体的样本”时, 若不特别说明, 就指简单随机样本.则其简单随机样本的联合分布函数为F( x1, x2, , xn )= F(x1)F(x2)F(xn) 简单随机样本是应用中最常见的情形, 若总体 X 的分布函数为F(x), 若总体 X 的概率密度为 f (x),则其简单随机样本的联合概率密度为 第二十张,PPT共二十九页,创作于2022年6月 求样本(X1, X2, X3 )的

14、概率分布. 例1 设总体 X B(1, p), 即 P(X=x)= p x(1-p)1-x, X = 0 , 1 . 设 X1, X2, X3 为 X 的一个样本, 解 x i = 0, 1; i = 1, 2, 3 . (X1, X2, X3 )的分布律 P(X1= x1 , X2= x2 , X3= x3 )又 x1 + x2 + x3 =0, 1, 2, 3 , P(X1= x1 , X2= x2 , X3= x3 ) k = 0, 1, 2, 3 . 第二十一张,PPT共二十九页,创作于2022年6月【例】设总体X服从均值为1/2的指数分布,X1,X2,X3,X4为来自X的样本,求X1

15、,X2,X3,X4的联合概率密度和联合分布函数 解:X的概率密度为其分布函数为则X1,X2,X3,X4的联合概率密度为:第二十二张,PPT共二十九页,创作于2022年6月由于X的分布函数为X1,X2,X3,X4的联合分布函数为 第二十三张,PPT共二十九页,创作于2022年6月 比如我们从某班大学生中抽取 10 人测量身高, 得到 10 个数. 我们只能观察到随机变量取的值而见不到随机变量. 它们是样本取到的值而不是样本. 3. 总体、样本、样本值的关系总体(理论分布)? 样本 样本值 统计是从手中已有的资料 样本值, 去推断总体的情况 总体分布F(x)的性质. 总体分布决定了样本取值的概率规

16、律,也就是样本取到样本值的规律,事实上, 我们抽样后得到的资料都是具体的、确定的值. 因而可以由样本值去推断总体. ? ? ? 是总体的代表, 含有总体的信息分散、复杂 样本是联系二者的桥梁 第二十四张,PPT共二十九页,创作于2022年6月其中 已知, 未知 , 则称 g(x1, , xn)是一个统计量. 一个有效的方法就是构造一些样本的函数, 若样本函数 g(x1, , xn)中不含任何未知参数, 由样本值去推断总体情况, 需要对样本值进行“加工”, 1. 统计量 这种不含任何未知参数、完全由样本决定的量称为统计量 通过样本函数把样本中所含的(某一方面)的信息集中起来.定义 设X1, X2

17、, , Xn 是来自总体 X 的容量为 n 的样本, 样本的函数例2 设 X1, X 2, X3 是取自正态总体 X ( , 2) 的一个样本, 问下列样本函数中哪些是统计量, 那些不是? X1 , X2+1, (X1 + X2 + Xn )/3 , Max X1, X2, X3 , 我们主要研究两种基本的统计量: 样本矩 和 顺序统计矩 2 统计量第二十五张,PPT共二十九页,创作于2022年6月几个常见的统计量 样本均值样本方差反映了总体均值的信息它反映了总体方差的信息样本 k 阶原点矩样本 k 阶中心矩 k=1,2,它反映了总体 k 阶矩的信息反映了总体 k 阶中心矩的信息并称他们相应的观测值 样本标准差它反映了总体标准差的信息 k=1,2,仍分别为: 样本均值、样本方差、样本标准差、样本 k 阶原点矩、样本 k 阶中心矩

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论