概率论 第六章_第1页
概率论 第六章_第2页
概率论 第六章_第3页
概率论 第六章_第4页
概率论 第六章_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

概率论第六章第1页,共63页,2023年,2月20日,星期一第六章样本及抽样分布引言随机样本抽样分布第2页,共63页,2023年,2月20日,星期一本章转入课程的第二部分数理统计数理统计的特点是应用面广,分支较多.社会的发展不断向统计提出新的问题.计算机的诞生与发展,为数据处理提供了强有力的技术支持,数理统计与计算机的结合是必然的发展趋势.引言第3页,共63页,2023年,2月20日,星期一学习统计无须把过多时间化在计算上,可以更有效地把时间用在基本概念、方法原理的正确理解上.

国内外著名的统计软件包:SAS,SPSS,MATLAB,STAT等,都可以让你快速、简便地进行数据处理和分析.第4页,共63页,2023年,2月20日,星期一从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等等的记载,说明人们很早就开始了统计的工作.但是当时的统计,只是对有关事实的简单记录和整理,而没有在一定理论的指导下,作出超越这些数据范围之外的推断.第5页,共63页,2023年,2月20日,星期一到了十九世纪末二十世纪初,随着近代数学和概率论的发展,才真正诞生了数理统计学这门学科.数理统计学是一门应用性很强的学科.它是研究怎样以有效的方式收集、整理和分析带有随机性的数据,以便对所考察的问题作出推断和预测,直至为采取一定的决策和行动提供依据和建议.第6页,共63页,2023年,2月20日,星期一目前地震预测研究有3种不同的思路:①地震地质。②地震统计。对过去已发生的地震,运用数理统计方法,从中发现地震发生的规律,特别是时间序列的规律,根据过去以推测未来。此法把地震问题归结为数学问题。因需要对大量地震资料作统计,研究的区域往往过大,所以判定地震的地点有困难,而且外推常常不准确。③地震前兆。第7页,共63页,2023年,2月20日,星期一数理统计不同于一般的资料统计,它更侧重于应用随机现象本身的规律性进行资料的收集、整理和分析.由于大量随机现象必然呈现出它的规律性,因而从理论上讲,只要对随机现象进行足够多次观察,被研究的随机现象的规律性一定能清楚地呈现出来.但客观上只允许我们对随机现象进行次数不多的观察试验,也就是说,我们获得的只是局部观察资料.第8页,共63页,2023年,2月20日,星期一在概率论中所研究的随机变量,它的分布都是假设已知的,在这一前提下去研究它的性质、特点和规律性,例如求出它的数字特征,讨论随机变量函数的分布,介绍常用的各种分布等。而在数理统计中的随机变量,它的分布是未知的,或者不完全知道,人们通过对所研究的随机变量进行重复、独立的观察,得到许多观察值,对这些数据进行分析,从而对随机变量的分布作出种种判断。第9页,共63页,2023年,2月20日,星期一

现实世界中存在着形形色色的数据,分析这些数据需要多种多样的方法.

因此,数理统计中的方法和支持这些方法的相应理论是相当丰富的.概括起来可以归纳成两大类:

参数估计──根据数据,用一些方法对分布的未知参数进行估计.

假设检验──根据数据,用一些方法对分布的未知参数进行检验.

它们构成了统计推断的两种基本形式.这两种推断渗透到了数理统计的每个分支.第10页,共63页,2023年,2月20日,星期一6.1随机样本总体和样本第11页,共63页,2023年,2月20日,星期一在数理统计中,不是对所研究的对象全体(称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断.数理统计方法具有“部分推断整体”的特征.第12页,共63页,2023年,2月20日,星期一

实际上,我们真正关心的并不是研究对象本身,而是其某项数量指标.

比如某家工厂的一种产品的使用寿命这样一项数量指标.1.总体某批灯泡的寿命该批灯泡寿命的全体就是总体国产轿车每公里的耗油量国产轿车每公里耗油量的全体就是总体第13页,共63页,2023年,2月20日,星期一对研究对象上的某项数量指标进行观察。试验的全部可能的观察值称为总体.

这些值不一定各不相同(可能重复),数目上也不一定有限.

每一个可能的观察值称为个体.

总体中所包含的个体的个数称为总体的容量.总体有限总体无限总体第14页,共63页,2023年,2月20日,星期一例1研究某地区N个农户的年收人.

在上面的例子中,总体是很直观的,是看得见摸得着的.但是客观情况并不总是这样.注意总体指他们的年收入的N个数字.例2用一把尺子去量一个物体的长度.总体应该理解为一切所有可能的测量值的全体.第15页,共63页,2023年,2月20日,星期一

对一个总体,如果我们用X表示它的数量指标,那么X的值对不同的个体取不同的值.因此,如果我们随机地抽取个体,则X的值也就随着抽取的个体的不同而不同.

所以X是一个随机变量!2、总体的分布既然总体是随机变量X,自然就有其概率分布.我们把X的分布称为总体的分布.

总体的特性是由总体分布来刻画的.

因此,我们常把总体和总体分布视为同义语.第16页,共63页,2023年,2月20日,星期一

例l中,若农户年收入以万元计,

假定N户中收入X为以下几种取值:0.5,0.8,l,1.2和1.5.

取这些值的农户个数分别为:n1,n2,n3,n4,n5,(这里n1+n2+n3+n4+n5=N).例3(例l续)

则总体X的分布为离散型分布,其分布律为:第17页,共63页,2023年,2月20日,星期一例如:研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量X表示,或用其分布函数F(x)表示.

寿命X可用指数分布来刻划鉴于此,常用随机变量的记号或用其分布函数表示总体.

如说总体X或总体F(x).某批灯泡的寿命…总体

寿命总体是指数分布总体第18页,共63页,2023年,2月20日,星期一

类似地,在研究某地区中学生的营养状况时,若关心的数量指标是身高和体重,我们用X和Y分别表示身高和体重,那么此总体就可用二维随机变量(X,Y)或其联合分布函数F(x,y)来表示.第19页,共63页,2023年,2月20日,星期一总体分布一般是未知,或只知道是包含未知参数的分布,为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为“抽样”,所抽取的部分个体称为样本.样本中所包含的个体数目称为样本容量.3.样本从国产轿车中抽5辆进行耗油量试验样本容量为5第20页,共63页,2023年,2月20日,星期一当n次观察一经完成,得到n个具体的数x1,x2,…,xn,称为样本X1,…,Xn的一次观察值,简称样本值

.1.代表性:X1,X2,…,Xn中每一个与所考察的总体有相同的分布.2.独立性:X1,X2,…,Xn是相互独立的随机变量.对总体X在相同的条件下,进行n次重复、独立观察,其结果依次记为X1,X2,…,Xn,这样得到的随机变量X1,X2,…,Xn是来自总体X的一个简单随机样本,与总体随机变量具有相同的分布.n是样本的容量.这种抽样,叫作“简单随机抽样”,其特点:第21页,共63页,2023年,2月20日,星期一对有限总体,采用放回抽样可得简单随机样本,但放回抽样使用起来不方便,当个体总数N比要得到的样本的容量n大得多时,在实际中可将不放回抽样近似当作放回抽样来处理.对无限总体,因抽取一个个体不影响它的分布,所以总是采用不放回抽样.第22页,共63页,2023年,2月20日,星期一定义:设X是具有分布函数F的随机变量,若X1,X2,…,Xn是具有同一分布函数的、相互独立的随机变量,则称X1,X2,…,Xn为从分布函数F(或总体F、或总体X)得到的容量为n的简单随机样本,简称样本,它们的观察值x1,x2,…,xn称为样本值,又称为X的n个独立的观察值.

简单随机样本是应用中最常见的情形,今后,当说到“X1,X2,…,Xn是取自某总体的样本”时,若不特别说明,就指简单随机样本.第23页,共63页,2023年,2月20日,星期一

既然样本X1,X2,,Xn

被看作随机变量,自然就需要研究它们的分布.4.样本的分布=F(x1)F(x2)…F(xn)

若总体的分布函数为F(x)、概率密度函数为f(x),则其简单随机样本的联合分布函数为其简单随机样本的联合概率密度函数为=f(x1)f(x2)…f(xn)

第24页,共63页,2023年,2月20日,星期一

假设某大城市居民的收入服从正态分布N(,2),其概率密度函数为:

例5设X1,X2,,Xn是来自总体的一个样本.则Xi∼N(,2),i=1,2,,n.于是样本X1,X2,,Xn的联合概率密度为第25页,共63页,2023年,2月20日,星期一事实上我们抽样后得到的资料都是具体的、确定的值.如我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本.我们只能观察到随机变量取的值而见不到随机变量.4.总体、样本、样本值的关系第26页,共63页,2023年,2月20日,星期一总体(理论分布)?样本样本值统计是从手中已有的资料—样本值,去推断总体的情况---总体分布F(x)的性质.总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.样本是联系二者的桥梁第27页,共63页,2023年,2月20日,星期一休息片刻继续下一讲第28页,共63页,2023年,2月20日,星期一6.2抽样分布统计量与经验分布函数统计三大抽样分布几个重要的抽样分布定理课堂练习布置作业第29页,共63页,2023年,2月20日,星期一由样本值去推断总体情况,需要对样本值进行“加工”,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来.1.统计量这种不含任何未知参数的样本的函数称为统计量.它是完全由样本决定的量.一、统计量与经验分布函数第30页,共63页,2023年,2月20日,星期一定义:设X1,…,Xn

是来自总体X的一个样本,g(X1,…,Xn

)是X1,…,Xn的函数,若g中不含未知参数,则称g(X1,…,Xn)是总体X的一个统计量.设X1,…,Xn

是来自总体X的一个样本,x1,…,xn

是样本X1,…,Xn的一个观察值,则

g(x1,…,xn

)是统计量g(X1,…,Xn)的观察值.例:设X1,…,Xn

是总体X的一个样本,X~N(m,s2),令T=X1-,若为已知的,则T为统计量;若未知,T就不是统计量.第31页,共63页,2023年,2月20日,星期一几个常用的统计量及其观察值:1.样本均值2.样本方差样本标准差它反映了总体均值的信息它反映了总体方差的信息第32页,共63页,2023年,2月20日,星期一3.样本k阶原点矩4.样本k阶中心矩它反映了总体k阶矩的信息它反映了总体k阶中心矩的信息第33页,共63页,2023年,2月20日,星期一统计量的观察值第34页,共63页,2023年,2月20日,星期一结论:若总体X的k阶原点矩存在,则当n趋于∞时证明:辛钦定理及依概率收敛的序列的性质.第七章矩估计法的理论根据第35页,共63页,2023年,2月20日,星期一经验分布函数——是与总体X的分布函数F(x)相应的统计量.设X1,X2,…,Xn,是总体F的一个样本,令S(x)表示X1,X2,…,Xn中不大于x的随机变量的个数.定义经验分布函数Fn(x)为:对于一个样本值x1,x2,…,xn,经验分布函数Fn(x)的观察值仍记为Fn(x).

2.经验分布函数第36页,共63页,2023年,2月20日,星期一例1:设总体F具有一个样本1,2,3,则经验分布函数F3(x)的观察值为例2:若样本值为1,1,2,则经验分布函数F3(x)的观察值为第37页,共63页,2023年,2月20日,星期一一般地,设x1,x2,…,xn,是总体F的一个容量为n的样本值,要求经验分布函数的观察值.首先将x1,x2,…,xn,按由小到大的顺序排列,并重新编号,设为x(1)≤x(2)≤…≤x(n),则经验分布函数Fn(x)的观察值为,对不同的样本值,得到的经验分布函数不同.但当样本容量较大时,经验分布函数Fn(x)是总体分布函数F(x)的良好近似.第38页,共63页,2023年,2月20日,星期一

统计量的分布称为抽样分布。数理统计中常用到来自正态总体的三个分布:

2—分布、t—分布和F—分布。第39页,共63页,2023年,2月20日,星期一1.定义:

设X1,X2,…,Xn相互独立,都服从正态分布N(0,1),则称随机变量:

所服从的分布为自由度为

n

的2分布.二、三大抽样分布记为2—分布第40页,共63页,2023年,2月20日,星期一2.2—分布的密度函数f(y)曲线第41页,共63页,2023年,2月20日,星期一3.分位点设X

~2(n),若对于:0<<1,存在满足则称为2(n)分布的上分位点。第42页,共63页,2023年,2月20日,星期一4.

性质:设X1,X2,…,Xn,是来自正态总体N(,2)的一个样本,则

当n=25时,通过查表1)求P{2>34.382}的值;2)若P{2>b}=0.975,求b的值.b.分布可加性若X

~2(n1),Y~2(n2),X,Y相互独立,则

X+Y~2(n1+n2).第43页,共63页,2023年,2月20日,星期一c.期望与方差

若X~2(n),则E(X)=n,D(X)=2n.d.若X~2(n),则当n充分大时,近似正态分布N(0,1).第44页,共63页,2023年,2月20日,星期一定义若X~N(0,1),Y~2(n),X与Y独立,则

t(n)称为自由度为n的t—分布.t

—分布第45页,共63页,2023年,2月20日,星期一t(n)的概率密度为第46页,共63页,2023年,2月20日,星期一2.性质第47页,共63页,2023年,2月20日,星期一分位点设t~t(n),若对:0<<1,存在t(n)>0,

满足P{t>t(n)}=,则称t(n)为

t(n)的上分位点.第48页,共63页,2023年,2月20日,星期一注:第49页,共63页,2023年,2月20日,星期一第50页,共63页,2023年,2月20日,星期一定义若U

~2(n1),V~2(n2),U,V独立,则

称为第一自由度为n1,第二自由度为n2的F—分布。F

—分布注:

若F~F(n1,n2),则1/F~F(n2,n1).第51页,共63页,2023年,2月20日,星期一F—分布的概率密度函数若F~F(n1,n2),F的概率密度为第52页,共63页,2023年,2月20日,星期一2.

F—分布的分位点对于:0<<1,若存在F(n1,n2)>0,满足P{F>F(n1,n2)}=,则称F(n1,n2)为F(n1,n2)的上分位点;注:第53页,共63页,2023年,2月20日,星期一第54页,共63页,2023年,2月20日,星期一三、正态总体的样本均值和样本方差的分布设总体X的均值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论