概率论-数理统计的基本概念课件_第1页
概率论-数理统计的基本概念课件_第2页
概率论-数理统计的基本概念课件_第3页
概率论-数理统计的基本概念课件_第4页
概率论-数理统计的基本概念课件_第5页
已阅读5页,还剩111页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数理统计数理统计1概率论和数理统计尽管两者有密切的联系,但本质上是两门不同的课程。概率论是理论基础课,解决理论问题;数理统计是应用专业课,解决实际问题。概率论更注重逻辑和体系的严密,是一门真正的数学课。数理统计则对同一个具体问题也没有一个最佳的答案,我们往往需要凭经验选择“较优”的方法,不是纯粹的数学。学习方法也不同。概率论注重逻辑推导,而数理统计则是以解决问题为导向,黑猫白猫,捉住老鼠就是好猫;以案例为中心。概率论和数理统计尽管两者有密切的联系,但本质上是两门不同的课2数理统计的基本概念数理统计的基本概念3引言

概率论的许多问题中,随机变量的概率分布通常是已知的,

随机变量及其所伴随的概率分布全面描述了随机现象的统计性规律,而一切计算与推理都是在这已知的基础上得出来的。

但实际中,情况往往并非如此,一个随机现象所服从的分布可能是完全不知道的,或者知道其分布概型,但是其中的某些参数是未知的。引言概率论的许多问题中,随机4例如:某公路上行驶车辆的速度服从什么分布是未知的;电视机的使用寿命服从什么分布是未知的;产品是否合格服从两点分布,但参数——合格率p是未知的;例如:某公路上行驶车辆的速度服从什么分布是未知的5

数理统计的任务则是以概率论为基础,根据试验所得到的数据,对研究对象的客观统计规律性做出合理的推断。一言蔽之:数理统计方法具有“用局部推断整体”的特征.

在数理统计中,不是对所研究的对象全体(称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断.数理统计的任务则是以概率论为基础,根据试验一6实际生活中的问题:长期的生产经验告诉我们,水泥厂成品打包机装袋的重量X服从正态分布。如何得到该正态分布的具体形式,即两参数确切的值?把打包机使用周期内所有的数据全部记录下来,可近似看做一个连续的密度函数抽取50包水泥,重量分别记为:X1,X2,……X50因为已知:E[X]=μ,Var[X]=σ2考虑:希望和μσ2比较接近总体样本统计量实际生活中的问题:长期的生产经验告诉我们,水泥厂成品打包机装7总体、样本和统计量总体、样本和统计量8总体与样本在数理统计中,把研究对象的全体称为总体,而把组成总体的每个单元称为个体。总体可以认为是一个随机变量。因为我们在抽样之前无法预测个体或样本的取值,或者每次抽取的值并不相同,所以每个个体也是一个随机变量,而样本是n维随机向量。若干个体构成的集合称为样本。若样本中包含n个个体,则n

称为这个样本的容量.

一旦取定一组样本X1,…,Xn,得到n个具体的数(x1,x2,…,xn),称为样本的一次观测值,简称样本值.总体与样本在数理统计中,把研究对象的全体称为总体,而把9随机抽样方法的基本要求独立性——每次抽样的结果既不影响其余各次抽

样的结果,也不受其它各次抽样结果的影响。

满足上述两点要求的样本称为简单随机样本.获得简单随机样本的抽样方法叫简单随机抽样.代表性——样本()的每个分量

与总体具有相同的分布。

从简单随机样本的含义可知,样本是来自总体、与总体具有相同分布的,相互独立的随机变量.随机抽样方法的基本要求独立性——每次抽样的结果既不10

简单随机样本是应用中最常见的情形,今后,当说到“X1,X2,…,Xn是取自某总体的样本”时,若不特别说明,就指简单随机样本.若总体的分布函数为F(x)、分布密度函数为f(x)。由于简单随机抽样中对每个样本的观测相互独立,故简单随机样本视为随机向量,其联合分布函数为其简单随机样本的联合分布密度函数为=F(x1)F(x2)…F(xn)=f(x1)f(x2)…f(xn)简单随机样本是应用中最常见的情形,今后,当说到11简单随机抽样的例子

例如:要通过随机抽样了解一批产品的次品率,如果每次抽取一件产品观测后放回原来的总量中,则这是一个简单随机抽样。

但实际抽样中,往往是不再放回产品,则这不是一个简单随机抽样。但当总量N很大时,可近似看成是简单随机抽样。简单随机抽样的例子例如:要通过12统计量的定义

定义设()为总体X的一个样本,为不含任何未知参数的连续函数,则称为样本()的一个统计量。则例如:设是从正态总体中抽取的一个样本,其中为已知参数,为未知参数,是统计量不是统计量统计量的定义定义设(13每个样本都是一个随机变量,而统计量是样本的函数,也是随机变量。注意统计量是随机变量!每个样本都是一个随机变量,而统计量是样本的函数,也是随机变量14几个最常用的统计量样本均值:设是总体的一个样本,样本方差:修正样本方差:几个最常用的统计量样本均值:设15样本k阶原点矩:样本k阶中心矩:用概率方法来探讨一个统计量在推断总体时,往往要知道统计量的分布或者近似分布。注意:统计量的函数仍然是统计量。比如:当μ已知时:当σ2已知时:样本k阶原点矩:样本k阶中心矩:用概率方法来探讨一个统计量在16统计量的数字特征先来看最简单的统计量:样本均值与样本方差统计量的数字特征先来看最简单的统计量:样本均值与样本方差17证明:(1)利用期望的性质及独立性证明:(1)利用期望的性质及独立性18(2)(2)19概率论-数理统计的基本概念课件20三个非常有用的统计量的连续型分布,即

2分布t

分布F分布数理统计的三大抽样分布(都是连续型).它们都是正态分布某个统计量的抽样分布,有直接的数理统计背景:需要怎样的统计量,就需要研究相应的分布。抽样分布统计量是样本的函数,是一个随机变量。统计量的分布称为抽样分布。三个非常有用的统计量的连续型分布,即2分布t分布F分布21—分布(读作卡方分布)

定义设总体,是的一个样本,则称统计量服从自由度为n的分布,记作自由度是指独立随机变量的个数—分布(读作卡方分布)定义设总体22分布的密度函数为其中Gamma函数Γ(x)通过下面积分定义分布的密度函数为其中Gamma函数Γ(x)通过下面23一般的,若X的分布密度函数为则称X服从参数为α>0和λ>0的Γ分布,记为X~Γ(α,λ)。不难看出一般的,若X的分布密度函数为则称X服从参数为α>0和λ>0的24其图形随自由度的不同而有所改变.分布密度函数的图形其图形随自由度的不同而有所改变.分布密度函数的图形252分布的性质设X~2(n),则E[X]=n,Var[X]=2n.证明:只证明期望的性质2分布的可加性若且X1,X2相互独立,则2分布的性质设X~2(n),则E[X]=n,V26证明:令即由中心极限定理独立同分布,且有若n则当n趋于无穷时,近似的有证明:令即由中心极限定理独立同分布,且有若27

定理

设(X1,X2,…,Xn)为来自正态总体

X~N(,2)的样本,则(1)(2)卡方分布的应用(3)样本均值和样本方差独立定理设(X1,X2,…,Xn)为来自正态总体X~28只证明(1):

为X1,X2,…,Xn的线性组合,故仍然服从正态分布,而故只证明(1):为X1,X2,…,Xn的线性组合,故29(2)式的自由度为什么是n-1?从表面上看,是n个正态随机变量的平方和,但实际上它们不是独立的,它们之间有一种线性约束关系:这表明,当这个n个正态随机变量中有n-1个取值给定时,剩下的一个的取值就跟着唯一确定了,故在这n项平方和中只有n-1项是独立的.所以(2)式的自由度是n-1.(2)式的自由度为什么是n-1?从表面上看,是n个正态随机30(1)

定理(抽样分布基本定理)

设(X1,X2,…,Xn)为来自正态总体

X~N(0,1)的样本,则样本均值与样本方差Sn2相互独立;(2)特别的,有:(1)定理(抽样分布基本定理)设(X1,X2,…,31t分布定义:

设随机变量X~N(0,1),Y~2(n)

,且X与Y相互独立,则称统计量服从自由度为n的t分布,记作t分布的概率密度函数为T

~t(n).t分布定义:32其形状类似标准正态分布,关于x=0对称.当n较大时,t分布近似于标准正态分布.其形状类似标准正态分布,关于x=0对称.当n较大时,33t分布的数学期望与方差设T~t(n),则t分布的数学期望与方差设T~t(n),则34定理设(X1,X2,…,Xn)为来自正态总体

X~N(,2)的样本,则统计量证故由于t分布的应用定理设(X1,X2,…,Xn)为来自正态总体证故由于t分布的35由t分布定义得又由于与相互独立,且由t分布定义得又由于与相互独立,且36定理

设(X1,X2,…,Xn1)和(Y1,Y2,…,Yn2)分别是来自正态总体N(1

,2)和N(2

,2)的样本,且它们相互独立,则统计量其中、分别为两总体的样本方差.定理设(X1,X2,…,Xn1)和37证明:因此由已知条件可得故证明:因此由已知条件可得故38又因为故因此又因为故因此39F分布服从第一自由度为n1,第二自由度为n2的F分布,定义

设随机变量X~2(n1)、Y~2(n2),且相互独立,则称随机变量记作Z~F(n1,n2).显然,若Z~F(n1,n2),则1/Z~F(n2,n1).F分布服从第一自由度为n1,第二自由度为n2的F分布,40F分布的分布密度函数:其中F分布的分布密度函数:其中41概率论-数理统计的基本概念课件42定理

为正态总体

设为正态总体的样本容量和样本方差;的样本容量和样本方差;且两个样本相互独立,则统计量卡方分布的应用定理43证明由已知条件知且相互独立,由F分布的定义有证明由已知条件知且相互独立,由F分布的定义有44三大抽样分布的总结卡方分布t分布F分布正态分布的平方和正态分布和卡方分布开根号的商两个卡方分布的商三大抽样分布的总结卡方分布正态分布的平方和正态分布和卡方分布45

例1

设总体X~N(0,1),X1,X2,…,Xn为简单随机样本,试问下列统计量各服从什么分布?解(1)因为Xi~N(0,1),i=1,2,…,n.所以X1-X2~N(0,2),故~t(2).例1设总体X~N(0,1),X1,46

例1

设总体X~N(0,1),X1,X2,…,Xn为简单随机样本,试问下列统计量各服从什么分布?续解(2)因为X1~N(0,1),故~t(n-1).例1设总体X~N(0,1),X1,47

例1

设总体X~N(0,1),X1,X2,…,Xn为简单随机样本,试问下列统计量各服从什么分布?续解(3)因为所以~F(3,n-3).例1设总体X~N(0,1),X1,48例2

若T~t(n),问T2服从什么分布?解因为T~t(n),可以认为其中U~N(0,1),V~2(n),U2~2(1),~F(1,n).例2若T~t(n),问T2服从什么分布?解因为49当μ已知当σ2已知当μ,σ2已知有关三大分布在区间估计中应用的重要注解统计量~N(0,1)~χ2(n-1)~t(n-1)思考:如果参数值未知,情况如何?分布仍然满足,与参数选取无关在参数的区间估计中有着关键性的应用已知:X~N(μ,σ2)当μ已知当σ2已知当μ,σ2已知有关三大分布在区间估计中应用50另外几个比较常用的统计量及其分布顺序统计量:样本极差:样本中位数:另外几个比较常用的统计量及其分布顺序统计量:样本极差:样本中51经验分布函数绝大多数统计问题的背景是已经知道分布的类型,但是不确定分布的参数。但是有些情况下分布的类型也不清楚,此时就需要引入经验分布函数。经验分布函数绝大多数统计问题的背景是已经知道分布的类型,但是52概率论-数理统计的基本概念课件53概率论-数理统计的基本概念课件54设总体X的分布函数为FX,利用伯努利大数定律可以证明,对于任意ε>0,有故当样本容量n足够大时,经验分布函数与总体的分布函数差距很小。因此只要样本容量足够大,就可以近似推断总体的分布。设总体X的分布函数为FX,利用伯努利大数定律可以55事实上,对于任意给定x,我们可以定义事件A={随机变量取值xt≤x},而故有则由伯努利大数定律显然表示观测值小于x的样本个数,E[Y]=P(A)定义随机变量Yi=1如果A发生,否则为0事实上,对于任意给定x,我们可以定义事件A={随机变量56命题6.3.5设总体X的分布函数为FX,分布密度函数为fX,则Xn按大小顺序排列,第k个随机变量X(k)的密度函数为顺序统计量的分布命题6.3.5设总体X的分布函数为FX,分布密度顺57证明:故有证明:故有58数理统计数理统计59概率论和数理统计尽管两者有密切的联系,但本质上是两门不同的课程。概率论是理论基础课,解决理论问题;数理统计是应用专业课,解决实际问题。概率论更注重逻辑和体系的严密,是一门真正的数学课。数理统计则对同一个具体问题也没有一个最佳的答案,我们往往需要凭经验选择“较优”的方法,不是纯粹的数学。学习方法也不同。概率论注重逻辑推导,而数理统计则是以解决问题为导向,黑猫白猫,捉住老鼠就是好猫;以案例为中心。概率论和数理统计尽管两者有密切的联系,但本质上是两门不同的课60数理统计的基本概念数理统计的基本概念61引言

概率论的许多问题中,随机变量的概率分布通常是已知的,

随机变量及其所伴随的概率分布全面描述了随机现象的统计性规律,而一切计算与推理都是在这已知的基础上得出来的。

但实际中,情况往往并非如此,一个随机现象所服从的分布可能是完全不知道的,或者知道其分布概型,但是其中的某些参数是未知的。引言概率论的许多问题中,随机62例如:某公路上行驶车辆的速度服从什么分布是未知的;电视机的使用寿命服从什么分布是未知的;产品是否合格服从两点分布,但参数——合格率p是未知的;例如:某公路上行驶车辆的速度服从什么分布是未知的63

数理统计的任务则是以概率论为基础,根据试验所得到的数据,对研究对象的客观统计规律性做出合理的推断。一言蔽之:数理统计方法具有“用局部推断整体”的特征.

在数理统计中,不是对所研究的对象全体(称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断.数理统计的任务则是以概率论为基础,根据试验一64实际生活中的问题:长期的生产经验告诉我们,水泥厂成品打包机装袋的重量X服从正态分布。如何得到该正态分布的具体形式,即两参数确切的值?把打包机使用周期内所有的数据全部记录下来,可近似看做一个连续的密度函数抽取50包水泥,重量分别记为:X1,X2,……X50因为已知:E[X]=μ,Var[X]=σ2考虑:希望和μσ2比较接近总体样本统计量实际生活中的问题:长期的生产经验告诉我们,水泥厂成品打包机装65总体、样本和统计量总体、样本和统计量66总体与样本在数理统计中,把研究对象的全体称为总体,而把组成总体的每个单元称为个体。总体可以认为是一个随机变量。因为我们在抽样之前无法预测个体或样本的取值,或者每次抽取的值并不相同,所以每个个体也是一个随机变量,而样本是n维随机向量。若干个体构成的集合称为样本。若样本中包含n个个体,则n

称为这个样本的容量.

一旦取定一组样本X1,…,Xn,得到n个具体的数(x1,x2,…,xn),称为样本的一次观测值,简称样本值.总体与样本在数理统计中,把研究对象的全体称为总体,而把67随机抽样方法的基本要求独立性——每次抽样的结果既不影响其余各次抽

样的结果,也不受其它各次抽样结果的影响。

满足上述两点要求的样本称为简单随机样本.获得简单随机样本的抽样方法叫简单随机抽样.代表性——样本()的每个分量

与总体具有相同的分布。

从简单随机样本的含义可知,样本是来自总体、与总体具有相同分布的,相互独立的随机变量.随机抽样方法的基本要求独立性——每次抽样的结果既不68

简单随机样本是应用中最常见的情形,今后,当说到“X1,X2,…,Xn是取自某总体的样本”时,若不特别说明,就指简单随机样本.若总体的分布函数为F(x)、分布密度函数为f(x)。由于简单随机抽样中对每个样本的观测相互独立,故简单随机样本视为随机向量,其联合分布函数为其简单随机样本的联合分布密度函数为=F(x1)F(x2)…F(xn)=f(x1)f(x2)…f(xn)简单随机样本是应用中最常见的情形,今后,当说到69简单随机抽样的例子

例如:要通过随机抽样了解一批产品的次品率,如果每次抽取一件产品观测后放回原来的总量中,则这是一个简单随机抽样。

但实际抽样中,往往是不再放回产品,则这不是一个简单随机抽样。但当总量N很大时,可近似看成是简单随机抽样。简单随机抽样的例子例如:要通过70统计量的定义

定义设()为总体X的一个样本,为不含任何未知参数的连续函数,则称为样本()的一个统计量。则例如:设是从正态总体中抽取的一个样本,其中为已知参数,为未知参数,是统计量不是统计量统计量的定义定义设(71每个样本都是一个随机变量,而统计量是样本的函数,也是随机变量。注意统计量是随机变量!每个样本都是一个随机变量,而统计量是样本的函数,也是随机变量72几个最常用的统计量样本均值:设是总体的一个样本,样本方差:修正样本方差:几个最常用的统计量样本均值:设73样本k阶原点矩:样本k阶中心矩:用概率方法来探讨一个统计量在推断总体时,往往要知道统计量的分布或者近似分布。注意:统计量的函数仍然是统计量。比如:当μ已知时:当σ2已知时:样本k阶原点矩:样本k阶中心矩:用概率方法来探讨一个统计量在74统计量的数字特征先来看最简单的统计量:样本均值与样本方差统计量的数字特征先来看最简单的统计量:样本均值与样本方差75证明:(1)利用期望的性质及独立性证明:(1)利用期望的性质及独立性76(2)(2)77概率论-数理统计的基本概念课件78三个非常有用的统计量的连续型分布,即

2分布t

分布F分布数理统计的三大抽样分布(都是连续型).它们都是正态分布某个统计量的抽样分布,有直接的数理统计背景:需要怎样的统计量,就需要研究相应的分布。抽样分布统计量是样本的函数,是一个随机变量。统计量的分布称为抽样分布。三个非常有用的统计量的连续型分布,即2分布t分布F分布79—分布(读作卡方分布)

定义设总体,是的一个样本,则称统计量服从自由度为n的分布,记作自由度是指独立随机变量的个数—分布(读作卡方分布)定义设总体80分布的密度函数为其中Gamma函数Γ(x)通过下面积分定义分布的密度函数为其中Gamma函数Γ(x)通过下面81一般的,若X的分布密度函数为则称X服从参数为α>0和λ>0的Γ分布,记为X~Γ(α,λ)。不难看出一般的,若X的分布密度函数为则称X服从参数为α>0和λ>0的82其图形随自由度的不同而有所改变.分布密度函数的图形其图形随自由度的不同而有所改变.分布密度函数的图形832分布的性质设X~2(n),则E[X]=n,Var[X]=2n.证明:只证明期望的性质2分布的可加性若且X1,X2相互独立,则2分布的性质设X~2(n),则E[X]=n,V84证明:令即由中心极限定理独立同分布,且有若n则当n趋于无穷时,近似的有证明:令即由中心极限定理独立同分布,且有若85

定理

设(X1,X2,…,Xn)为来自正态总体

X~N(,2)的样本,则(1)(2)卡方分布的应用(3)样本均值和样本方差独立定理设(X1,X2,…,Xn)为来自正态总体X~86只证明(1):

为X1,X2,…,Xn的线性组合,故仍然服从正态分布,而故只证明(1):为X1,X2,…,Xn的线性组合,故87(2)式的自由度为什么是n-1?从表面上看,是n个正态随机变量的平方和,但实际上它们不是独立的,它们之间有一种线性约束关系:这表明,当这个n个正态随机变量中有n-1个取值给定时,剩下的一个的取值就跟着唯一确定了,故在这n项平方和中只有n-1项是独立的.所以(2)式的自由度是n-1.(2)式的自由度为什么是n-1?从表面上看,是n个正态随机88(1)

定理(抽样分布基本定理)

设(X1,X2,…,Xn)为来自正态总体

X~N(0,1)的样本,则样本均值与样本方差Sn2相互独立;(2)特别的,有:(1)定理(抽样分布基本定理)设(X1,X2,…,89t分布定义:

设随机变量X~N(0,1),Y~2(n)

,且X与Y相互独立,则称统计量服从自由度为n的t分布,记作t分布的概率密度函数为T

~t(n).t分布定义:90其形状类似标准正态分布,关于x=0对称.当n较大时,t分布近似于标准正态分布.其形状类似标准正态分布,关于x=0对称.当n较大时,91t分布的数学期望与方差设T~t(n),则t分布的数学期望与方差设T~t(n),则92定理设(X1,X2,…,Xn)为来自正态总体

X~N(,2)的样本,则统计量证故由于t分布的应用定理设(X1,X2,…,Xn)为来自正态总体证故由于t分布的93由t分布定义得又由于与相互独立,且由t分布定义得又由于与相互独立,且94定理

设(X1,X2,…,Xn1)和(Y1,Y2,…,Yn2)分别是来自正态总体N(1

,2)和N(2

,2)的样本,且它们相互独立,则统计量其中、分别为两总体的样本方差.定理设(X1,X2,…,Xn1)和95证明:因此由已知条件可得故证明:因此由已知条件可得故96又因为故因此又因为故因此97F分布服从第一自由度为n1,第二自由度为n2的F分布,定义

设随机变量X~2(n1)、Y~2(n2),且相互独立,则称随机变量记作Z~F(n1,n2).显然,若Z~F(n1,n2),则1/Z~F(n2,n1).F分布服从第一自由度为n1,第二自由度为n2的F分布,98F分布的分布密度函数:其中F分布的分布密度函数:其中99概率论-数理统计的基本概念课件100定理

为正态总体

设为正态总体的样本容量和样本方差;的样本容量和样本方差;且两个样本相互独立,则统计量卡方分布的应用定理101证明由已知条件知且相互独立,由F分布的定义有证明由已知条件知且相互独立,由F分布的定义有102三大抽样分布的总结卡方分布t分布F分布正态分布的平方和正态分布和卡方分布开根号的商两个卡方分布的商三大抽样分布的总结卡方分布正态分布的平方和正态分布和卡方分布103

例1

设总体X~N(0,1)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论