概率论第六章课件ppt_第1页
概率论第六章课件ppt_第2页
概率论第六章课件ppt_第3页
概率论第六章课件ppt_第4页
概率论第六章课件ppt_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、计算机科学学院计算机科学学院 王艳娥王艳娥第六章第六章 样本及抽样分布样本及抽样分布n引言引言n随机样本随机样本n抽样分布抽样分布本章转入课程的第二部分本章转入课程的第二部分数理统计数理统计引言引言是以概率论是以概率论的理论为基础、通过试验的理论为基础、通过试验所得数据来研究随机现象的一门数学分支,应用广所得数据来研究随机现象的一门数学分支,应用广泛,内容丰富。泛,内容丰富。概率论是数理统计的理论基础概率论是数理统计的理论基础, ,数理统计是概数理统计是概率论的重要应用。率论的重要应用。 从历史的典籍中,人们不难发现许多关于从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等等的记载,

2、说明人钱粮、户口、地震、水灾等等的记载,说明人们很早就开始了统计的工作们很早就开始了统计的工作 . 但是当时的统计,但是当时的统计,只是对有关事实的简单记录和整理,而没有在只是对有关事实的简单记录和整理,而没有在一定理论的指导下,作出超越这些数据范围之一定理论的指导下,作出超越这些数据范围之外的推断外的推断. 到了十九世纪末二十世纪初,随着近代数到了十九世纪末二十世纪初,随着近代数学和概率论的发展,才真正诞生了学和概率论的发展,才真正诞生了数理统计学数理统计学这门学科这门学科. 数理统计学是一门应用性很强的学科数理统计学是一门应用性很强的学科. 它它是研究怎样以是研究怎样以有效的方式有效的方式

3、收集、收集、 整理和分析整理和分析带带有随机性的数据有随机性的数据,以便对所考察的问题作出推,以便对所考察的问题作出推断和预测,直至为采取一定的决策和行动提供断和预测,直至为采取一定的决策和行动提供依据和建议依据和建议. 在在概率论中所研究的随机变量,它的分布都概率论中所研究的随机变量,它的分布都是假设已知的是假设已知的, ,在这一前提下去研究它的性质、在这一前提下去研究它的性质、特点和规律性特点和规律性, ,例如求出它的数字特征例如求出它的数字特征, ,讨论随机讨论随机变量函数的分布变量函数的分布, ,介绍常用的各种分布等。介绍常用的各种分布等。 而在而在数理统计中的随机变量,它的分布是未数

4、理统计中的随机变量,它的分布是未知的,或者不完全知道知的,或者不完全知道,人们通过对所研究的随,人们通过对所研究的随机变量进行重复、独立的观察,得到许多观察值机变量进行重复、独立的观察,得到许多观察值,对这些数据进行分析,从而对随机变量的分布,对这些数据进行分析,从而对随机变量的分布作出种种判断。作出种种判断。 现实世界中存在着形形色色的数据现实世界中存在着形形色色的数据, ,分析这些分析这些数据需要多种多样的方法数据需要多种多样的方法. . 因此因此, ,数理统计中的方法和支持这些方法的相数理统计中的方法和支持这些方法的相应理论是相当丰富的应理论是相当丰富的. .概括起来可以归纳成两大类概括

5、起来可以归纳成两大类: : 参数估计参数估计根据数据根据数据, ,用一些方法对分布的用一些方法对分布的未知参数进行估计未知参数进行估计. . 假设检验假设检验根据数据根据数据, ,用一些方法对分布的用一些方法对分布的未知参数进行检验未知参数进行检验. . 它们构成了统计推断的两种基本形式它们构成了统计推断的两种基本形式. .这两种这两种推断渗透到了数理统计的每个分支推断渗透到了数理统计的每个分支.6.1 6.1 随机样本随机样本总体和样本总体和样本 数理统计不同于一般的资料统计,它更侧重数理统计不同于一般的资料统计,它更侧重于应用随机现象本身的规律性进行资料的收集、于应用随机现象本身的规律性进

6、行资料的收集、整理和分析整理和分析. 由于大量随机现象必然呈现出它的规律性,由于大量随机现象必然呈现出它的规律性,因而因而从理论上讲从理论上讲,只要对随机现象进行足够多次,只要对随机现象进行足够多次观察,被研究的随机现象的规律性一定能清楚地观察,被研究的随机现象的规律性一定能清楚地呈现出来呈现出来. 但客观上只允许我们对随机现象进行但客观上只允许我们对随机现象进行次数不多的观察试验,也就是说次数不多的观察试验,也就是说, 我们获得的只我们获得的只是局部观察资料是局部观察资料. 在数理统计中,不是对所研究的对象全体在数理统计中,不是对所研究的对象全体 (称称为为总体总体)进行观察,而是抽取其中的

7、部分进行观察,而是抽取其中的部分(称为称为样本样本)进行观察获得数据进行观察获得数据(抽样抽样),并通过这些数据对总体,并通过这些数据对总体进行推断进行推断.数理统计方法具有数理统计方法具有“部分推断整体部分推断整体”的特征的特征 . 实际上实际上, ,我们真正关心的并不是研究对象本身我们真正关心的并不是研究对象本身, ,而是其某项数量指标而是其某项数量指标. 比如某家工厂的一种产品的使用寿命这样一比如某家工厂的一种产品的使用寿命这样一项数量指标项数量指标. .1.1.总体总体某批某批灯泡的寿命灯泡的寿命该批灯泡寿命的全该批灯泡寿命的全体就是总体体就是总体国产轿车每公里国产轿车每公里的耗油量的

8、耗油量国产轿车每公里耗油量国产轿车每公里耗油量的全体就是总体的全体就是总体 对研究对象上的某项数量指标进行观察。对研究对象上的某项数量指标进行观察。 试验的全部可能的观察值称为试验的全部可能的观察值称为总体总体. . 这些值不一定各不相同这些值不一定各不相同( (可能重复可能重复) ),数目上,数目上也不一定有限也不一定有限. . 每一个可能的观察值称为每一个可能的观察值称为个体个体. . 总体中所包含的个体的个数称为总体的总体中所包含的个体的个数称为总体的容量容量.总体总体有限总体有限总体无限总体无限总体 例例1 研究某地区研究某地区N个农户的年收人个农户的年收人.总体指他们的年收入的总体指

9、他们的年收入的N个数字个数字.例例2 用一把尺子去量一个物体的长度用一把尺子去量一个物体的长度. .总体应该理解为一切所有可能的测量值的全体总体应该理解为一切所有可能的测量值的全体. .一般一般, 我们所研究的总体的某项数量指标我们所研究的总体的某项数量指标X是一个是一个随机变量随机变量, 其取值在客观上有一定的分布其取值在客观上有一定的分布. 因此因此, 对对总体的研究总体的研究,就是对相应的随机变量就是对相应的随机变量X的研究。的研究。 今后今后, 我们称我们称X的分布函数和数字特征分别为总的分布函数和数字特征分别为总体的分布函数和数字特征体的分布函数和数字特征, 并不再区分总体与相应并不

10、再区分总体与相应的随机变量的随机变量X. 对总体的称呼对总体的称呼: 2 2、总体的分布、总体的分布 例例l中,若农户年收入以万元计中,若农户年收入以万元计, 假定假定N户中收入户中收入X为以下几种取值为以下几种取值: 0.5, 0.8, l, 1.2和和1.5. 取这些值的农户个数分别为:取这些值的农户个数分别为:n1, n2, n3, n4, n5,(这里这里n1+n2+n3+n4+n5=N).例例3 (例例l续续) 则总体则总体X的分布为离散型分布的分布为离散型分布, 其分布律为其分布律为: 例如例如:研究某批灯泡的寿命时,关心的数量指研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,

11、此总体就可以用随机变量标就是寿命,那么,此总体就可以用随机变量X表示,或用其分布函数表示,或用其分布函数F(x)表示表示 . 寿命寿命 X 可用指数分布可用指数分布来刻划来刻划 鉴于此,常用随机变量的记号鉴于此,常用随机变量的记号或用其分布函数表示总体或用其分布函数表示总体. 如说总体如说总体X或总体或总体F(x) .某批某批灯泡的寿命灯泡的寿命总总体体 寿命总体是指数分布总体寿命总体是指数分布总体 类似地,在研究某地区中学生的营养状况时类似地,在研究某地区中学生的营养状况时 ,若关心的数量指标是身高和体重,我们用若关心的数量指标是身高和体重,我们用X 和和Y 分别表示身高和体重,那么此总体就

12、可用二维随分别表示身高和体重,那么此总体就可用二维随机变量机变量(X,Y)或其联合分布函数或其联合分布函数 F(x,y)来表示来表示. 总体分布一般是未知总体分布一般是未知, 或只知道是包含未知参或只知道是包含未知参数的分布数的分布, 为推断总体分布及各种特征为推断总体分布及各种特征, 按一定规按一定规则从总体中抽取若干个体进行观察试验则从总体中抽取若干个体进行观察试验, 以获得有以获得有关总体的信息关总体的信息 , 这一抽取过程称为这一抽取过程称为 “抽样抽样”, 所抽所抽取的部分个体称为取的部分个体称为样本样本. 样本中所包含的个体数目样本中所包含的个体数目称为称为样本容量样本容量.3.

13、样本样本从国产轿车中抽从国产轿车中抽5辆辆进行耗油量试验进行耗油量试验样本容量为样本容量为5当当n次观察一经完成次观察一经完成, 得到得到n个具体的数个具体的数 x1, x2, xn , 称为样本称为样本X1, , Xn的一次观察值的一次观察值, 简称简称样本值样本值 .1. 代表性代表性: X1, X2, Xn中每一个与所考察的总体有中每一个与所考察的总体有 相同的分布相同的分布.2. 独立性独立性: X1, X2, Xn是相互独立的随机变量是相互独立的随机变量. 对总体对总体X在相同的条件下在相同的条件下, 进行进行n次重复、独立次重复、独立观察观察, 其结果依次记为其结果依次记为X1,

14、X2, , Xn, 这样得到的随这样得到的随机变量机变量X1, X2, , Xn是来自总体是来自总体X的一个的一个简单随机样简单随机样本本, 与总体随机变量具有相同的分布与总体随机变量具有相同的分布. n是样本的容是样本的容量量. 这种抽样这种抽样, 叫作叫作“简单随机抽样简单随机抽样”, 其特点:其特点: 对对有限总体有限总体, 采用放回抽样可得简单随机样本采用放回抽样可得简单随机样本, 但放回抽样使用起来不方便但放回抽样使用起来不方便, 当个体总数当个体总数N比要得比要得到的样本的容量到的样本的容量n大得多时大得多时, 在实际中可将不放回抽在实际中可将不放回抽样近似当作放回抽样来处理样近似

15、当作放回抽样来处理. 对对无限总体无限总体, 因抽取一个个体不影响它的分布因抽取一个个体不影响它的分布,所以总是采用不放回抽样所以总是采用不放回抽样.定义:定义: 设设X是具有分布函数是具有分布函数F的随机变量,若的随机变量,若X1, X2, , Xn是具有同一分布函数的、相互独立的随机是具有同一分布函数的、相互独立的随机变量,则称变量,则称X1, X2, , Xn为从分布函数为从分布函数F(或总体或总体F、或总体或总体X) 得到的容量为得到的容量为n的的简单随机样本简单随机样本,简称,简称样样本本,它们的观察值,它们的观察值x1, x2, xn称为称为样本值样本值,又称为,又称为X的的n个独

16、立的观察值个独立的观察值. 简单随机样本是应用中最常见的情形,今后,简单随机样本是应用中最常见的情形,今后,当说到当说到“X1, X2, Xn是取自某总体的样本是取自某总体的样本”时,时,若不特别说明,就指简单随机样本若不特别说明,就指简单随机样本. 既然样本既然样本 X1,X2 , ,Xn 被看作随机变量被看作随机变量,自然就需自然就需要研究它们的分布要研究它们的分布4. 4. 样本的分布样本的分布=F(x1) F(x2) F(xn) 若总体的分布函数为若总体的分布函数为F(x)、概率密度函数为、概率密度函数为f(x), 则其简单随机样本的联合分布函数为则其简单随机样本的联合分布函数为),(

17、2*nxxxF其简单随机样本的联合概率密度函数为其简单随机样本的联合概率密度函数为),(2*nxxxf=f(x1) f(x2) f(xn) 假设某大城市居民的收入服从正态分布假设某大城市居民的收入服从正态分布 N( , 2), 其概率密度函数为其概率密度函数为: : 例例5 5设设X1,X2 , , Xn是来自总体的一个样本是来自总体的一个样本. 则则 Xi N( , 2), i1, 2, n.于是样本于是样本 X1, X2 , , Xn的联合概率密度的联合概率密度为22()21()2xfxexR 2211()212/ 21(,)(2)niixnnnfxxxe 总总 体体 X样本样本X1,X2

18、,Xn样本值样本值x1,x2,xn随机抽样随机抽样 获得样本获得样本完成试验完成试验 获得数据获得数据整理加工整理加工 统计推断统计推断统计统计 工作工作4. 总体、样本、样本值的关系总体、样本、样本值的关系 事实上我们抽样后得到的资料都是具体的、确事实上我们抽样后得到的资料都是具体的、确定的值定的值. 如我们从某班大学生中抽取如我们从某班大学生中抽取10人测量身高人测量身高,得到得到10个数,它们是样本取到的值而不是样本个数,它们是样本取到的值而不是样本. 我我们只能观察到随机变量取的值而见不到随机变量们只能观察到随机变量取的值而见不到随机变量.总体(理论分布)总体(理论分布) ? 样本样本

19、 样本值样本值 统计是从手中已有的资料统计是从手中已有的资料样本值,去推断样本值,去推断总体的情况总体的情况-总体分布总体分布F(x)的性质的性质. 总体分布决定了样本取值的概率规律,也就是总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断样本取到样本值的规律,因而可以由样本值去推断总体总体. 样本是联系二者的桥梁样本是联系二者的桥梁休息片刻继续下一讲休息片刻继续下一讲6.2 6.2 抽样分布抽样分布统计量与经验分布函数统计量与经验分布函数统计三大抽样分布统计三大抽样分布正态总体的样本均值正态总体的样本均值 和样本方差的分布和样本方差的分布课堂练习课堂练习布置

20、作业布置作业 由样本值去推断总体情况,需要对样本值进由样本值去推断总体情况,需要对样本值进行行“加工加工”,这就要构造一些样本的函数,它把,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来样本中所含的(某一方面)的信息集中起来.1. 统计量统计量 这种不含任何未知参数的样本的函数称为这种不含任何未知参数的样本的函数称为统统计量计量. 它是完全由样本决定的量它是完全由样本决定的量.一、统计量与经验分布函数一、统计量与经验分布函数定义:定义:设设X1, , Xn 是来自总体是来自总体X的一个样本的一个样本, g(X1, , Xn )是是X1, , Xn的函数的函数, 若若g中不

21、含未知参中不含未知参数数, 则称则称g(X1, ,Xn )是总体是总体X的一个的一个统计量统计量. 设设x1, , xn 是样本是样本X1, , Xn的一个观察值的一个观察值, 则则g(x1, , xn ) 是是统计量统计量g(X1, ,Xn )的观察值的观察值. 例:设例:设X1, , Xn 是总体是总体X的一个样本的一个样本, XN( , , 2), 令令T=X1- , 若若 为已知的为已知的, 则则T为统计为统计量量; 若若 未知未知, T就不是统计量就不是统计量.几个常用的统计量及其观察值几个常用的统计量及其观察值 : 11,niiXXn 1.1.样本均值样本均值 22221111()

22、()11nniiiiSXXXnXnn 2.2.样本方差样本方差 样本标准差样本标准差 2,SS 它反映了它反映了总体均值总体均值的信息的信息它反映了总体它反映了总体方差的信息方差的信息11,1,2,nkkiiAXkn 3.3.样本样本k阶原点矩阶原点矩11() ,2,3,nkkiiBXXkn 4.4.样本样本k阶中心矩阶中心矩它反映了总体它反映了总体k 阶矩的信息阶矩的信息它反映了总体它反映了总体k 阶阶中心矩的信息中心矩的信息统计量的观察值统计量的观察值122121111;1()11() ;111,2,1()2,3,niiniiniinkkiinkkiixxnsxxnsxxnxknbxxkn

23、 结论结论: 若总体若总体X的的k阶原点矩阶原点矩()kkE X 存在存在, 由辛钦大数定理由辛钦大数定理, 当当n趋于趋于时时11,1,2,.nPkkikiAXkn 证明证明: 辛钦定理辛钦定理 及依概率收敛的序列的性质及依概率收敛的序列的性质 .第七章矩估计法的理论根据第七章矩估计法的理论根据1212(,.,)(,.,).Pkkg A AAg 经验分布函数经验分布函数是与总体是与总体X的分布函数的分布函数F(x)相应相应的统计量的统计量. 设设X1, X2, Xn, 是总体是总体F的一个样本的一个样本, 令令S(x)表表示示X1, X2, Xn中不大于中不大于x的随机变量的个数的随机变量的

24、个数. 定义定义经验分布函数经验分布函数Fn(x)为:为:1( )( ),.nFxS xxn 对于一个样本值对于一个样本值 x1, x2, xn, 经验分布函数经验分布函数Fn(x)的观察值仍记为的观察值仍记为Fn(x). 2. 经验分布函数经验分布函数例例1:设总体:设总体F具有一个样本值具有一个样本值1, 2, 3, 则经验分布则经验分布函数函数F3(x)的观察值为的观察值为30,1,1/3, 12( )2/3, 231,3xxF xxx 例例2:若样本值为:若样本值为1, 1, 2, 则经验分布函数则经验分布函数F3(x)的观的观察值为察值为30,1( )2/3, 121,2xF xxx

25、 一般地一般地,设设x1, x2, xn, 是总体是总体F的一个容量为的一个容量为n的样本值的样本值, 要求经验分布函数的观察值要求经验分布函数的观察值. 首先将首先将 x1, x2, xn, 按由小到大的顺序排列按由小到大的顺序排列, 并重新编号并重新编号, 设设为为x(1)x(2) x(n) , 则经验分布函数则经验分布函数Fn (x)的观察值的观察值为为,(1)( )(1)( )0,/ ,( )1,kknnxxk nxxxFxxx 对不同的样本值对不同的样本值, 得得到的经验分布函数不同到的经验分布函数不同.但当样本容量较大时但当样本容量较大时, 经经验分布函数验分布函数Fn(x)是总体

26、是总体分布函数分布函数F(x)的良好近的良好近似似.统计量的分布称为抽样分布。数理统计中常用到来自正态总体的三个分布: 2 2分布、 t t 分布和F F分布。 1. 定义定义: 设设X1, X2, Xn相互独立相互独立, 都服从正态分布都服从正态分布N(0,1), 则称随机变量:则称随机变量: 所服从的分布为所服从的分布为自由度为自由度为 n 的的2分布分布. 二、三大抽样分布二、三大抽样分布22( )n 记为记为2 分布分布222212nXXX 2. 2 分布的密度函数分布的密度函数 f(y) 曲线曲线/ 211222( /2),0( )0,0nnynyeyf yy 2( )n 3. 分位

27、点分位点 设设X 2(n),若对于,若对于 :0 34.382的值的值; 2)若若 P 2b=0.975, 求求b的值的值.b. 分布可加性分布可加性 若若X 2(n1), Y 2(n2 ), X,Y相互独相互独立立, 则则 X + Y 2(n1+n2 ).c. 期望与方差期望与方差 若若X 2(n),则,则E(X)= n,D(X)=2n.d若若X 2(n),则当,则当n充分大时充分大时,的的分分布布nnX2 近似正态分布近似正态分布N(0,1).定义定义 若若XN(0, 1), Y 2(n), X与与Y独立,则独立,则 ( )./Xtt nY n t(n) 称为自由度为称为自由度为n的的t

28、分布分布.t 分布分布t(n) 的概率密度为的概率密度为1221()2( )(1),( )2nnth ttnnn )2()2()(, 0)(),(. 1 nnntDtEntttn与与方方差差为为:其其数数学学期期望望分分布布的的具具有有自自由由度度为为.21)(lim,.0. 222tnethntt 函函数数的的性性质质有有由由再再分分布布概概率率密密度度的的图图形形,其其图图形形近近似似于于标标准准正正态态充充分分大大时时当当对对称称分分布布的的密密度度函函数数关关于于).1 , 0(Ntn近近似似足足够够大大时时,即即当当2. 性质性质分位点分位点 设设tt(n), 若对若对 :0 0,

29、满足满足Pt t (n)= ,则称,则称t (n)为为 t(n)的上的上 分位点分位点.)(nt 注注: :1( )( )tntn 1( )tn ( )tn 0.025( )(15)2.1315.ttnt 分分布布的的上上 分分位位点点可可查查表表求求得得,例例 zntn)(45的的值值,可可用用正正态态近近似似时时,对对于于常常用用的的当当定义定义 若若U 2(n1), V 2(n2),U,V独立,则独立,则1122/(,)./U nFF nnV n 称为第一自由度为称为第一自由度为n1 ,第二自由度为第二自由度为n2的的F分布分布。F 分布分布注注: 若若FF(n1, n2), 则则1/F

30、F(n2, n1).F分布的概率密度函数分布的概率密度函数111121/212212()/22122()(/)2,0( )( ) ()(1)20,0nnnnnnnnnyynnyyny 若若FF(n1,n2), F的概率密度为的概率密度为2. F分布的分位点分布的分位点对于对于 :0 0,满足满足PFF (n1, n2)= , 则称则称F (n1, n2)为为F(n1, n2) 的上的上 分位点;分位点;12(,)Fn n 112211(,)(,)Fn nFn n 注:注:0.95(12,9).F例例,求求0.950.0511(12,9)0.357(9,12)2.80FF (),E X 22()E S 设总体设总体X的均值为的均值为 , 方差为方差为 2, X1, X2, Xn 是来自总体是来自总体X的一个样本的一个样本, 则样本均值则样本均值 X 和样本方和样本方差差S2 有下面结论成立有下面结论成立,2(),D Xn 三、正态总体的样本均值和样本方差的分布三、正态总体的样本均值和样本方差的分布 定理定理 1 1 ( (样本均值的分布样本均值的分布) )设设X1, X2, Xn是取自正态总体是取自正态总体2( ,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论