常见的分布函数Word版_第1页
常见的分布函数Word版_第2页
常见的分布函数Word版_第3页
常见的分布函数Word版_第4页
常见的分布函数Word版_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、6 数理统计的基本概念6.1 基本要求1 理解总体、样本(品)、样本容量、简单随机样本的概念。能在总体分布给定情况下,正确无误地写出样本的联合分布,这是本章的难点。2* 该部分内容考研不作要求。 了解样本的频率分布、经验分布函数的定义,了解频率直方图的作法。3 了解c2分布、t分布和F分布的概念及性质,了解临界值的概念并会查表计算。4 理解样本均值、样本方差及样本矩的概念。了解样本矩的性质,能借助计算器快速完成样本均值、样本方差观察值的计算。了解正态总体的某些常用抽样分布。6.2 内容提要6.2.1 总体和样本1 总体和个体 研究对象的某项特征指标值的全体称为总体(或母体),组成总体的每个元素

2、称为个体。总体是一个随机变量,常用X,Y等来表示。2 样本 从总体中随机抽出n个个体称为容量为n的样本,其中每个个体称为样品,它们都是随机变量。3 简单随机样本 设X1,X2,Xn是来自总体X的容量为n的样本,如果这n个随机变量X1,X2,Xn相互独立且每个样品Xi与总体X具有相同的分布,则称X1,X2,Xn为总体X的简单随机样本。4 样本的联合分布149 / 31若总体X具有分布函数F(x),则样本(X1,X2,Xn)的联合分布函数为若总体X为连续型随机变量,其概率密度函数为f(x),则样本的联合概率密度为 (6.1)若总体X为离散型随机变量,其分布律为PX=ai=pi (i=1,2,n),

3、则样本的联合分布为 (6.2)其中为的任一组可能的观察值。6.2.2 样本分布1 频率分布 设样本值(x1,x2,xn)中不同的数值是x1*,x2*,xl*,记相应的频数分别为n1,n2,nl,其中x1*< x2*<< xl*且。则样本的频数分布及频率分布可由表6-1给出。表6-1指标Xx1*x2*xl*频数nin1n2nl频率2 经验分布函数定义 设(X1,X2,Xn)为总体X的一个样本,其样本值为(x1,x2,xn),则称函数为样本值(x1,x2,xn)的经验分布函数。若已知样本值(x1,x2,xn)的频数、频率分布表为指标Xx1*x2*xl*频数nin1n2nl 频率则

4、经验分布函数 (6.3)6.2.3 几个重要分布及临界值1分布 设X1,X2,Xn是相互独立的随机变量,且XiN (0,1) (i=1,2,n),则称随机变量服从自由度为n的分布,简记为(n)。2 分布的性质:(1)设(n),则, (2)设,且Y1,Y2相互独立,则有 3t分布 设,且X,Y相互独立,则称随机变量服从自由度为n的t分布,或称学生氏(Student)分布,简记为Tt(n)。4t分布的性质(1) (2) ;这里f (x)为t分布的概率密度函数。5F分布 设,且X,Y相互独立,则称随机变量所服从的分布是自由度为m,n的F分布,简记为FF(m,n)。6F分布的性质(1) 若则 (2)(

5、2) 若FF(m,n),则。7临界值(1) 标准正态分布的临界值 设XN(0,1),对给定的正数,若存在实数满足则称点为标准正态分布X的临界值 (或称上分位点或分位数)。由,若已知,可通过反查标准正态分布表,求出临界值。当时,表中无法查出,此时查表,再由可求得临界值。(2)分布的临界值 设,概率密度为f(x)。对给定的数(01),若存在实数满足则称数为分布的临界值。已知n,通过查分布表可求得。当n45时,可利用近似公式: 这里是标准正态分布的临界值。(3) t分布的临界值 设Tt(n),概率密度为f(x)。对给定的(01。若存在实数满足则称点为t分布的临界值。已知n,通过查t分布表可求得。注:

6、1) 类似标准正态分布临界值的性质,对t分布亦有:;2) 当n45时,可用正态分布近似 。(4) F分布的临界值 设FF(m, n),概率密度为f(x)。对给定的(01,若存在实数(m,n)满足 则称数(m,n)为F分布的临界值。注意公式6.2.4 统计量及样本矩1统计量 设(X1,X2,Xn)为总体X的一个样本,(X1,X2,Xn)是X1,X2,Xn的函数,若是连续函数且不含末知参数,则称(X1,X2,Xn)是一个统计量。2几个常用的统计量样本矩(1)样本均值。(2)样本方差。(3)样本标准差。(4)样本k阶原点矩。(5)样本k阶中心矩。3 样本矩与总体矩的关系由样本的独立性及与总体同分布这

7、一特性出发,运用数字特征的运算法则,可得:若总体X的期望、方差存在,即,又(X1,X2,Xn)是取自总体X的一个样本,则,;,。 (6.4)上述结论无论总体服从什么样的分布都正确,故它是计算任意总体,特别是非正态总体的样本均值和样本方差的期望、方差的常用结论。6.2.5 正态总体样本均值和样本方差的分布1 设总体XN(),()为样本,为样本均值,为样本方差(1) ,或 N (0,1); (6.5)(2) (6.6)(3) (6.7)(4) 样本均值与样本方差相互独立;(5) (6.8)2设()是取自总体X的一个样本,()是取自总体Y的一个样本,且这两个样本相互独立,即假定,是n1+n2个相互独

8、立的随机变量。若总体XN(),YN(),则有1)N(0,1); (6.9)2)F(n11,n21); (6.10)3)当时,有 t(n1+n22); (6.11)其中,。6.3 典型例题分析已知总体,求样本的联合分布例1.设(X1,X2,Xn)是取自总体X的一个样本。试在下列三种情况下,分别写出样本(X1,X2,Xn)的联合分布律或联合概率密度。(1)XB(1,p);(2)X服从参数为的指数分布;(3)X服从(0,)(>0)上的均匀分布。分析: 解此类题先写出总体X的分布律(或概率密度);再由Xi与X有相同的分布以及Xi之间的相互独立性,由式(6.1),(6.2)即可写出样本(X1,X2

9、,Xn)的联合分布律或联合概率密度。解:(1) 因为总体分布律为于是样本的联合分布律为:(2) 因为总体概率密度函数为: 所以,每一个样本的概率密度为:故样本的联合概率密度为:(3)因为总体概率密度函数为:所以样本Xi的概率密度为故,样本的联合概率密度为: 例2设XN(),(X1,X2,X3)为来自总体X的一个样本。试求样本(X1,X2,X3)的联合概率密度和样本均值的概率密度函数。解: 由于故又因为,所以,的概率密度函数为:注: 此题用到结论:若,则。这一结果有十分广泛的应用。例3.设总体服从泊松分布,是来自总体的简单随机样本(1) 计算;(2) 若容量为10的一组样本观察值为(1,2,4,

10、3,3,4,5,6,4,8),试计算样本均值,样本方差和经验分布函数。解: (1)解法一 由(6.4)式,因为,于是,故,解法二 故 (2),又X的频率分布表为指标X1234568频数ni1123111频率1/101/102/103/101/101/101/10所以,经验分布函数为注: (1)解法一直接运用样本矩与总体矩之间的关系,即(6.4)式求得; 解法二运用样本与总体同分布的特性及数字特征的运算法则求得。(2)写经验分布函数,可先列出频率分布表,这样不至遗漏或出错。例4 设总体为样本。试求:(1)数学期望与方差,的数学期望;(2)。解: 计算总体X的数学期望和方差故(1),。(2)因为,

11、所以注:当总体的期望和方差不能直接写出时,要先求总体的期望和方差,再求样本均值、样本方差及样本二阶中心矩的期望和方差。另外,要注意与之间的差异。由于,即是总体方差的无偏估计,而不是总体方差的无偏估计,因此,一般都是以作为方差的估计量。但,故当样本容量很大时,和两者相差很小,此时亦可用来估计总体方差。因此,有时把称为大样本方差,而有的书上也称为样本修正方差。本题(2)的解答用到了中心极限定理。由中心极限定理可得,不论总体服从什么分布,只要知道总体的数学期望,方差,则样本均值的渐近分布就为正态分布。即由此可知求样本均值落在某个区间内的概率,就可以利用上述结论近似计算,这是很重要的结论。*例5 设是

12、来自正态总体的简单样本,且则当时,统计量h服从c2-分布,其自由度为( )。解:解法1 令则欲使,就必须使,由于于是 令,则 ,此时。解法2 由于且相互独立,则从而所以 为使必须使同上面两个服从正态分布的随机变量比较可知 即 。注:本题虽用了两种不同的解法,但目的相同且明确,即由分布的定义并由h构成的特点,应选择恰当的a,b使h恰为两个标准正态分布的平方和。*例6 设是来自正态总体X的一个简单随机样本,证明:统计量T服从自由度为2的t-分布.。证明: 由于从而所以故 于是 又因为,且 从而与独立。于是由t分布的定义知注: 本题的关键是熟练掌握t分布的定义及正态总体下样本均值、样本方差的分布:

13、N(0,1), 。例7已知X。证明F(1,n)。证明: 因为 , 即 , 其中 ,又, 而 故由F-分布的定义知: 注: 本题解答看似简单,但本章所学的三个分布都涉及到。因而了解证明过程中每一步的来龙去脉,对于熟悉、掌握有关随机变量及其分布是一项基础性训练。例8设(X1,X2,Xn)是来自正态总体N(0,1)的样本。试求统计量(m<n)的抽样分布。解 因为所以 , 故 同理 于是 例9设(X1,X5)是来自正态总体N()的一个样本。试证:(1)当时,F(1,3);(2)当时,t(3)。解 (1) 于是由F-分布的定义,即得:(2) 据(1)的分析,由t-分布的定义即得结论。注: 本题仍是

14、关于F-分布和t-分布的基础训练题。例10 设为总体的一个样本,求。解: 因为 于是 ,由分布临界值的定义,查表可知,故。注: 本题由于出现了随机变量的平方和,故在寻找的分布时自然想到分布。但分布中的均服从N (0,1),所以只要将此处的标准化即可。由临界值的定义,一般查表是已知a,找临界值,而此处则相反,是已知临界值找a,故得到的是近似值。*例11 从正态总体中抽取容量为n的样本,如果要求其样本均值位于区间(1.4,5.4)内的概率不小于0.95,问样本容量n至少应取多少?Z1.281.6451.962.33F(z)0.9000.9500.9750.990解 : 设正态总体为X,则,从而由(

15、6.5)式得所以即。由此可得,即n³(1.96´3)2»34.57,故n至少应取35。例12设X1,X2,Xn为相互独立且分别服从正态分布N()的随机变量。设证明:。特别地,若N() i=1,2,n,则。证明 相互独立故 同理可证若N() i=1,2,n,则。注: 本例说明n个相互独立正态分布随机变量的线性组合仍服从正态分布。特殊情形:若取,则结论正是正态总体下样本均值的分布(6.5)式。该题结果可作为一般结论直接引用。例13设总体XN ()。现抽取容量为9的样本,得到,问是多少?解 :而服从自由度为n-1=8的t分布,又由于t分布的对称性,有令,查表知,由插值可

16、求得,即。注: 本题的关键是寻找含有统计量的分布。由于s2未知,故不能用来解题,但S已知,由(6.8)式得,于是由t分布临界值的定义即可顺利求得相应的概率。例14 设是来自总体X的随机样本,求下列概率。(1)(2)解 (1)由内容提要6.2.5知 »0.98-0.02=0.96(2)利用(6.7)式得注: 本题关键是要注意这两个统计量的差异。它们虽然都服从分布,但由于与的不同使其自由度也不同。查表时,上述两个随机变量的自由度分别是10和9。同例10由于是反查表,得到的仍是近似值。例15 求总体N(20,3)的容量分别为10,15的两个独立样本均值差的绝对值大于0.3的概率。解 设两独

17、立样本分别为X,Y,其样本均值分别为,则由内容提要中(6.9)式知即 故 注 :以上各题(例11-15),是掌握正态总体下几种常用统计量分布的基础训练题。例16 :;.证: 。 注: 本题是一道综合题,所述结果很重要。它说明,如果样本增加一个,其n+1个数据构成新样本的均值和方差的求法无需从头做起,只要根据前n个数据求出的均值和方差,加上新的这个数据便可由1)和2)计算出来。证明最后一步时用到结论。6.4 练习与测试1* 本题为1997年考研数学(四)试题。 设随机变量X和Y相互独立,且都服从正态分布,而和是分别来自总体X和Y的简单随机样本,则统计量服从 分布,参数(自由度)为 。2 设是来自

18、总体的容量为n+m的样本,则(1)统计量服从 分布。(2)统计量服从 分布。(3)统计量服从 分布。3 X服从正态分布且则服从 分布。4设为10个样本的均值,则。5 设随机变量,则T服从 分布。6 设是来自具有分布的总体的样本,则7 设分别来自两个正态总体的样本,且相互独立,分别为两个样本的样本方差,则。8* 本题选自1994年考研数学试题(四) 设是来自正态总体的样本,为样本均值,记则服从自由度为n-1的t-分布的随机变量是。9 已知总体X有概率密度试求样本的联合概率密度,并求10 设是总体X的样本,而X服从区间a,b上的均匀分布,试求。11 在总体中随机地抽取一个容量为5的样本。(1) 求样本均值在11到15之间取值的概率;(2) 求概率;(3) 求概率。12

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论