《概率论与数理统计(经管类)》 自学考试复习提纲_第1页
《概率论与数理统计(经管类)》 自学考试复习提纲_第2页
《概率论与数理统计(经管类)》 自学考试复习提纲_第3页
《概率论与数理统计(经管类)》 自学考试复习提纲_第4页
《概率论与数理统计(经管类)》 自学考试复习提纲_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、概率论与数理统计(经管类)(4183)自学考试复习提纲第一章 随机事件与概率1、排列组合公式:排列数 从m个人中挑出n个人进行排列的可能数。组合数 从m个人中挑出n个人进行组合的可能数。例如:袋中有8个球,从中任取3个球,求取法有多少种?解:任取出三个球与所取3个球顺序无关,故方法数为组合数注:排列数经常用组合数及乘法原理得到,并不直接写出。2、加法和乘法原理:加法原理(两种方法均能完成此事):m+n某件事由两种方法来完成,第一种方法可由m种方法完成,第二种方法可由n种方法来完成,则这件事可由m+n 种方法来完成。乘法原理(两个步骤分别不能完成这件事):m×n某件事由两个步骤来完成,

2、第一个步骤可由m种方法完成,第二个步骤可由n 种方法来完成,则这件事可由m×n 种方法来完成。例1、从北京到上海的方法有两类:第一类坐火车,若北京到上海有早、中、晚三班火车分别记作火1、火2、火3,则坐火车的方法有3种;第二类坐飞机,若北京到上海的飞机有早、晚二班飞机,分别记作飞1、飞2。问北京到上海的交通方法共有多少种。解:从北京到上海的交通方法共有火1、火2、火3、飞1、飞2共5种。它是由第一类的3种方法与第二类的2种方法相加而成。例2、从北京经天津到上海,需分两步到达。第一步从北京到天津的汽车有早、中、晚三班,记作汽1、汽2、汽3第二步从天津到上海的飞机有早、晚二班,记作飞1、

3、飞2问从北京经天津到上海的交通方法有多少种?解:从北京经天津到上海的交通方法共有:汽1飞1,汽1飞2,汽2飞1,汽2飞2,汽3飞1,汽3飞2。共6种,它是由第一步由北京到天津的3种方法与第二步由天津到上海的2种方法相乘3×2=6生成。3、基本事件、样本空间和事件:如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。随机试验所有可能结果构成的集合为样本空间,记为。中的元素称为样本点,记为。样本空间的任一子集称为随机事件。通常用大写字母A,B,C,表示事件,它们是的子集。必然事件:在一次试验中,一定出现

4、的事件,叫必然事件,习惯用表示必然事件。例如,掷一次骰子,点数6的事件一定出现,它是必然事件。不可能事件:在一次试验中,一定不出现的事件叫不可能事件,而习惯用表示不可能事件。例如,掷一次骰子,点数大于6的事件一定不出现,它是不可能事件。4、事件的关系与运算:关系:如果事件A的组成部分也是事件B的组成部分,(A发生必有事件B发生):如果同时有,则称事件A与事件B等价,或称A等于B:A=B。A、B中至少有一个发生的事件:,或者。属于A而不属于B的部分所构成的事件,称为A与B的差,记为A-B,也可表示为A-AB或者,它表示A发生而B不发生的事件。A、B同时发生:,或者。,则表示A与B不可能同时发生,

5、称事件A与事件B互不相容或者互斥。基本事件是互不相容的。称为事件A的逆事件,或称A的对立事件,记为。它表示A不发生的事件。互斥未必对立。运算:交换律: 结合律:A(BC)=(AB)C A(BC)=(AB)C 分配律:(AB)C=(AC)(BC) (AB)C=(AC)(BC) 德摩根律: ,例3、A,B,C表示三事件,用A,B,C的运算表示以下事件。(1)A,B,C三事件中,仅事件A发生(2)A,B,C三事件都发生(3)A,B,C三事件都不发生(4)A,B,C三事件不全发生(5)A,B,C三事件只有一个发生(6)A,B,C三事件中至少有一个发生解:(1)(2)(3) (4)(5)(6)例4、某射

6、手射击目标三次:A1表示第1次射中,A2表示第2次射中,A3表示第3次射中。表示三次中射中0次,表示三次中射中1次,表示三次中射中2次,表示三次中射中3次,请用、的运算来表示、。解:(1)(2)(3)(4)例5、A,B,C表示三事件,用A,B,C的运算表示下列事件。(1)A,B都发生且C不发生(2)A与B至少有一个发生而且C不发生(3)A,B,C都发生或A,B,C都不发生(4)A,B,C中最多有一个发生(5)A,B,C中恰有两个发生(6)A,B,C中至少有两个发生(7)A,B,C中最多有两个发生解:(1)(2)(3)(4)(5)(6)(7)例6、若=1,2,3,4,5,6;A=1,3,5;B=

7、1,2,3求(1);(2);(3) ;(4);(5);(6);(7),(8) 。解:(1)=1,2,3,5;(2)=1,3;(3)=2,4,6; (4)=4,5,6;(5)=4,6; (6)=2,4,5,6;(7)=2,4,5,6; (8)=4,6由本例可验算对偶律,正确例7、A,B,C为三事件,说明下列表示式的意义。(1);(2);(3);(4)解:(1)表示事件A,B,C都发生的事件。(2)表示A,B都发生且C不发生的事件。(3)AB表示事件A与B都发生的事件,对C没有规定,说明C可发生,也可不发生。AB表示A与B都发生的事件。(4)所以表示A与B都发生的事件。5、概率的公理化定义:设为样

8、本空间,为事件,对每一个事件都有一个实数P(A),若满足下列三个条件:1° 0P(A)1, 2° P() =13° 对于两两互不相容的事件,有(3°通常称为可列(完全)可加性)则称P(A)为事件的概率。6、古典概型:1° ,2° 。设任一事件,它是由组成的,则有P(A)=例8、 掷三次硬币,设A表示恰有一次出现正面,B表示三次都出现正面,C表示至少出现一次正面,求:(1)P(A);(2)P(B);(3)P(C)解:样本空间=正正正,正正反,正反正,正反反,反正正,反正反,反反正,反反反;(1) (2) (3)7、常用公式:加法公式:P

9、(A+B)=P(A)+P(B)-P(AB)当P(AB)0时,P(A+B)=P(A)+P(B)例9、 若P(A)=0.5,P(A+B)=0.8,P(AB)=0.3,求P(B)解:因为P(A+B)=P(A)+P(B)-P(AB)P(B)=P(A+B)+P(AB)-P(A)=0.8+0.3-0.5=0.6减法公式:P(A-B)=P(A)-P(AB)当BA时,P(A-B)=P(A)-P(B)当A=时,P()=1- P(B)例10、 已知P(B)=0.8,P(AB)=0.5,求。解:。例11、若A与B互不相容,P(A)=0.5,P(B)=0.3,求。解:(1)P(A+B)=P(A)+P(B)=0.8根据

10、对偶公式所以。 条件概率:定义 设A、B是两个事件,且P(A)>0,则称为事件A发生条件下,事件B发生的条件概率,记为。乘法公式:更一般地,对事件A1,A2,An,若P(A1A2An-1)>0,则有。事件独立性:两个事件的独立性设事件、满足,则称事件、是相互独立的。若事件、相互独立,且,则有若事件、相互独立,则可得到与、与、与也都相互独立。必然事件和不可能事件与任何事件都相互独立。与任何事件都互斥。多个事件的独立性设ABC是三个事件,如果满足两两独立的条件,P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(CA)=P(C)P(A)并且同时满足P(ABC)=P(A)P(

11、B)P(C),那么A、B、C相互独立。对于n个事件的独立性,可类似定义。例 12、甲、乙、丙三人独立地向同一目标各射击一次, 他们击中目标的概率分别为0.7, 0.8 和0.9,求目标被击中的概率。解:记=目标被击中,则全概公式:设事件满足1°两两互不相容,2°,则有。例13、有两批相同的产品, 第一批产品共14 件, 其中有两件为次品, 装在第一个箱中; 第二批有10 件, 其中有一件是次品, 装在第二个箱中。今在第一箱中任意取出两件混入到第二箱中, 然后再从第二箱中任取一件, 求从第二箱中取到的是次品的概率。解:用表示事件“在第一箱中取出两件产品的次品数”。用表示事件“

12、从第二箱中取到的是次品”。则,根据全概率公式,有:贝叶斯公式:设事件,及满足1° ,两两互不相容,>0,1,2,2° ,则,i=1,2,n。此公式即为贝叶斯公式。,(,),通常叫先验概率。,(,),通常称为后验概率。贝叶斯公式反映了“因果”的概率规律,并作出了“由果朔因”的推断。例14、设男女两性人口之比为51 : 49, 男性中的5% 是色盲患者, 女性中的2.5% 是色盲患者.今从人群中随机地抽取一人, 恰好是色盲患者, 求此人为男性的概率。解:用表示色盲,表示男性,则表示女性,由已知条件,显然有:因此:根据贝叶斯公式,所求概率为:伯努利概型:我们作了次试验,且满

13、足u 每次试验只有两种可能结果,发生或不发生;u 次试验是重复进行的,即发生的概率每次均一样;u 每次试验是独立的,即每次试验发生与否与其他次试验发生与否是互不影响的。这种试验称为伯努利概型,或称为重伯努利试验。用表示每次试验发生的概率,则发生的概率为,用表示重伯努利试验中出现次的概率,。例15、在四次独立试验中, 事件A 至少发生一次的概率为0.5904, 求在三次独立试验中, 事件A发生一次的概率.解:记=四次独立试验,事件A 至少发生一次,=四次独立试验,事件A 一次也不发生。而,因此。所以三次独立试验中, 事件A 发生一次的概率为:。第二章 随机变量及其概率分布1、离散型随机变量的分布

14、律 设离散型随机变量的可能取值为Xk(k=1,2,)且取各个值的概率,即事件(X=Xk)的概率为,则称上式为离散型随机变量的概率分布或分布律。有时也用分布列的形式给出:显然分布律应满足下列条件: (1) , ; (2) 例1、设离散型随机变量的概率分布为试确定常数.解:根据,得,即。 故 2、连续型随机变量的分布密度设是随机变量的分布函数,若存在非负函数,对任意实数,有,则称为连续型随机变量。称为的概率密度函数或密度函数,简称概率密度。密度函数具有下面4个性质:1° ;2°。3、分布函数设为随机变量,是任意实数,则函数称为随机变量X的分布函数,本质上是一个累积函数。注: 可

15、以得到X落入区间的概率。分布函数表示随机变量落入区间( ,x内的概率。分布函数具有如下性质:1° ;2° 是单调不减的函数,即时,有 ;3° , ;4° ,即是右连续的;5° 。对于离散型随机变量,;对于连续型随机变量, 。例2、已知20件同类型的产品中有2 件次品, 其余为正品. 今从这20 件产品中任意抽取4 次, 每次只取一件, 取后不放回. 以X 表示4 次共取出次品的件数, 求X 的概率分布与分布函数.解:X的可能取值为0,1,2。因为; ;所以X的分布律为X012PX的分布函数为4、六种常见的分布(1)0-1分布(又称为两点分布):

16、,(2)二项分布:在重贝努里试验中,设事件发生的概率为。事件发生的次数是随机变量,设为,则可能取值为。, 其中,则称随机变量服从参数为,的二项分布。记为。当时,这就是(0-1)分布,所以(0-1)分布是二项分布的特例。例3、某种元件的寿命X(单位:小时) 的概率密度函数为:求5 个元件在使用1500 小时后, 恰有2 个元件失效的概率。解:一个元件使用1500小时失效的概率为 设5个元件使用1500小时失效的元件数为Y,则。所求的概率为。(3)泊松分布:设随机变量的分布律为,则称随机变量服从参数为的泊松分布,记为或者P()。注:泊松分布为二项分布的极限分布(np=,n)。例4、某城市在长度为t

17、 (单位:小时) 的时间间隔内发生火灾的次数X 服从参数为0.5t 的泊松分布, 且与时间间隔的起点无关, 求下列事件的概率:(1) 某天中午12 时至下午15 时未发生火灾;(2) 某天中午12 时至下午16 时至少发生两次火灾.解:(1) ,由题意,所求事件的概率为.(2) , 由题意,所求事件的概率为.(4)均匀分布:设随机变量的值只落在a,b内,其密度函数在a,b上为常数,即  则称随机变量在a,b上服从均匀分布,记为。分布函数为 当时,落在区间内的概率为。例5、设随机变量求方程有实根的概率.解:方程有实根,亦即,显然,当时,方程有实根;又由于所求概率为:(5)指数

18、分布:指数分布的密度函数为:指数分布的分布函数为:注:记住积分公式有时候对解题有帮助!例6、某型号的飞机雷达发射管的寿命X(单位:小时) 服从参数为0.005 的指数分布, 求下列事件的概率:(1) 发射管寿命不超过100 小时;(2) 发射管的寿命超过300 小时;(3) 一只发射管的寿命不超过100 小时, 另一只发射管的寿命在100 至300 小时之间.解:(1) 发射管寿命不超过100 小时的概率:=0.39(2) 发射管的寿命超过300 小时的概率:(3) 一只发射管的寿命不超过100 小时, 另一只发射管的寿命在100 至300 小时之间.。(6)正态分布:参数为和的正态分布的密度

19、函数为:该函数的对称轴是,在对称轴处取得最大值:若参数和,则称此时为标准正态分布,即标准正态分布的分布函数记为:,其函数值已编制成表供查用。常用公式:上分位数:,已知,通过查表求。例7、某高校女生的收缩压X(单位:毫米汞柱) 服, 求该校某名女生:(1) 收缩压不超过105 的概率;(2) 收缩压在100 至120 之间的概率.解:(1)(2)。例8、公共汽车门的高度是按成年男性与车门碰头的机会不超过0.01 设计的, 设成年男性的身高X(单位:厘米) 服从正态分布N(170,), 问车门的最低高度应为多少?解:设车门高度分别为。则:查表得,因此,由此求得车门的最低高度应为184厘米。5、随机

20、变量函数的分布(1)离散型:已知的分布列为:的分布列(互不相等)如下:若有某些相等,则应将对应的相加作为的概率。例9、设随机变量X的分布函数为(1)求的概率分布; (2)求的概率分布。解:(1) X的可能取值为F(x)的分界点,即-1,1,2。因为 ;所以X的分布律为X-112P0.30.50.2(2) Y的可能取值为1,2。因为 ;所以Y的分布律为Y12P0.80.2(2)连续型:先利用X的概率密度fX(x)写出Y的分布函数FY(y)P(g(X)y),再利用变上下限积分的求导公式求出fY(y)。例10、设随机变量,求下列随机变量概率密度函数。解:设和分别为随机变量的分布函数和概率密度函数。已

21、知因为求导得 所以Y参数分别为-1, 22服从正态分布。第三章 多维随机变量及其概率分布1、联合分布(1)离散弄:如果二维随机向量(X,Y)的所有可能取值为至多可列个有序对(x,y),则称为离散型随机量。设=(X,Y)的所有可能取值为,且事件=的概率为pij,称为=(X,Y)的分布律或称为X和Y的联合分布律。联合分布有时也用下面的概率分布表来表示: YXy1y2yjx1p11p12p1jx2p21p22p2jxipi1这里pij具有下面两个性质:(1)pij0(i,j=1,2,);(2)(2)连续型:对于二维随机向量,如果存在非负函数,使对任意一个其邻边分别平行于坐标轴的矩形区域D,即D=(X

22、,Y)|a<x<b,c<y<d有则称为连续型随机向量;并称f(x,y)为=(X,Y)的分布密度或称为X和Y的联合分布密度。分布密度f(x,y)具有下面两个性质:(1) f(x,y)0;(2) 2、联合分布函数设(X,Y)为二维随机变量,对于任意实数x,y,二元函数称为二维随机向量(X,Y)的分布函数,或称为随机变量X和Y的联合分布函数。分布函数是一个以全平面为其定义域,以事件的概率为函数值的一个实值函数。分布函数F(x,y)具有以下的基本性质:(1)(2)F(x,y)分别对x和y是非减的,即当x2>x1时,有F(x2,y)F(x1,y);当y2>y1时,有F

23、(x,y2) F(x,y1);(3)F(x,y)分别对x和y是右连续的,即(4)(5)对于.例1、 设二维随机向量的分布函数为: 求.解:因为 ,所以 3、边缘分布(1)离散型:X的边缘分布为:;Y的边缘分布为:。(2)连续型:X的边缘分布密度为:Y的边缘分布密度为:例2、设二维随机向量的概率分布如下表所示, 求X 和Y 的边缘概率分布.XY02510.150.250.3530.050.180.02解:因为 所以,X的边缘分布为X13P0.750.25因为 所以,Y的边缘分布为Y025P0.200.430.37例3、设二维随机向量的概率密度函数为求边缘概率密度.解:因为,当时,;其他情形,显然

24、所以,X的边缘分布密度为 又因为,当时,其他情形,显然所以,Y的边缘分布密度为4、独立性(1)一般型:F(X,Y)=FX(x)FY(y)(2)离散型:(3)连续型:f(x,y)=fx(x)fy(y)直接判断,充要条件:可分离变量正概率密度区间为矩形例4、设二维随机向量的概率分布如下表所示, 求X 和Y 的边缘概率分布.XY02510.150.250.3530.050.180.02问取何值时, X 与Y 相互独立?解:因为 ,要X和Y相互独立,则 即 ,得由 ,得 即 ,得5、二维均匀分布设随机向量(X,Y)的分布密度函数为其中SD为区域D的面积,则称(X,Y)服从D上的均匀分布,记为(X,Y)

25、U(D)。6、二维正态分布设随机向量(X,Y)的分布密度函数为其中是5个参数,则称(X,Y)服从二维正态分布,记为(X,Y)N(由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布,即XN(但是若XN(,(X,Y)未必是二维正态分布。7、X,Y的函数的分布Z=X+Y:根据定义计算:对于连续型,fZ(z)两个独立的正态分布的和仍为正态分布()。n个相互独立的正态分布的线性组合,仍服从正态分布。, 例5、设二维随机向量的概率密度函数为求的概率密度函数.解: 的概率密度函数可以写为当时,若,则,若或,被积函数为0,此时显然有;当时,若,则,若或,被积函数为0,此时显然有;的其他情形,

26、显然有.综合起来,有第四章 随机变量的数字特征(1)一维随机变量的数字特征离散型连续型期望期望就是平均值设X是离散型随机变量,其分布律为P()pk,k=1,2,n,(要求绝对收敛)设X是连续型随机变量,其概率密度为f(x),(要求绝对收敛)函数的期望Y=g(X) Y=g(X)方差D(X)=EX-E(X)2,标准差, 矩对于正整数k,称随机变量X的k次幂的数学期望为X的k阶原点矩,记为vk,即k=E(Xk)= , k=1,2, .对于正整数k,称随机变量X与E(X)差的k次幂的数学期望为X的k阶中心矩,记为,即=, k=1,2, .对于正整数k,称随机变量X的k次幂的数学期望为X的k阶原点矩,记

27、为vk,即k=E(Xk)= k=1,2, .对于正整数k,称随机变量X与E(X)差的k次幂的数学期望为X的k阶中心矩,记为,即=k=1,2, .切比雪夫不等式设随机变量X具有数学期望E(X)=,方差D(X)=2,则对于任意正数,有下列切比雪夫不等式切比雪夫不等式给出了在未知X的分布的情况下,对概率的一种估计,它在理论上有重要意义。(2)期望的性质(1) E(C)=C(2) E(CX)=CE(X)(3) E(X+Y)=E(X)+E(Y),(4) E(XY)=E(X) E(Y),充分条件:X和Y独立; 充要条件:X和Y不相关。(3)方差的性质(1) D(C)=0;E(C)=C(2) D(aX)=a

28、2D(X); E(aX)=aE(X)(3) D(aX+b)= a2D(X); E(aX+b)=aE(X)+b(4) D(X)=E(X2)-E2(X)(5) D(X±Y)=D(X)+D(Y),充分条件:X和Y独立; 充要条件:X和Y不相关。 D(X±Y)=D(X)+D(Y) ±2E(X-E(X)(Y-E(Y),无条件成立。而E(X+Y)=E(X)+E(Y),无条件成立。(4)常见分布的期望和方差期望方差0-1分布p二项分布np泊松分布几何分布超几何分布均匀分布指数分布正态分布n2nt分布0(n>2)(5)二维随机变量的数字特征期望函数的期望方差协方差对于随机变

29、量X与Y,称它们的二阶混合中心矩为X与Y的协方差或相关矩,记为,即与记号相对应,X与Y的方差D(X)与D(Y)也可分别记为与。相关系数对于随机变量X与Y,如果D(X)>0, D(Y)>0,则称为X与Y的相关系数,记作(有时可简记为)。|1,当|=1时,称X与Y完全相关:完全相关而当时,称X与Y不相关。以下五个命题是等价的:;cov(X,Y)=0;E(XY)=E(X)E(Y);D(X+Y)=D(X)+D(Y);D(X-Y)=D(X)+D(Y).协方差矩阵混合矩对于随机变量X与Y,如果有存在,则称之为X与Y的k+l阶混合原点矩,记为;k+l阶混合中心矩记为:(6)协方差的性质(i) c

30、ov (X, Y)=cov (Y, X);(ii) cov(aX,bY)=ab cov(X,Y);(iii) cov(X1+X2, Y)=cov(X1,Y)+cov(X2,Y);(iv) cov(X,Y)=E(XY)-E(X)E(Y).(7)独立和不相关(i) 若随机变量X与Y相互独立,则;反之不真。(ii) 若(X,Y)N(),则X与Y相互独立的充要条件是X和Y不相关。例1、袋中有 5 个球, 编号为1,2,3,4,5, 现从中任意抽取3 个球, 用X表示取出的3 个球中的最大编号,求E(X).解:X的可能取值为3,4,5.因为;所以 例2、设随机变量X的概率密度函数为, 求解:例3、设随机

31、变量X的概率密度函数为, 分别计算的期望和的期望解:因为 ,其中 ,所以 故 例4、设二维随机向量的概率密度函数为, 求.解:因为,当时,当时,所以,又 故 例6、设随机变量,并且X 与Y 相互独立,求和.解:因为, 所以 ,又X和Y相互独立,故 .例7、设二维随机向量的概率分布如下表:XY-101010.10.30.10.10.10.3求解容易求得的概率分布为:的概率分布为:的概率分布为:,于是有,例8、设二维随机向量的概率密度函数为, 求.解:因为,当时,所以 于是 由对称性得 ,又因为 所以 故 第五章 大数定律及中心极限定理(1)大数定律切比雪夫大数定律设随机变量X1,X2,相互独立,

32、均具有有限方差,且被同一常数C所界:D(Xi)<C(i=1,2,),则对于任意的正数,有特殊情形:若X1,X2,具有相同的数学期望E(XI)=,则上式成为伯努利大数定律设是n次独立试验中事件A发生的次数,p是事件A在每次试验中发生的概率,则对于任意的正数,有伯努利大数定律说明,当试验次数n很大时,事件A发生的频率与概率有较大判别的可能性很小,即这就以严格的数学形式描述了频率的稳定性。辛钦大数定律设X1,X2,Xn,是相互独立同分布的随机变量序列,且E(Xn)=,则对于任意的正数有(2)中心极限定理列维林德伯格定理设随机变量X1,X2,相互独立,服从同一分布,且具有相同的数学期望和方差:,

33、则随机变量的分布函数Fn(x)对任意的实数x,有此定理也称为独立同分布的中心极限定理。棣莫弗拉普拉斯定理设随机变量为具有参数n, p(0<p<1)的二项分布,则对于任意实数x,有例1、已知正常男性成人每毫升的血液中含白细胞平均数是7300, 标准差是700. 使用切比雪夫不等式估计正常男性成人每毫升血液中含白细胞数在5200到9400之间的概率.解:设每毫升血液中含白细胞数为,依题意得,由切比雪夫不等式,得.例2、设由机器包装的每包大米的重量是一个随机变量, 期望是10千克, 方差是0.1千克2. 求100袋这种大米的总重量在990至1010千克之间的概率.解:设第i袋大米的重量为

34、Xi,(i =1,2,100),则100袋大米的总重量为。因为 , 所以 ,由中心极限定理知,近似服从故 例3、银行为支付某日即将到期的债券需准备一笔现金. 这批债券共发放了500 张, 每张债券到期之日需付本息1000元. 若持券人(一人一张) 于债券到期之日到银行领取本息的概率为0.4,问银行于该日应至少准备多少现金才能以99.9% 的把握满足持券人的兑换?解:设领取本息的人数为X,则。有,由中心极限定理知,近似服从又设要准备现金x元,则满足兑换的概率为依题意,要满足 ,即要 解之得 故应准备234000元的现金。第六章 统计量及其抽样分布(1)数理统计的基本概念总体在数理统计中,常把被考

35、察对象的某一个(或多个)指标的全体称为总体(或母体)。我们总是把总体看成一个具有分布的随机变量(或随机向量)。个体总体中的每一个单元称为样品(或个体)。样本我们把从总体中抽取的部分样品称为样本。样本中所含的样品数称为样本容量,一般用n表示。在一般情况下,总是把样本看成是n个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。在泛指任一次抽取的结果时,表示n个随机变量(样本);在具体的一次抽取之后,表示n个具体的数值(样本值)。我们称之为样本的两重性。样本函数和统计量设为总体的一个样本,称()为样本函数,其中为一个连续函数。如果中不包含任何未知参数,则称()为一个统计量。常见统计

36、量及其性质样本均值样本方差样本标准差 样本k阶原点矩样本k阶中心矩,,其中,为二阶中心矩。(2)正态总体下的四大分布正态分布设为来自正态总体的一个样本,则样本函数t分布设为来自正态总体的一个样本,则样本函数其中t(n-1)表示自由度为n-1的t分布。设为来自正态总体的一个样本,则样本函数其中表示自由度为n-1的分布。F分布设为来自正态总体的一个样本,而为来自正态总体的一个样本,则样本函数其中表示第一自由度为,第二自由度为的F分布。(3)正态总体下分布的性质与独立。例1、设是抽自均值为、方差为的总体的样本, 与分别为该样本均值。证明与. 证:例2、设是抽自均值为、方差为的总体的样本,证明: (1

37、) (2) 证:(1) (2) 例3、假设某种类型的电阻器的阻值服从均值 200 欧姆, 标准差10 欧姆的分布, 在一个电子线路中使用了25个这样的电阻.(1) 求这25个电阻平均阻值落在199 到202 欧姆之间的概率;(2) 求这25个电阻总阻值不超过5100 欧姆的概率.解:由抽样分布定理,知近似服从标准正态分布N(0,1),因此(1) (2) 第七章 参数估计1、点估计(1)矩会计:设总体X的分布中包含有未知数,则其分布函数可以表成它的k阶原点矩中也包含了未知参数,即。又设为总体X的n个样本值,其样本的k阶原点矩为这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建

38、立方程,即有由上面的m个方程中,解出的m个未知参数即为参数()的矩估计量。注:若为的矩估计,为连续函数,则为的矩估计。(2)极大似然估计:当总体X为连续型随机变量时,设其分布密度为,其中为未知参数。又设为总体的一个样本,称为样本的似然函数,简记为Ln.当总体X为离型随机变量时,设其分布律为,则称为样本的似然函数。若似然函数在处取到最大值,则称分别为的最大似然估计值,相应的统计量称为最大似然估计量。注:若为的极大似然估计,为单调函数,则为的极大似然估计。例1、设 为抽自二项分布B(m,p) 的样本 试求p 的矩估计和极大似然估计。 解:(1)求p 的矩估计。,因此总体的一阶原点矩为 按矩法估计有

39、 因此p 的矩估计 (2)求p 的极大似然估计。参数P的极大似然函数为令即 由此得P的极大似然估计例2、设总体为指数分布 其概率密度函数为 求参数的矩估计和极大似然估计。 解 设为X的一个样本。(1)求的矩估计。因为总体为指数分布,因此总体的一阶原点矩为 按矩法估计有 因此的矩估计(2)求的极大似然估计。参数的极大似然函数为 lnL=似然方程为 =0解得 2、估计量的评价标准(1)无偏性:设为未知参数的估计量。若E ()=,则称 为的无偏估计量。(2)有效性:设和是未知参数的两个无偏估计量。若,则称有效。(3)一致性:设是的一串估计量,如果对于任意的正数,都有则称为的一致估计量(或相合估计量)

40、。若为的无偏估计,且则为的一致估计。只要总体的E(X)和D(X)存在,一切样本矩和样本矩的连续函数都是相应总体的一致估计量。例3、设总体的概率密度函数为(这是指数分布的另一种形式).从该总体中抽出样本,考虑的如下四种估计 (1)这四个估计中,哪些是的无偏估计? (2试比较这些估计的方差。 解:(1)因为是从总体中抽出的样本,所以因此都是的无偏估计。(2) 由上述各式知:。例4、一个电子线路上电压表的读数X服从上的均匀分布,其中是该线路上电压的真值,但它是未知的,假设是此电压表上读数的一组样本,(1)证明样本均值不是的无偏估计。(2) 求的矩估计,证明它是的无偏估计。解:(1)因为是总体的一组样

41、本,所以 因此样本均值不是的无偏估计。(2)令得的矩估计为 因为所以是的无偏估计。3、区间估计(1)置信区间和置信度:设总体X含有一个待估的未知参数。如果我们从样本出发,找出两个统计量与,使得区间以的概率包含这个待估参数,即那么称区间为的置信区间,为该区间的置信度(或置信水平)。例5、从工厂产品库中随机抽取16只零件,测得它们的长度(单位:厘米)为 2.14,2.10,2.13,2.15,2.13,2.12,2.13,2.10, 2.15,2.12,2.14,2.10,2.13,2.11,2.14,2.11假设零件长度分布为,试分如下两种情况求的置信系数为0.90的置信区间:(1);(2)未知

42、。 解:(1)因为总体,对给定数据经计算可得,=2.125,n=16,对于置信系数0.9,可查标准正态分布表,得临界值,于是所求置信区间为 = (2) 对给定数据经计算可得,S=0.017,因为总体服从正态分布,n=16,所以 t(15),对于置信系数0.9,可查t分布表,得临界值,于是所求置信区间为 =(2.117,2.133)(2)单正态总体的期望和方差的区间估计设为总体的一个样本,在置信度为下,我们来确定的置信区间。具体步骤如下:(i)选择样本函数;(ii)由置信度,查表找分位数;(iii)导出置信区间。已知方差,估计均值(i)选择样本函数(ii) 查表找分位数(iii)导出置信区间未知

43、方差,估计均值(i)选择样本函数(ii)查表找分位数(iii)导出置信区间方差的区间估计(i)选择样本函数(ii)查表找分位数(iii)导出的置信区间例6、假设某单位员工每天用于阅读书籍的时间服从正态分布,现从该单位随机抽取了16名员工,已知他们用于阅读书籍的平均时间为50分钟,样本标准差为20分钟,试以95%的置信度估计该单位员工用于阅读书籍的平均时间的置信区间。(解析:本题是正态总体,总体方差未知,小样本,显然采用下面公式计算:(以下具体计算略)第八章 假设检验一、 假设检验的基本概念:1. 小概率原理:小概率事件在一次试验中很难发生,但并不意味着绝对不会发生。2. 对总体参数的取值所作的

44、假设,称为原假设(或零假设),记做H0;原假设的对立假设称为备选假设(备择假设),记做H1。3. 犯“H0为真,但拒绝H0”这种错误的概率称为显著水平;这种错误称为第一类错误(弃真错误);4. “H0不成立,但接受H0”的这种错误称为第二类错误;犯这种错误的概率记做。5. 用来判断是否接受原假设的统计量称为检验统计量。6. 当检验统计量取某个范围D内的值时,我们拒绝原假设H0;这是D称为拒绝域;拒绝域的边界点称为临界点。7. 假设检验的基本思想:先假定H0成立,在这个前提下用样本数据进行推导、计算,如果导致小概率事件发生,择拒绝H0,否则就接受H0。8. 当检验的统计量N(0,1)时:H0:0

45、H1:0双假检验:H0:0H1:0左侧检验:H0:0H1:0右侧检验:9. 假设检验的五个步骤:1) 提出原假设与备选假设。原则:1、把含有等号的式子作为原假设;2、从样本做出猜测而希望证实的问题作为备选假设;2) 选取统计量。通过选取适当的统计量来构造小概率事件;3) 按P(拒绝H0H0真)确定拒绝域;4) 计算统计量的值;5) 做出判断:当样本值落在拒绝域内,小概率事件发生,拒绝H0;当样本值不落在拒绝域内,小概率事件没发生,接受H0。二、 总体均值的假设检验:已知条件H0H1检验统计量及其分布拒绝域XN(,2)0,已知0,或大样本000<00>0XN(,2)未知,小样本000

46、<00>0未知三、总体比例的假设检验:已知条件H0H1检验统计量及其分布拒绝域大样本三、 两个总体均值(比例)之差的假设检验:已知条件H0H1检验统计量及其分布拒绝域,1,2已知,或大样本1212(设)121<2121>2,1,2未知,或小样本1212121<2121>2大样本例1、某饮料生产商声称其生产的某种瓶装饮料中营养成分A的含量不低于6克,现随机抽取100瓶该饮料,测得其营养成分A含量的平均值为5.65克,样本标准差为1.2克。试问该饮料生产商的声明是否真实可信?(可靠性取95%,Z0.05=1.645,Z0.025=1.96)解析:,: 从而拒绝域

47、为,即 计算得Z2.91,从而 从而拒绝,即认为该饮料生产商的声明不真实。例2、已知2003年某地人均消费为6000元。2004年,从该地个人消费总体中随机取得的一个样本为:7000、7500、8000、8000、7000、9000、8000、8500、9000(单位:元)。假设该地个人消费服从正态分布。(1)求2004年该地个人消费的样本均值。(2)求2004年该地个人消费的样本方差。(3)请以95的可靠性检验2004年该地人均消费是否比2003年有显著上涨?并给出相应的原假设、备择假设及检验统计量。(t0.025(8)=2.306,t0.025(9)=2.26,t0.025(10)=2.2

48、28,t0.05(8)=1.8595,t0.05(9)=1.8331,t0.05(10)=1.8125)解析:(1)8000元(2)562500元(3):,: 拒绝域为1.8595 计算得8>1.8595 从而拒绝,即认为有显著上涨。例3、某培训中心采用A、B两种培训方法对学员进行培训。从使用A培训方法和使用B培训方法的学员中分别随机抽取了10人,测得他们完成培训所需的时间分别为10,15,8,13,18,20,17,12,12,15小时和10,15,7,8,6,13,14,15,12,10小时。假设使用A培训方法和使用B培训方法所需培训时间均服从正态分布,且方差相等。(1)求使用A培训

49、方法和使用B培训方法的学员所需培训时间的平均值及样本方差。(2)请给出检验A、B两种培训方法所需培训时间是否有显著性差异的检验的原假设和备择假设。(3)检验A、B两种培训方法所需培训时间是否有显著性差异(显著性水平取5%)。(t0.05(18)=1.734,t0.05(19)=1.729,t0.05(20)=1.7247,t0.025(18)=2.1,t0.025(19)=2.09,t0.025(20)=2.086)解析:(1)均值公式: 样本方差公式: (此处具体计算略) (2):,: (3)选用检验统计量 其拒绝域为 (下面具体计算略)例4、某工厂生产金属丝,产品指标为折断力,折断力的方差被用作工厂生产精度的表征,方差越小,表明精度越高,以往工厂一直把该方差保持在64以下,最近从一批产品中抽取10根做折断力试验,测得结果如下: 578 572 570 568 572 570 572 596 584 570由上述样本数据算得:,厂方怀疑金属丝折断力的方差变大了,试在的显著性水平下检验厂方的怀疑。解:,:选取在的显著性水平下,拒绝域为计算从而不能拒绝原假设,从而可认为样本方差的偏大系偶然因素造成。第九章 回归分析一、 相关分析:1. 线性相关

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论