大连理工大学数理统计复习资料_第1页
大连理工大学数理统计复习资料_第2页
大连理工大学数理统计复习资料_第3页
大连理工大学数理统计复习资料_第4页
大连理工大学数理统计复习资料_第5页
已阅读5页,还剩158页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 概率统计是研究什么的?客观世界中发生的现象客观世界中发生的现象 确定性的确定性的在一定条件下必然发生的现象在一定条件下必然发生的现象1)1)抛出物体会下落。抛出物体会下落。2)2)充满气的气球受到挤压会破。充满气的气球受到挤压会破。 随机性的随机性的在一定条件下,具有多种可能在一定条件下,具有多种可能的结果,但事先又不能预知确切的结果的结果,但事先又不能预知确切的结果1)1)拋掷一枚硬币,其结果可能是国徽面朝上,也可能是国徽面拋掷一枚硬币,其结果可能是国徽面朝上,也可能是国徽面朝下。朝下。2)2)足球比赛,其结果可能是胜、平、负。足球比赛,其结果可能是胜、平、负。3)3)投掷一个骰子,其结果

2、有投掷一个骰子,其结果有6 6种,即可能出现种,即可能出现1,2,3,4,5,61,2,3,4,5,6点。点。4)4)股市的变化。股市的变化。5)5)人的寿命。人的寿命。 经典的数学理论如微积分、微分方程等经典的数学理论如微积分、微分方程等都是研究确定性现象的有力的数学工具。都是研究确定性现象的有力的数学工具。 对于某些随机现象,虽然对个别试验来对于某些随机现象,虽然对个别试验来说,无法预言其结果,但在相同的条件说,无法预言其结果,但在相同的条件下,进行大量的重复试验或观察时,却下,进行大量的重复试验或观察时,却又呈现出某些规律性(如拋掷硬币)。又呈现出某些规律性(如拋掷硬币)。 随着社会生产

3、与科学技术的发展,研究随着社会生产与科学技术的发展,研究随机现象的统计规律性的理论和方法获随机现象的统计规律性的理论和方法获得了迅速的发展,形成了数学的一个重得了迅速的发展,形成了数学的一个重要分支,并被广泛应用于工业、农业、要分支,并被广泛应用于工业、农业、军事、科技、经济等领域。军事、科技、经济等领域。 概率统计概率统计研究和揭示随机现象研究和揭示随机现象统计规律性的学科统计规律性的学科 应用范围广泛。例如:应用范围广泛。例如: 气象预报、水文预报、地震预报、产品质量检验、气象预报、水文预报、地震预报、产品质量检验、产品的可靠性评估、寿命预测、生物统计、卫生统计、产品的可靠性评估、寿命预测

4、、生物统计、卫生统计、保险、金融等各领域。保险、金融等各领域。 经典数学与概率论与数理统计是相经典数学与概率论与数理统计是相辅相成,互相渗透的。辅相成,互相渗透的。第一章第一章 概率论的基本概念概率论的基本概念 随机事件及其运算随机事件及其运算 频率与概率频率与概率1.1随机试验、样本空间、随机事件随机试验、样本空间、随机事件一、随机试验(简称一、随机试验(简称“试验试验”)随机试验的特点随机试验的特点 (1)(1)试验可以在相同条件下重复进行;试验可以在相同条件下重复进行;(2)(2)每次试验的可能结果不止一个,并且事先可每次试验的可能结果不止一个,并且事先可以知道试验所有可能的结果;以知道

5、试验所有可能的结果;(3)(3)进行一次试验之前不能确定出现的是哪个结进行一次试验之前不能确定出现的是哪个结果果; ;满足上述特点的试验称为满足上述特点的试验称为随机试验随机试验,一般记为,一般记为E。 E1:拋拋掷一枚质地均匀的硬币掷一枚质地均匀的硬币,观察正面和反面出观察正面和反面出现的情况;现的情况;E2:掷一颗质地均匀的骰子,观察其出现的点数;掷一颗质地均匀的骰子,观察其出现的点数;E3:记录某网站一分钟内受到的点击次数;记录某网站一分钟内受到的点击次数;E4:在某高楼上任意掷下一朵玫瑰花,观察其在地在某高楼上任意掷下一朵玫瑰花,观察其在地面上的位置;面上的位置;E5:从某品牌的电视机

6、中任取一台,观察其使用寿从某品牌的电视机中任取一台,观察其使用寿命。命。随机试验的例子二、样本空间二、样本空间 1、样本空间:、样本空间:由随机试验的一切可能的结果由随机试验的一切可能的结果组成的一个集合组成的一个集合称为试验称为试验E的的样本空间样本空间,记为,记为S或或; 2、样本点:、样本点:试验的每一个可能的结果试验的每一个可能的结果(或样或样本空间的元素)称为一个本空间的元素)称为一个样本点样本点,记为,记为e。三、随机事件三、随机事件例例 将一颗骰子连掷两次,依次记录所得点将一颗骰子连掷两次,依次记录所得点数,则所有可能出现的结果即该试验的数,则所有可能出现的结果即该试验的样本空间

7、是:样本空间是:(1,1)(1,2)(1,6)(2,1)(2,2)(2,6)(6,1)(6,2)(6,6)Snnnnnnn其中有其中有3636个可能的结果,即个可能的结果,即3636个样本点。个样本点。每做一次试验,这每做一次试验,这3636个样本点必有一个且仅有一个个样本点必有一个且仅有一个出现。在很多时候,我们是对样本空间中某些子集出现。在很多时候,我们是对样本空间中某些子集感兴趣,称之为感兴趣,称之为事件事件。如事件如事件A:两次投掷所得点数之和为:两次投掷所得点数之和为8 8。事件事件B:两次投掷所得点数相等。:两次投掷所得点数相等。A发生发生(2,6),(3,5),(4,4),(5,

8、3),(6,2)(2,6),(3,5),(4,4),(5,3),(6,2)记作:记作:A=(2,6),(3,5),(4,4),(5,3),(6,2)=(2,6),(3,5),(4,4),(5,3),(6,2),A是是S的子集。的子集。类似地,类似地,B=(1,1),(2,2),=(1,1),(2,2),(6,6),(6,6),B也是也是S的子的子集。集。 1、随机事件随机事件随机试验随机试验E的样本空间的样本空间S的子集为的子集为E的的随机事件随机事件,简称事件。通常用大写字母,简称事件。通常用大写字母A、B、C表示表示。 任何事件均可表示为样本空间的某个子集任何事件均可表示为样本空间的某个子

9、集.称称事件事件A发生发生当且仅当试验的结果是子集当且仅当试验的结果是子集A中的元素中的元素。当一个事件仅包含一个样本点时,称为基本事件当一个事件仅包含一个样本点时,称为基本事件 2、两个特殊事件两个特殊事件 必然事件必然事件S 包含所有的样本点,每次试验包含所有的样本点,每次试验它总是发生它总是发生 不可能事件不可能事件 空集空集,不包含任何样本点,不包含任何样本点,每次试验总是不发生每次试验总是不发生1.事件的包含与相等事件的包含与相等 A中的样本点一定属于B,记为AB,也称A是B的子事件。 A与B两个事件相等:AB AB且BA。四、事件之间的关系四、事件之间的关系ABAB2n个事件个事件

10、A1, A2, An至少有一个发生,记作至少有一个发生,记作iniA12” 可列个事件可列个事件A1, A2, An 至少有一个发生,记至少有一个发生,记作作inA13.积事件积事件 :A与与B同时发生,记作同时发生,记作 ABAB3n个事件个事件A1, A2, An同时发生,记作同时发生,记作nniiAAAA2113”可列个事件可列个事件A1, A2, An , 同时发生,记作同时发生,记作nniAAAA2114.差事件差事件 :AB称为称为A与与B的差事件的差事件,表示事件表示事件A发生而发生而B不发生,不发生,它是由属于它是由属于A而不属于而不属于B的样本点所构成的事件。的样本点所构成的

11、事件。5.互斥的事件互斥的事件 :AB= ,指事件指事件A与与B不能同时发生。不能同时发生。又称又称A与与B互不相容。互不相容。基本事件是基本事件是两两互不相容的两两互不相容的6. 互逆的互逆的事件事件 AB , 且且AB ;BAAABAB记作,称为 的补事件 易见A与与B互逆:互逆:事件事件A与与B既不能同既不能同时发生,又不能同时时发生,又不能同时不发生。即在每次试不发生。即在每次试验中,验中,A与与B有且仅有且仅有一个发生。有一个发生。五、事件的运算五、事件的运算1、交换律:、交换律:ABBA,ABBA2、结合律、结合律:(AB)CA(BC), (AB)CA(BC)3、分配律、分配律:(

12、AB)C(AC)(BC), (AB)C(AC)(BC)4、对偶、对偶(De Morgan)律律: .,kkkkkkkkAAAABAABBABA可推广1.2 频率与概率频率与概率 一、频率一、频率定义定义1.1.设在相同的条件下,进行了设在相同的条件下,进行了n次试验。次试验。若随机事件若随机事件A在这在这n次试验中发生了次试验中发生了nA次次, ,则比值则比值nnA称为事件称为事件A在这在这n次试验中发生的频率,次试验中发生的频率,记作记作fn(A),即,即fn(A)=nnA实践证明:当试验次数实践证明:当试验次数n增大时,增大时, 随机事随机事件件A的频率的频率fn(A) 逐渐趋向一个稳定值

13、逐渐趋向一个稳定值。这是随机现象固有的性质,即频率的稳这是随机现象固有的性质,即频率的稳定性,也就是我们所说的随机现象的统定性,也就是我们所说的随机现象的统计规律性。计规律性。二、概率二、概率从直观上来看,事件从直观上来看,事件A A的概率是指事件的概率是指事件A A发发生的可能性生的可能性1、概率的统计定义、概率的统计定义设随机事件设随机事件A在在n次重复试验中发生的次数为次重复试验中发生的次数为nA,若当试验次数若当试验次数n很大时,频率很大时,频率nA/n稳定地在某稳定地在某一数值一数值p的附近摆动,且随着试验次数的附近摆动,且随着试验次数n的增加,的增加,其摆动的幅度越来越小,则称数其

14、摆动的幅度越来越小,则称数p为随机事件为随机事件A的概率,记为的概率,记为P(A)=p。由定义,显然有由定义,显然有00P( (A)1, )1, P(S)=1,P()=0。设设E是随机试验,是随机试验,S是它的样本空间,对于是它的样本空间,对于E的每一个的每一个事件事件A,赋予一个实数,赋予一个实数P(A)与之对应,如果集合与之对应,如果集合函数函数P()具有如下性质:具有如下性质:非负性:对任意一个事件非负性:对任意一个事件A,均有,均有P(A)0 ;规范性:规范性:P(S)=1;可列可加性:若可列可加性:若A1,A2,An,是两两互不相是两两互不相容的事件序列,即容的事件序列,即AiAj=

15、(ij, i, j=1,2,),有,有P(A1A2An)= P(A1)+ P(A2) + P(An)+则称则称P(A)为事件为事件A的的概率概率。2、概率的公理化定义(、概率的公理化定义(Kolmogorov公理)公理)3、概率的性质、概率的性质 不可能事件的概率为零,即不可能事件的概率为零,即P()=0;概率具有概率具有,即若事件即若事件A1,A2,An两两互不两两互不相容,则必有相容,则必有P(A1A2An)= P(A1)+ P(A2) + P(An)设设A,B是两个事件,则是两个事件,则P(A- -B)=P(A)- -P(AB)特别地,若特别地,若A B,则,则AB=B,有有P(A- -

16、B)=P(A)- -P(B),且且P(A)P(B),此性质称为此性质称为。)(1)(APAP 对任一事件对任一事件A,有有 对任意两个事件对任意两个事件A,B,有,有P(AB)=P(A)+P(B) - - P(AB)可推广可推广。 对任意两事件对任意两事件A,B,有,有)()()(BAPABPAP二、条件概率二、条件概率在事件在事件B发生的条件下,事件发生的条件下,事件A发生的发生的条件概条件概率率,记为,记为 )()()|(BPABPBAP 乘法法则乘法法则 )()|()(BPBAPABP )()|()(APABPABP 全概率公式:全概率公式:贝叶斯公式:贝叶斯公式: niiiABPAPB

17、P1)|()()( niiimmmABPAPAPABPBAP1)|()()()|()|(二、事件的统计独立性二、事件的统计独立性两个事件的统计独立两个事件的统计独立()( ) ( )P ABP A P B多个事件的统计独立多个事件的统计独立 kjikjijjAPAP11)()(第二章第二章 随机变量及其分布随机变量及其分布 随机变量随机变量 离散型随机变量离散型随机变量 随机变量的分布函数随机变量的分布函数 连续型随机变量连续型随机变量 随机变量函数的分布随机变量函数的分布用实数来表示随机试验的各种结果,即引入随机变量用实数来表示随机试验的各种结果,即引入随机变量的概念。这样,不仅可以更全面揭

18、示随机试验的客观的概念。这样,不仅可以更全面揭示随机试验的客观存在的统计规律性,而且可使我们用(高等数学)微存在的统计规律性,而且可使我们用(高等数学)微积分的方法来讨论随机试验。积分的方法来讨论随机试验。 在随机试验中,如果把试验中观察的对象与实数对应在随机试验中,如果把试验中观察的对象与实数对应起来,即建立对应关系起来,即建立对应关系X,使其对试验的每个结果,使其对试验的每个结果e,都有一个实数都有一个实数X(e)与之对应,与之对应, 试验的结果试验的结果e实数实数X( (e) )对应关系对应关系XX的取值随着试验的重复而不同,的取值随着试验的重复而不同, X是一个变量,且是一个变量,且在

19、每次试验中,究竟取什么值事先无法预知,也就是在每次试验中,究竟取什么值事先无法预知,也就是说说X是一个随机取值的变量。由此,我们称是一个随机取值的变量。由此,我们称X为为随机变随机变量量。 关于随机变量关于随机变量(及向量及向量)的研究,是概率论的的研究,是概率论的中心内容中心内容对于一个随机试验,我们所关心的往往是与对于一个随机试验,我们所关心的往往是与所研究的特定问题有关的某个或某些量,而所研究的特定问题有关的某个或某些量,而这些量就是随机变量这些量就是随机变量随机事件是从静态的观点来研究随机现象,随机事件是从静态的观点来研究随机现象,而随机变量则是一种动态的观点而随机变量则是一种动态的观

20、点2.12.1随机变量的概念随机变量的概念定义定义2.1 2.1 设设E是一个随机试验,是一个随机试验,S=e 是试验是试验E的样的样本空间,如果对于本空间,如果对于S中的每一个样本点中的每一个样本点e,有一实,有一实数数X( (e) )与之对应,这个定义在与之对应,这个定义在S上的实值函数上的实值函数X( (e) )就称为就称为随机变量随机变量(random variable)(random variable)。由定义可知,随机变量由定义可知,随机变量X( (e) )是以样本空间是以样本空间S为定为定义域的一个单值实值函数。义域的一个单值实值函数。有关随机变量定义的几点说明:有关随机变量定义

21、的几点说明:(1)随机变量随机变量X是样本点是样本点e的函数,常用大写字母的函数,常用大写字母X、Y、Z 或小写希腊字母或小写希腊字母 (xi)、 (eta)、 (zeta)等表示等表示。(2)随机变量随机变量X随着试验结果而取不同的值,因而在试验随着试验结果而取不同的值,因而在试验结束之前,只知道其可能的取值范围,而事先不能预结束之前,只知道其可能的取值范围,而事先不能预知它取什么值,对任意实数区间知它取什么值,对任意实数区间( (a,b) ),“aXb”的的概率是确定的;概率是确定的;(3)(3)随机变量随机变量X( (e) )的值域即为其一切可能取值的全体构的值域即为其一切可能取值的全体

22、构成的集合;成的集合;(4)(4)引入随机变量后,就可以用随机变量描述事件,而引入随机变量后,就可以用随机变量描述事件,而且事件的讨论,可以纳入随机变量的讨论中。且事件的讨论,可以纳入随机变量的讨论中。 离 散 型连 续 型混 合 型随机变量的分类随机变量的分类:随机变量随机变量2.2 2.2 离散型随机变量离散型随机变量 一、一、 离散型随机变量及其分布律离散型随机变量及其分布律1 1、离散型随机变量的概念、离散型随机变量的概念 若某个随机变量的所有可能取值是有限多个或若某个随机变量的所有可能取值是有限多个或可列无限多个,则称这个随机变量为可列无限多个,则称这个随机变量为离散型随机变离散型随

23、机变量量。 讨论随机变量的目的是要研究其统计规律性,讨论随机变量的目的是要研究其统计规律性,要知道离散型随机变量要知道离散型随机变量X的统计规律必须且只须知的统计规律必须且只须知道道X的所有可能取值以及的所有可能取值以及X取每一个可能值的概率。取每一个可能值的概率。 2 2、分布律、分布律 设离散型随机变量设离散型随机变量X,其所有可能取值为,其所有可能取值为x1, x2, , xk, , 且取这些值的概率依次为且取这些值的概率依次为p1, p2, , pk, , 即即则称则称P(X=xk)=pk(k=1, 2, ) 为随机变量为随机变量X 的概率分布的概率分布律(律(列列),简称),简称分布

24、律分布律。分布分布律律可用表格形式表示为:可用表格形式表示为:11)(kkkkpxXP1 1P(X=xk)=pk, (k=1, 2, )满足满足(1 1)P(X=xk)=pk0,(k=1, 2, )(2)Xx1x2x3xkPp1p2p3pk二、几个常用的离散型随机变量的概率分布律二、几个常用的离散型随机变量的概率分布律1、 (0-1)分布分布 若随机变量若随机变量X的分布律为:的分布律为: P(X=k)=pk(1- -p)1- -k, k=0,1,(0p1)则称则称X服从以服从以p为参数的为参数的0-1分布,记为分布,记为XB(1,p)。0-1分布的分布律也可写成分布的分布律也可写成X1 10

25、 0Pp1-1-p即随机变量只可能取即随机变量只可能取0 0,1 1两个值,且取两个值,且取1 1的概率为的概率为p,取取0 0的概率为的概率为1-1-p (0p00是常数,则称是常数,则称X服从参数为服从参数为 的泊松分的泊松分布,记为布,记为XP( )。, 2 , 1 , 0,!)(kekkXPk4、几何分布几何分布 设随机变量设随机变量X的可能取值是的可能取值是1,2,3,1,2,3, ,且且P(X=k)=(1- -p)k- -1p=qk- -1p,k=1,2,3, ,其中其中0p1是参数,则称随机变量是参数,则称随机变量X服从参数服从参数p为的几何分布。为的几何分布。几何分布背景:几何

26、分布背景: 随机试验的可能结果只有随机试验的可能结果只有2 2种,种,A与与试验进行到试验进行到A发生为止的概率发生为止的概率P( (X=k) ),即,即k次次试验,前试验,前k- -1次失败,第次失败,第k次成功。次成功。A2.3 随机变量的分布函数随机变量的分布函数 离散型随机变量,我们可用分布律来完整地描离散型随机变量,我们可用分布律来完整地描述。而对于非离散型随机变量,由于其取值不可能述。而对于非离散型随机变量,由于其取值不可能一个一个列举出来,而且它们取某个值的概率可能一个一个列举出来,而且它们取某个值的概率可能是零。例如:灯泡的寿命是零。例如:灯泡的寿命 由于许多随机变量的概率分布

27、情况不能以其取由于许多随机变量的概率分布情况不能以其取某个值的概率来表示,因此我们往往关心随机变量某个值的概率来表示,因此我们往往关心随机变量X取值落在某区间取值落在某区间 ( (a, ,b 上的概率上的概率( (ab) )。 由于由于 a Xb=Xb-Xa,(,(ab) ),因此对,因此对任意任意xR,只要知道事件,只要知道事件 Xx 发生的概率,则发生的概率,则X落在落在( (a, ,b 的概率就立刻可得。因此我们用的概率就立刻可得。因此我们用P( (Xx) )来讨论随机变量来讨论随机变量X的概率分布情况。的概率分布情况。P( (Xx) ):“随随机变量机变量X取值不超过取值不超过x的概率

28、的概率”。 定义定义 设设X是一随机变量,是一随机变量,X是任意实数,则实值是任意实数,则实值函数函数F(x)P X x, x(-(-,+)+)称为随机变量称为随机变量X的的累积累积分布函数,分布函数,简称分布函数。简称分布函数。 有了分布函数定义,任意有了分布函数定义,任意x1,x2R, x1x2,随,随机变量机变量X落在落在( (x1, ,x2 里的概率可用分布函数来计算:里的概率可用分布函数来计算:P x1X x2PX x2PX x1 F(x2)F(x1).xX 在这个意义上可以说,在这个意义上可以说,分布函数完整地描述了随分布函数完整地描述了随机变量的统计规律性机变量的统计规律性,或者

29、说,或者说,分布函数完整地表示分布函数完整地表示了随机变量的概率分布情况了随机变量的概率分布情况。 一、累积分布函数的概念一、累积分布函数的概念二、累积分布函数的性质二、累积分布函数的性质 1、单调不减性单调不减性:若:若x1x2, 则则F(x1) F(x2); 2、归一归一 性性:对任意实数:对任意实数x,0 F(x) 1,且,且 ; 1)(lim)(, 0)(lim)(xFFxFFxx)()(lim) 0(000 xFxFxFxx3、右连续性:对任意实数右连续性:对任意实数x,反之,具有上述三个性质的实函数,必是某个反之,具有上述三个性质的实函数,必是某个随机变量的累积分布函数。故该三个性

30、质是累随机变量的累积分布函数。故该三个性质是累积分布函数的充分必要性质积分布函数的充分必要性质。2.4 连续型随机变量1 1、概念概念 设设F(X)是随机变量是随机变量X的分布函数,若的分布函数,若存在非负可积函数存在非负可积函数f(x),(- - x+ + ),使对一切,使对一切实数实数x,均有,均有xdttfxXPxF)()()(则称则称X为连续型随机变量,且称为连续型随机变量,且称f(x)为随机变为随机变量量X的的概率密度函数概率密度函数,简称密度。常记为,简称密度。常记为X f(x) , (- - x+ )一、连续型随机变量及其概率密度函数一、连续型随机变量及其概率密度函数X连续型随机

31、变量,则连续型随机变量,则X的分布函数必是连续函数。的分布函数必是连续函数。 (1) 非负性非负性 f(x) 0,(- - x0)f(x)的图像为的图像为22()21( ),(,)2xf xex (1) 单峰对称单峰对称 密度曲线关于直线密度曲线关于直线x= 对称对称,即f( + +x)=f( - -x),x(- -,+)21正态分布密度函数正态分布密度函数f(x)的性质的性质(2)x= 时,时, f(x)取得最大值取得最大值f( )= ; (3)x= 处有拐点;处有拐点;函数由此从凹函数变成函数由此从凹函数变成凸函数。凸函数。(4) 的大小直接影响概率的分布,的大小直接影响概率的分布, 越大

32、,曲线越越大,曲线越平坦平坦, 越小,曲线越陡峭越小,曲线越陡峭。(如图)。(如图)正态分布也称为高斯正态分布也称为高斯( (Gauss)Gauss)分布分布(5)曲线曲线f(x)以以x轴为渐近线。轴为渐近线。正态分布随机变量正态分布随机变量X的分布函数为的分布函数为xtdtexF222)(21)(其图像为其图像为O xF(x)1标准正态分布标准正态分布 当参数当参数 0, 21时,称随机变量时,称随机变量X服从服从标准正标准正态分布,记作态分布,记作XN(0, 1)。.,21)(22xexx分布函数表示为分布函数表示为xdtexXPxxt,21)(22其其密度函数密度函数表示为表示为O x2

33、11(x)标准正态分布的密标准正态分布的密度函数与分布函数度函数与分布函数的图像分别为的图像分别为可得可得)()(xx1)()(xx正态随机变量的正态随机变量的3 3 原则:原则:设设X N( , 2)在工程应用中,通常认为在工程应用中,通常认为 ,忽略,忽略 的值。质量控制中,常用标准指标值的值。质量控制中,常用标准指标值3 3 作两条线,当生产过作两条线,当生产过程的指标观察值落在两线之外时发出警报,表明生产出现异常。程的指标观察值落在两线之外时发出警报,表明生产出现异常。6827. 01) 1 (21)(XPXP9545. 01)2(22)2(XPXP(3 )32 (3) 10.9974

34、XP XP 在一次试验中,正态分布的随机变量在一次试验中,正态分布的随机变量X落在以落在以 为中心,为中心,3 3 为半为半径的区间径的区间( ( - -3 , +3 )内的概率相当大内的概率相当大(0.9974),即,即X几乎必然落几乎必然落在上述区间内,或者说在一般情形下,在上述区间内,或者说在一般情形下,X在一次试验中落在在一次试验中落在( ( - -3 , +3 )以外的概率可以忽略不计。以外的概率可以忽略不计。 31XP3X3、指数分布、指数分布设连续型随机变量设连续型随机变量X具有概率密度具有概率密度0001)(xxexfx则称则称X服从参数为服从参数为0的指数分布。的指数分布。其

35、分布函数为其分布函数为 0001)()()(xxedttfxXPxFxx指数分布的另一种表示形式指数分布的另一种表示形式 0, 00,)(xxexfXx则称则称X服从参数为服从参数为 0的指数分布。的指数分布。其分布函数为其分布函数为)( xfxO0,0( )1,0 xxF xex2.5 2.5 随机变量函数的分布随机变量函数的分布 Y=g(X),如,如sin(X)离散型随机变量:总结离散型随机变量:总结Y Y不同取值对应的不同取值对应的X X的概的概率率 连续型随机变量:连续型随机变量:确定确定Y Y的取值范围;的取值范围;列出列出Y Y的分布函数(化作的分布函数(化作X X落在一定范围的积

36、落在一定范围的积分);分);1.1. 求导得求导得Y Y的密度函数的密度函数第三章第三章 多维随机变量及其分布多维随机变量及其分布 二维随机变量二维随机变量 随机变量的独立性随机变量的独立性3.1 3.1 二维随机变量及其分布二维随机变量及其分布1 1、二维随机变量、二维随机变量 设设S=e是随机试验是随机试验E的样本空间,的样本空间,X=X(e),Y=Y(e)是定义在是定义在S上的随机变量,则由它们构成的一上的随机变量,则由它们构成的一个二维向量个二维向量(X,Y)称为二维随机变量或二维随机向量。称为二维随机变量或二维随机向量。 二维随机变量二维随机变量(X,Y)的性质不仅与的性质不仅与X及

37、及Y有关,而有关,而且还依赖于这两个随机变量的相互关系。因此,单独且还依赖于这两个随机变量的相互关系。因此,单独讨论讨论X和和Y的性质是不够的,需要把的性质是不够的,需要把(X,Y)作为一个整作为一个整体来讨论。体来讨论。一、二维随机变量及其分布函数一、二维随机变量及其分布函数 定义定义3.13.1 设设(X,Y)是二维随机变量,二元是二维随机变量,二元实值函数实值函数F(x,y)=P(X xY y)=P(X x,Y y) x(- -,+),y(- -,+)称为二维随机变量称为二维随机变量(X,Y)的的分布函数分布函数,或称,或称X与与Y的联合分布函数。的联合分布函数。即即F(x,y)为事件为

38、事件X x与与Y y同时发生的概率。同时发生的概率。2 2、二维随机变量的联合分布函数、二维随机变量的联合分布函数几何意义:几何意义:若把二维随机变量若把二维随机变量(X,Y)看成平面上随机点的坐标,看成平面上随机点的坐标,则分布函数则分布函数F(x,y)在在(x,y)处的函数值处的函数值F(x0,y0)就表示就表示随机点随机点(X,Y)落在区域落在区域 - -X x0, - -Y y0中的概率。如图阴影部分:中的概率。如图阴影部分:(x0,y0)xyO 对于对于(x1, y1), (x2, y2) R2, (x1 x2, y1y2 ),则随机点,则随机点(X,Y)落在矩形区域落在矩形区域x1

39、X x2,y1Y y2内的概率可用分内的概率可用分布函数表示为布函数表示为P(x1X x2,y1Y y2)F(x2, y2)F(x1, y2) F (x2, y1)F (x1, y1)(x1, y1)(x2, y2)O x1 x2 xy1y2y分布函数分布函数F(x, y)具有如下性质:具有如下性质:(,)lim( , )0 xyFF x y 1),(lim),(yxFFyx0),(lim),(yxFyFx0),(lim),(yxFxFy(1)对任意对任意(x, y) R2 , 0 F(x, y) 1。(2)F(x, y)是变量是变量x或或y的非降函数,即的非降函数,即 对任意对任意y R,

40、当当x1x2时,时,F(x1,y) F(x2,y); 对任意对任意x R, 当当y1y2时,时,F(x,y1) F(x,y2)。(3),(),(lim), 0(000yxFyxFyxFxx),(),(lim)0,(000yxFyxFyxFyy(4)函数函数F(x,y)关于关于x是右连续的,关于是右连续的,关于y也也是右连续的,是右连续的,即对任意即对任意x R,y R,有,有(5)对于任意对于任意(x1, y1),(x2, y2) R2,(x1x2,y10,1|1|lim1 niinXnP2 大数定律以严格的数学形式表达了随大数定律以严格的数学形式表达了随机现象最根本的性质之一:机现象最根本的

41、性质之一:平均结果的稳定性平均结果的稳定性中心极限定理中心极限定理 自从高斯指出测量误差服从正态分布之后,自从高斯指出测量误差服从正态分布之后,人们发现,正态分布在自然界中极为常见人们发现,正态分布在自然界中极为常见. 观察表明,如果一个量是由大量相互独立观察表明,如果一个量是由大量相互独立的随机因素的影响所造成,而每一个因素在总的随机因素的影响所造成,而每一个因素在总影响中所起的作用不大影响中所起的作用不大. 则这种量一般都服从则这种量一般都服从或近似服从正态分布或近似服从正态分布.定理:(定理:(独立同分布下的中心极限定理)独立同分布下的中心极限定理)它表明,当它表明,当n充分大时,充分大

42、时,n个具有期望和方差个具有期望和方差的独立同分布的的独立同分布的r.v之和近似服从正态分布之和近似服从正态分布.设设X1,X2, 是独立同分布的随机是独立同分布的随机变量序列,且变量序列,且E(Xi)= ,Var(Xi)= ,i=1,2,,则,则2 lim1xnnXPniinx-2t -dte212 第六章第六章 数理统计的基本概念数理统计的基本概念 总体和样本总体和样本 几个常用的分布和抽样分布几个常用的分布和抽样分布总体和样本总体和样本一、总体一、总体 在数理统计中,把所研究的对象的全体称为在数理统计中,把所研究的对象的全体称为总体总体。通常指研究对象的某项数量指标,一般记为通常指研究对

43、象的某项数量指标,一般记为X。 把总体的每一个基本单位称为把总体的每一个基本单位称为个体个体。如全体在校生的身高如全体在校生的身高X,某批灯泡的寿命,某批灯泡的寿命Y。对不同的个体,对不同的个体,X的取值是不同的。的取值是不同的。X是一个随机变量。是一个随机变量。X的分布也就完全描述了我们所关心的指标,即总体的分布也就完全描述了我们所关心的指标,即总体就是指分布。就是指分布。二、随机样本二、随机样本从总体从总体X中抽出若干个个体称为中抽出若干个个体称为样本样本,一般记为,一般记为(X1,X2,Xn)。n称为称为样本容量样本容量。而对这。而对这n个个体的一次个个体的一次具体的观察结果具体的观察结

44、果(x1,x2,xn)是完全确定的一组数值是完全确定的一组数值,但它又随着每次抽样观察而改变。,但它又随着每次抽样观察而改变。(x1,x2,xn)称为样称为样本观察值。本观察值。如果样本如果样本(X1,X2,Xn)满足满足(1)代表性:样本的每个分量代表性:样本的每个分量Xi与与X有相同的分布;有相同的分布;(2)独立性:独立性: X1,X2,Xn是相互独立的随机变量,是相互独立的随机变量,则称样本则称样本(X1,X2,Xn)为为简单随机样本简单随机样本。设总体设总体X的分布为的分布为F(x),则样本,则样本(X1,X2,Xn)的联合分的联合分布为布为),(),(221121nnnxXxXxX

45、PxxxF)()()(2211nnxXPxXPxXPniinxFxFxFxF121)()()()(当总体当总体X是离散型时,其分布律为是离散型时,其分布律为iipxXP)(, 2 , 1i样本的联合分布律为样本的联合分布律为)()()(),(22112211nnnnxXPxXPxXPxXxXxXPniixXP1)(当总体当总体X是连续型时,是连续型时, Xf(x),则样本的联合密度为,则样本的联合密度为niinxfxxxf121)(),(总体、样本、样本观察值的关系总体、样本、样本观察值的关系总体总体 样本样本 样本观察值样本观察值 理论分布理论分布 统计是从手中已有的资料统计是从手中已有的资

46、料样本观察值,去推断总样本观察值,去推断总体的情况体的情况总体分布。总体分布决定了样本取值的总体分布。总体分布决定了样本取值的概率规律,也就是样本取到样本观察值的规律,因而概率规律,也就是样本取到样本观察值的规律,因而可以用样本去推断总体。可以用样本去推断总体。三、统计量三、统计量 样本是我们进行分析和推断的起点,但实际上我样本是我们进行分析和推断的起点,但实际上我们并不直接用样本进行推断,而需对样本进行们并不直接用样本进行推断,而需对样本进行“加工加工”和和“提炼提炼”,将分散于样本中的信息集中起来,为此,将分散于样本中的信息集中起来,为此引入统计量的概念。引入统计量的概念。 (X1,X2,

47、Xn)g(X1,X2,Xn)其中其中g(x1,x2,xn)是是(x1,x2,xn)的连续函数。的连续函数。如果如果g(X1,X2,Xn)中不含有未知参数,称中不含有未知参数,称g(X1,X2,Xn)为为统计量统计量。(不含未知参数的样本的函数)(不含未知参数的样本的函数)),(2NX如如2,未知:未知:niiXnX11niiX12是统计量是统计量X221iX不是统计量不是统计量若若已知,已知,2未知:未知:521,maxXXXX是统计量是统计量几个常用的统计量几个常用的统计量样本均值样本均值niiXnX11样本方差样本方差niiXXnS122)(11样本标准差样本标准差niiXXnS12)(1

48、1样本样本k阶原点矩阶原点矩nikikXnA11, 2 , 1knikikXXnM1)(1, 2 , 1k样本样本k阶中心矩阶中心矩几个常用的分布和抽样分布几个常用的分布和抽样分布(一一) 2分布分布1、定义:设、定义:设n个个r.v. X1,X2,Xn,XiN(0,1),i=1,2,n则称则称一、常用分布一、常用分布 2分布、分布、 t 分布和分布和F分布。分布。 )(2122nXnii服从自由度为服从自由度为n的的 2分布。分布。 2分布的密度函数分布的密度函数f(y)曲线曲线/ 211222( /2)10,0( )0,0( ),0.nnynxtyeyf yyxte dt x其中2、性质、

49、性质(1)nE)(2nD2)(2(2) 2分布的可加性分布的可加性)(121nX)(222nXX1, X2 相互独立,则相互独立,则X1+X2 2(n1+n2)练习练习3、 2分布表及有关计算分布表及有关计算(1)构成构成 P 2(n)=p,已知,已知n,p可查表求得可查表求得;(2)有关计算有关计算pnP)(2)(2npp分位点分位点1、定义、定义 若若XN(0, 1),Y 2(n),X与与Y独立,则独立,则).(ntnYXT t(n)称为自由度为称为自由度为n的的t分布。分布。(二二) t分布分布t(n) 的概率密度为的概率密度为tntnnntfn,)1 ()2()21()(2122、基本

50、性质、基本性质: (1) f(t)关于关于t=0(纵轴纵轴)对称;对称;(2) f(t)的极限为的极限为N(0,1)的密度函数,即的密度函数,即 3、t分布表及有关计算分布表及有关计算(1)构成:构成: Pt(n)=p(2)有关计算有关计算Pt(n)=p,=tp(n)xettftn,21)()(lim22p注注:)()(1ntntpp)(1ntp)(ntp(三三) F分布分布1、定义、定义 若若X 2(n1),Y 2(n2) ,X,Y独立,则独立,则),(2121nnFnYnXF 称为第一自由度为称为第一自由度为n1 ,第二自由度为,第二自由度为n2的的F分布,其分布,其概率密度为概率密度为0

51、, 00,)1)(2()()/)(2()(2/ )(2122122/212121111yyynnnynnnnyhnnnnn2、 F分布表及有关计算分布表及有关计算(1)构成:构成:PF(n1,n2)=p(2)有关计算有关计算PF(n1,n2)=p=Fp(n1,n2)一、抽样分布一、抽样分布 1、设、设(X1,X2,Xn)是正态总体是正态总体N(,2)的样本,的样本,则则 (1)nNX2,(2) 1() 1(222nSn(3)X与与S2独立独立2、设、设(X1i,X2i,Xnii)是来自具有相同方差是来自具有相同方差2 ,均值为,均值为i的正态总体的正态总体N(i,2)的样本,的样本,i=1,2

52、,t,且设这,且设这t个样本个样本之间相互独立,设之间相互独立,设分别是第分别是第i个总体的样本均值和样本方差,个总体的样本均值和样本方差,i=1,2,t,则有则有(1)2t个随机变量个随机变量injjiiiXnX11injijiiiXXnS122)(11;,21tXXX22221,tSSS是相互独立的。是相互独立的。(2)()() 1(22112212tnXXSntinjijiniiii其中其中tnnnn21(3)当当t=2时,有时,有)2(112) 1() 1()()(2121212222112121nntnnnnSnSnXX3、设、设(X1,X2,Xn)是正态总体是正态总体N(,2)的样

53、本,的样本,则则) 1(ntnSX。 称称为为混混合合样样本本方方差差其其中中就就有有, , ,假假定定进进一一步步, ,2) 1() 1() 1, 1(/1/1)(2122221122121212221*nnSnSnSnntnnSYXTww(2)4、设、设(X1,X2,Xn1)是是N(1,12)的样本,的样本,(Y1,Y2,Yn2)是是N(2,22)的样本,且相互独立,的样本,且相互独立,S12,S22是样本方差,是样本方差,则则(1) 1, 1(2122222121nnFSSF第六章第六章 参数估计参数估计 参数的点估计参数的点估计 估计量的评选标准估计量的评选标准 正态总体参数的区间估计

54、正态总体参数的区间估计参数的点估计参数的点估计一、参数估计的概念一、参数估计的概念问题的提出:已知总体问题的提出:已知总体X的分布函数的分布函数F(x;1,2,k),其中其中1, 2, k是未知参数。是未知参数。点估计:由总体的样本点估计:由总体的样本(X1,X2,Xn)对每一个未知参数对每一个未知参数i(i=1,2,k)构造统计量构造统计量),(21niiXXX作为参数作为参数i的的估计估计,称,称),(21niiXXX为参数为参数i的的估计量估计量。样本样本(X1,X2,Xn)的一组取值的一组取值(x1,x2,xn)称为样本观察称为样本观察值,将其代入估计量值,将其代入估计量i,得到数值,

55、得到数值),(21niixxx称为参数称为参数i的的估计值估计值。由于由于),(21nixxx现用它来估计未知参数现用它来估计未知参数 ,故称这种估计为故称这种估计为点估计点估计。是实数域上的一个点,是实数域上的一个点,点估计的经典方法是:点估计的经典方法是: (1)矩估计法矩估计法 (2)极大似然估计法极大似然估计法二、矩估计法二、矩估计法(简称简称“矩法矩法”) 英国统计学家皮尔逊英国统计学家皮尔逊(Karl Pearson)提出提出1、矩法的基本思想:、矩法的基本思想:以样本矩作为相应的总体同阶矩的估计;以样本矩作为相应的总体同阶矩的估计;以样本矩的函数作为相应的总体矩的同一函数的以样本

56、矩的函数作为相应的总体矩的同一函数的估计。估计。2、矩法的步骤:、矩法的步骤:设总体设总体X的分布为的分布为F(x;1,2,k),k个参数个参数1,2,k待估计,待估计,(X1,X2,Xn)是一个样本是一个样本 。(1)计算总体分布的计算总体分布的i阶原点矩阶原点矩E(Xi)=i(1,2,k),i=1,2,k,(计算到计算到k阶矩为止,阶矩为止,k个参数个参数);(2)列方程列方程njkjkkkknjjknjjkXnXXEXnXXEXnXXE121122221212111)(),(1)(),(1)(),(从中解出方程组的解,记为从中解出方程组的解,记为k21,则则k21,为参数为参数1,2,k

57、的矩估计。的矩估计。二、极大似然估计法二、极大似然估计法( (R.A.Fisher) )例例 设总体设总体X服从服从01分布,即分布律为分布,即分布律为)()1 ()(1ixxxfxXPi=0,1,其中,其中01未知未知(X1,X2,Xn)为为X的一个样本,设其观察值为的一个样本,设其观察值为(x1,x2,xn),则事件则事件(X1=x1,X2=x2,Xn=xn)发生的概率为发生的概率为niiinnxXPxXxXxXP12211)(),(niixf1);(nixxii11)1 (niiniixnx11)1 (对于给定的样本观察值,上述概率为对于给定的样本观察值,上述概率为的函数,称其为似的函数

58、,称其为似然函数,并记为然函数,并记为L()为使上述随机事件的概率达到最大,为使上述随机事件的概率达到最大,应选取使应选取使L()达到最大的参数值达到最大的参数值(如果存在如果存在),即,即)(max)(10LL1、极大似然估计法的基本思想、极大似然估计法的基本思想 一般说,事件一般说,事件A发生的概率与参数发生的概率与参数 有关,有关, 取值不同,则取值不同,则P(A)也不同。因而应记也不同。因而应记事件事件A发生的发生的概率为概率为P(A| )。若。若A发生了,则认为此时的发生了,则认为此时的 值应是值应是在在 中使中使P(A| )达到最大的那一个达到最大的那一个。使得取该样本值发生的可能

59、性最大。使得取该样本值发生的可能性最大。 由样本的具体取值,选择参数由样本的具体取值,选择参数的估计量的估计量 对每一样本值对每一样本值(x1,x2,xn),在参数空间,在参数空间 内使似内使似然函数然函数L(x1,x2,xn;)达到最大的参数估计值达到最大的参数估计值,称为参数称为参数的的极大似然估计值极大似然估计值,它满足,它满足),.,(21nxxx);,.,(max),.,(;,.,(212121nnnxxxLxxxxxxL称统计量称统计量),.,(21nXXX为参数为参数的的极大似然估计量极大似然估计量。记为记为L2、似然函数与极大似然估计似然函数与极大似然估计niinxfxxLL11);();,()(设设,),

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论