




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数理统计基础知识,1,PPT学习交流,例:试验E电话台单位时间内收到的用户呼唤次数。记呼唤次数为 X,则 X 是一个变量,取值为0,1,2,,( X =i)代表相应的基本事件(样本点)。,变量X的取值是变化的取决于试验的基本结果(样本点)事先不能确定,有随机性;但取任一值都有确定的概率。我们把具有上述性质的 X 称为随机变量。,随机变量的引入,使随机事件的表达在形式上非常简洁,随机变量,2,PPT学习交流,随机变量的定义,定义2.1 设试验E的样本空间为,对于 的任一样本点 按照某种对应法则,都有唯一确定的实数 X()与之对应,即 X=X()是定义在 上的一个实值函数,且对于任意实数x, x|
2、 X() x是一随机事件,有确定的概率,则称 X=X()为随机变量。,注:(1)随机变量是试验结果(即样本点)和实数之间的一个 对应关系,与高等数学中的函数概念本质上是一回事。,随机变量X=X()是函数,其自变量是样本点 ,定义域是样本 空间, 值域是实数集或其子集。,3,PPT学习交流,(4)引入随机变量后,随机试验中的各种事件,就可以通过随机变量表达出来。,(3)随机变量的取值有一定的概率。(随机变量与普通函 数的本质差异)由此可知:对随机变量的研究,不仅要搞 清楚随机变量取值的范围,还要搞清楚取相应值的概率。,例如:单位时间内某传呼台收到的呼叫次数用X表示,则“收到不少于一次呼叫”“X1
3、”, “没收到呼叫” “X = 0”。,(2) 随机变量通常用大写字母,或希腊字母 , 等表示而表示随机变量所取的值时,一般采用小写字母 x , y , z 等 。,4,PPT学习交流, 随机变量的分类,按照随机变量的取值情况可把其分为两类: 离散型随机变量:随机变量的全部取值只有有限个或可列个。 非离散型随机变量:其中最重要的是连续型随机变量,随机变量的取值连续地充满某个(或几个)区间或整个数轴。,离散型,连续型,5,PPT学习交流,为了描述随机变量,只知道它可能取的值是不够的, 更重要的是要知道它取各个值的概率(即概率分布情况)。,定义:若随机变量只能取有限个数值 x 1 , x 2 ,
4、, x n , 或可列 无穷多个数值 x 1 , x 2 , , x n , ,则称为离散型随机变量。,离散型随机变量,6,PPT学习交流,若所有可能的取值为 x 1 , x 2 , , 对应的概率为 p 1 , p 2 , 。 即: P ( X = x i ) = p i , i = 1, 2, (1) 则称式 (1) 为随机变量的概率函数或概率分布或分布律或 分布列(简称为分布)。,定义:,分布列常以下列表格(概率分布表)的形式表示:,7,PPT学习交流,离散型随机变量的分布列的性质,性质:由概率的性质可知,任一离散型随机变量的分布列pi 都具有下述两个性质: (1)、 pi0, i =
5、1,2, ; (2)、,反过来,任一具有上述两个性质的数列pi,都有 资格作为某一个随机变量的分布列。,分布列不仅明确地给出了(= x i)的概率,而且对于任意的实数 a b ,事件a X b发生的概率均可由分布列算出,因为:,用于验证分布列的正确与否。,8,PPT学习交流,于是,由概率的可列可加性有:,由此可知, 取各种值的概率都可以由它的分布列通过 计算而得到。,此事实表明:分布列全面地描述了离散型随机变量的统计规律。,9,PPT学习交流,例:盒中有个球,其中有个白球,个黑球,从中任取 个球,则取到的白球数是一个随机变量,它可能取的值是, ,。那么有:,这里我们不仅知道随机变量的取值,而且
6、还知道取每个 值的概率。这样,我们就掌握了这个随机变量取值的概率 规律。,此结果亦可用下表来描述:,P(X1)=? P(0X3)=? P(-1X2)=?,10,PPT学习交流,定义2. 若随机变量X 所有可能取值是某一区间上的所有实数,且存在非负可积的函数 f ( x ), 使得对任意实数, 有 :,则称X为连续型随机变量,称 f (x)为X的概率分布密度函数, 简称为概率密度或密度函数或密度。记作 X f ( x )。,11,PPT学习交流,由定义知道,概率密度 f(x) 具有以下性质:,介于曲线 y = f (x) 与 x轴之间的面积等于。,具有上述两条性质的函数必 定是某个连续型随机变量
7、的密度函数。,12,PPT学习交流,注 意,连续型随机变量密度函数的性质与离散型随机变量分布律的性质非常相似,但是,密度函数不是概率!,连续型随机变量的一个重要特点:取个别值的概率为零,证明:,所以有,13,PPT学习交流,连续型随机变量取值于某一区间的概率时,区间是否包含端点,是不必考虑的.,这是连续型随机变量与离散型随机变量截然不同的一个 重要特点。它说明,用概率分布描述连续型随机变量毫无意义。,14,PPT学习交流,说 明,由上述性质可知,对于连续型随机变量,我 们关心它在某一点取值的问题没有太大的意义; 我们所关心的是它在某一区间上取值的问题,15,PPT学习交流,定义 2.2 设 X
8、 是一个随机变量,x 是任意实数,函数,称为 X 的分布函数,对于任意的实数 x1, x2 (x1 x2) ,有:,返回主目录,为了更好地研究随机变量的统计规律,引进随机变量的分布函数的概念。,随机变量的分布函数:,16,PPT学习交流,分布函数是刻划随机变量分布的一个重要工具。F(x) 表示随机事件 X x 发生的概率,它在点 x 处的函数值F(x)正是随机变量 X 的取值落入区间(-,x的概率。,值得注意的是,在上述定义中没有限定 X 是离散型还是 连续型的。也就是说,不论离散型还是连续型随机变量都有 各自的分布函数。,17,PPT学习交流, 分布函数的性质,2) F(x)是不减函数,即对
9、x1 x2,有F(x1)F(x2); 这是因为事件 X x1包含于 X x2,3),4) F(x)是右连续的,且至多有可列个间断点。即:,1)定义域: x ,值域:0F(x)1;,18,PPT学习交流,所以 P(x1 X x2) = P( X x2) P( X x1) = F(x2) F(x1) 其中x1,x2为任意实数,且 x1 x2 。,5) P(X x)= F( x ),P(X x)= 1-F( x ) P(x1 X x2)= F( x2 )- F( x1 ),因为 (x1 X x2)=(X x2) (X x1),19,PPT学习交流,设 E 是一个随机试验,它的样本空间是 = , 设
10、X=X( ) 和 Y=Y( ) 是定义在 上的随机变量。 由它们构成的一个向量 (X, Y) ,叫做二维随机 向量,或二维随机变量。,X( ),Y( ),定义,返回主目录,20,PPT学习交流,注 意 事 项,返回主目录,21,PPT学习交流,二维随机变量的例子,返回主目录,22,PPT学习交流,条件概率,在研究事件的概率时,有时会考虑一定的附加条件,如在一 个事件已经发生的条件下,考虑另外一个事件发生的可能性.,23,PPT学习交流,例1 一盒中有3个白球7个黑球,求 (1)第一次取得黑球的概率 (2)在第一次取得黑球后不放回的条件下,第二次仍取得黑球的概率,(2)在第一次取得黑球后不放回的
11、条件下,事件A发生时的新样本空间为3个白球6个黑球,共9个样本点,事件A中含6个样本点。,则:在第一次取得黑球后不放回的条件下,第二次仍取得黑球的概率 为 6/9 = 2/3,解 设B第一次取得黑球 A第二次取得黑球,(1)事件B:样本空间中含10个样本点 B中含7个样本点,所以 P(B)=7/10,注意 :2/3不是P(A),而是条件概率P(AB),24,PPT学习交流,条件概率的定义,定义1.3 设P(B)0,在事件B已经发生的条件下,事件A发生 的概率,称为事件A对B的条件概率, 记作P(A|B),注:,(2) P(A)称为无条件概率,(3)性质:设P(B)0,(1) P(AB)的直观含
12、义,P(|B)=1,若Ak (k=1,2,) 两两互不相容,则 (Ai |B) = (Ai |B) i=1 i=1,对于任一事件A,都有 0P(A|B)1,25,PPT学习交流,样本空间,A,B,B 新样本 空间,条件概率的实质,条件概率P(A|B)的实质是样本空间起了变化。,缩小为只取所包含的 样本点。有利事件为AB。,AB,相关性质:对于固定的事件B,设P(B) 0,A为任意事件,则: P(A|B)+P(|B)=1另外,对概率的各性质,变为条件概率(|B)后依然成立,26,PPT学习交流,3、条件概率的求法,注意:应用此公式时P(B) P(AB)都是在原来的样本空间中考虑,27,PPT学习
13、交流,用P(AB)=P(A)P(B)来刻划独立性,比用P(A|B)=P(A)更方便,因它不受P(B)是否为0的制约,而且,式中事件A与B的地位对称,反映了独立的相互性。,事件的独立性,事件A对于事件B的条件概率P(A|B)和事件A的无条件概率P(A)可能相等或不相等。,若 P(A|B)= P(A) ( P(B) 0 ),定义1.4,此时由乘法公式知: P(A)=P(A|B) 等价于 P(AB)=P(A)P(B),称对于独立,P(AB)=P(A)P(B),定义1.5:(事件的独立性),则称事件与相互独立。,如果事件A,B,满足:,28,PPT学习交流,随 机 变 量 的 数 字 特 征,29,P
14、PT学习交流,某班共有学生10人,期中测验成绩情况如下,引例:,随机变量的数学期望,则该班的平均成绩为,若令 fi 表示频率,则上式可表示为,由概率的统计定义知道,在大量试验下,频率 fi 概率 pi.,加权平均值,30,PPT学习交流,一、离散型随机变量的数学期望,1、定义:设离散型随机变量 的概率函数为 P (=x i )=pi i = 1, 2, 若级数 绝对收敛,则称此级数的和为随机变量的数学期望。简称期望或均值。记作E ,即 如果级数 不绝对收敛,则称随机变量 的数学期望不存在。,31,PPT学习交流,假设一个班共 20 人,其中 18 岁的有 6 人,19 岁的有 10 人,20
15、岁的有 4 人,现任取一人观察其岁数,则观察到的岁 数 x 为一随机变量,不难求出 x 的分布率如表2 所示。,例:,求:这个班的学生的平均年龄。,解:,32,PPT学习交流,二、连续型随机变量的数学期望,例1:计算在区间 a , b 上服从均匀分布的随机变量 x 的数学期望。,解:依题意,故,2、举例:,33,PPT学习交流,三、随机变量函数的数学期望,定理 1:,设 =g(),g(x) 是连续函数,那么,(2) 若 为连续型随机变量,其密度函数为 f ( x ),,(1) 若 为离散型随机变量,其概率函数为,1 、一维随机变量函数的数学期望,34,PPT学习交流,例1:设随机变量的分布列为
16、,求:E2,E(2-1)。,解:,例2:,求:E,解:,35,PPT学习交流,定理 2:,若 (, ) 是二维随机变量,g(x, y)是二元连续函数,(1) 若 (, )为二维离散型随机变量,其联合分布为,(2) 若 (, )为二维连续型随机变量,其联合密度函数为 f ( x , y ) ,且,2、二维随机变量函数的数学期望,36,PPT学习交流,解:,例1:设 (, ) 的联合分布为,求: E(-),E 。,E(-)=,(0-1) (0-2) (0-3) (1-1) (1-2) (1-3),0.1+ 0.2+ 0.3+ 0.2+ 0.1+ 0.1,=-2.1,E()=,(0 1) (0 2)
17、 (0 3) (1 1) (1 2) (1 3),0.1+ 0.2+ 0.3+ 0.2+ 0.1+ 0.1,=0.7,37,PPT学习交流,解:,例2:,求: E(-3+2),E。,38,PPT学习交流,性质1:常量的期望就是这个常量本身, 即 E(c)=c.,四、数学期望的性质,证: 常量 c 可看作仅取一个值 c 的随机变量,且取值 c 的概率为 1,即 的分布为 P(=c)=1,这种分布称为退化分布, 其数学期望为E(c)=c1=c,推论:E(E) = E,性质2:随机变量 与常量 c 之和的数学期望等于 的期望与这个常量 c 的和 E(+c)=E+c,证:设 的分布为 pk(离散型);
18、密度函数为 f(x) (连续型),则,为 离散型时,为 连续型时,39,PPT学习交流,性质3:E(c) = cE 常量 c 与随机变量 的乘积的期望等于 c 与 的期望的乘积,证:设 的分布为 pk(离散型);密度函数为 f(x)(连续型),则,性质4: 随机变量的线性函数的数学期望等于这个随机变量期望的同一线性函数 E(k +c)=k E +c,证: E(k +c) = E(k )+c = kE +c,40,PPT学习交流,性质5:两个随机变量之和(差)的数学期望等于这两个随机变量数学期望之和(差) E ( ) = E E,推论: 对任意常数 ci (i=1, 2, , n)、常数 b 及
19、随机变量 i (i=1, 2, , n),有,特别地,n 个随机变量的算术平均数仍是一个随机变量,其期望值等于这 n 个随机变量期望的算术平均数。,性质6:两个相互独立随机变量乘积的数学期望等于它们数学期望的乘积, 即 E( )=E E,41,PPT学习交流,解: Ex =90.3+100.5+110.2=9.9,例1:两相互独立的随机变量 x , h 的分布如下面两表所示。,Eh2 =620.4+720.6=43.8,求:E(x +h) 、 E(x h) 和 Eh2,且 因 x 与 h 相互独立,所以 E(xh) =9.96.6=65.34,则 E(x +h)=Ex +Eh =9.9+6.6
20、=16.5,Eh =60.4+70.6=6.6,42,PPT学习交流,定义:设二维随机变量 (, ) 的联合分布为 P (= x i , = y j ) = p i j (i , j = 1, 2, ) 在 = y j 条件下随机变量的条件分布为,1、离散型,为在 = y j 条件下的条件数学期望,记作,五、条件数学期望,即有,43,PPT学习交流,即,同样可以定义,所以,例:设 (, )在 = 1 条件下的条件分布为,1 0.5+2 0.25+3 0.25 =1.75,44,PPT学习交流,2、连续型,即,同样可以定义,定义: 设二维随机变量 (, ) 的条件密度为 f(x|y) 及 f(y
21、 | x) 。若 绝对收敛,则称 为在 = y 条件下的条件数学期望,记作,45,PPT学习交流,方 差,解:,从平均值意义上看,两块手表质量相同。,从离散程度意义上看,甲表质量优于乙表。,方差,46,PPT学习交流,一、方差的定义,如果随机变量x 的数学期望 Ex 存在, 称 x - Ex 为随机变量的离差。,1.离差的定义:,随机变量x 离差平方的数学期望称为随机变量x 的方差。 记作 Dx 或 Varx ,即,2.方差的定义:,特别 标准差的定义:,称为x 的标准差。,1o如果x 是离散型随机变量,并且 Px =xk=pk (k=1, 2, ),则,2o如果x 是连续型随机变量,并且有密
22、度函数 f (x),则,Dx =Varx =E(x -Ex )2,47,PPT学习交流,3o 方差的计算公式:,证: Dx = E(x -Ex )2,=Ex 2-2x Ex +(Ex )2,=Ex 2-E(2x Ex)+E(Ex )2,=Ex 2 - 2Ex (Ex)+(Ex)2,=Ex 2-(Ex )2,48,PPT学习交流,解:,EX 2=(-10)20.2+(- 5)20.2+120.2+520.2+1020.2=50. 2,DX = EX 2- (EX )2=50.2- 0. 22 = 50.16,解:,EX =(-10)0.2+(- 5)0.2+10.2+50.2+100.2=0.
23、2,49,PPT学习交流,解:,50,PPT学习交流,三 方差的性质,性质 1:常量的方差等于零。即:设 c 为常数,则 Dc = 0,证: D(c)=E(c-Ec)2=E(c-c)2=0,性质 2: 随机变量与常量之和的方差就等于随机变量的方差本身 即:D(X+c)=DX,证: D(X +c)=EX+c-E (X +c)2=EX +c-EX -c)2=E(X -EX )2=DX,性质 3: 常量与随机变量乘积的方差,等于常量的平方与随机变量 方差的乘积。即:D(cX )=c2DX,证:D(cX )=EcX -E(cX )2=EcX- cEX 2=Ec(X-EX )2 =Ec 2(X -EX)
24、2=c2DX,性质 4: 设 k , b 为常数,则:D(kX +b)=k2DX,51,PPT学习交流,性质 5: 两个独立随机变量和(差)的方差,等于这两个随机变量 方差的和。 即:D(X Y ) = DX +DY,证: D(X Y ),=E(X Y )- E(X Y )2,=E(X -EX )(Y -EY )2,=E(X -EX )2+(Y -EY )22(X -EX )(Y-EY ),=DX +DY 2E(XY-X EY-Y EX+EX EY ),=E(X -EX )2+E(Y -EY )2 2E(X -EX )(Y-EY ),=DX +DY 2(EXY-EX EY-EY EX+EX E
25、Y ),=DX +DY 2(EXY-EXEY),=DX +DY,性质 5 可以推广到任意有限个随机变量的情况,即,若X1, X 2 , , X n 相互独立,则有 D(X1+ X 2+ X n)=DX1+DX 2+.+DX n,D(a1X1+ a2X 2+ anX n+b)=a12 DX1+a22 DX2+.+an2 DX n,=DX +DY 2(EXEY-EXEY),52,PPT学习交流,定义:随机变量X的标准化随机变量,53,PPT学习交流,协方差与相关系数、矩,54,PPT学习交流,一 协方差,1 协方差的定义,定义:对于二维随机变量(X,Y),称E(X-EX)(Y-EY)为X与Y的协方
26、差 记做Cov(X ,Y), 即 Cov(X,Y)=E(X-EX)(Y-EY),注:X与Y的协方差是反映X与Y之间相关关系的一个特征数,2 协方差的计算,协方差的计算公式,证:Cov(X, Y)=E(X-EX)(Y-EY),Cov(X ,Y)=E(XY) -EXEY,=E(XY -YEX- XEY+ EX EY),=E(XY) -E(YEX)- E(XEY)+ E(EX EY),=E(XY) -EX EY,由协方差的计算公式知,(1)若X与Y独立,则,Cov(X ,Y)=0,(2)对X与Y有 D(X Y)= DX + DY 2Cov(X , Y),55,PPT学习交流,性质 5: 两个独立随机
27、变量和(差)的方差,等于这两个随机变量 方差的和。 即:D(X Y ) = DX +DY,证: D(X Y ),=E(X Y )- E(X Y )2,=E(X -EX )(Y -EY )2,=E(X -EX )2+(Y -EY )22(X -EX )(Y-EY ),=DX +DY 2E(XY-X EY-Y EX+EX EY ),=E(X -EX )2+E(Y -EY )2 2E(X -EX )(Y-EY ),=DX +DY 2(EXY-EX EY-EY EX+EX EY ),=DX +DY 2(EXY-EXEY),=DX +DY,=DX +DY 2(EXEY-EXEY),(2)对X与Y有 D(
28、X Y)= DX + DY 2Cov(X , Y),56,PPT学习交流,例:设二维随机变量 (X ,Y) 的联合分布如下表所示, 求 Cov(X ,Y)。,解:可求出(X , Y )关于X ,Y的边缘分布:,EX =(-1)3/8+02/8+13/8=0 EY =0,Cov(X ,Y)=E(XY) - EX EY= 0,虽然 Cov( X ,Y) = 0,但 P(X =0, Y =0) P(X =0) P(Y =0) X ,Y不独立,X 与 Y独立,Cov(X ,Y) = 0,57,PPT学习交流,性质4: Cov( 1+ 2 , )= Cov( 1, ) +Cov( 2, ),性质1: C
29、ov(, )= Cov(, ),性质2: Cov( ,c) = 0,性质3: Cov(a, b)= ab Cov(, ),推论:,Cov(, ) = E ( E )(-E ),3 协方差的性质,Cov(a , a)= a2 Cov(, ),Cov( , )= E ( E ) ( E )=D ,58,PPT学习交流,定义 :对于二维随机向量 (, ) ,如果 D 0,D 0, 则称 为, 的线性相关系数,简称相关系数,记作 , 或 或 。即:,相关系数,例:已知D =4,D =9, =0.5,求D( -),=4+9-20.523=7,59,PPT学习交流,练习 已知( ,)的联合分布, 求 ,
30、。,解:,E =2.5 E =1.75,Cov( ,)=E() - E E= 5/8,E2=15/2 ,D =5/4, E2=47/12,D =41/48,关于 ,的边缘分布:,60,PPT学习交流,2 相关系数的性质,性质 1: , = , ,性质 2:| | 1,性质 3: 与 不相关 = 0 零相关,61,PPT学习交流,注1: 与 独立 ,则 与 不相关( = 0 )。 但反之一般不一定成立,注2: = 0 仅表明 与 无线性关系,而不是无任何关系(独立),分析:,独立,无任何关系,无线性关系,无非线性关系, = 0,62,PPT学习交流,矩,1 原点矩,定义:随机变量X的k次幂的数学
31、期望叫做随机变量X的k阶原点矩 记做k,即,对离散型随机变量X,设概率函数为P(X=x i)=pi ,(i=1,2,) 则,对连续型随机变量X,密度函数为f(x ),则,63,PPT学习交流,定义:X-EX的k次幂的数学期望叫随机变量X的k阶中心矩。 记做k,即,对离散型随机变量X,设概率函数为P(X=x i)=pi,(i=1,2,) 则,对连续型随机变量X,设密度函数为f(x ), 则,2 中心矩,64,PPT学习交流,统计量及其分布,65,PPT学习交流,数理统计学:研究大量随机现象的统计规律性的一门学科,概率论是数理统计的基础,数理统计是概率论的应用,统计量及分布,数理统计的基本概念,一
32、 总体和个体,总体:所研究对象的全体构成的集合。,个体:总体中的每一个元素。,例:考察某灯泡厂生产的灯泡。总体:全部灯泡。个体:每一个灯泡,例:考察某大学学生的身体状况.总体:全体学生.个体:每一个学生,总体和个体具有两重性:一方面指所研究的实体, 另一方面又指实体的数量指标。,66,PPT学习交流,总体的分类: (1)有限总体:总体中的元素的个数有限 (2)无限总体:总体中的元素的个数无限注意:有限总体的个数很多时,可近似为无限总体 如:一个国家的人口,一袋小麦的粒数等,67,PPT学习交流,二、 总体的分布,总体既是集合,又是随机变量。常用 X,Y,Z表示,例:考察某灯泡厂生产的灯泡。总体
33、X:灯泡的寿命。,例:考察某大学学生的身体状况.总体X:学生的体温.,总体也可以是二维随机变量,记为(X,Y)等,例:考察某大学学生的身体状况.总体(X,Y):学生的身高、体重.,总体的分布要借助于随机抽样来研究。,以后所研究的总体多是正态总体。,总体X的分布:即 随机变量的分布 由于总体X以不同的概率或不同的密度取值,X是一个随机变量. 设随机变量X的分布函数为F(x),则称F(x)为总体X的分布,68,PPT学习交流,样本的二重性:容量为 n 的样本 (X1, X2, , Xn) 是 n 次试验的结果,因试验是随机的,可把其看成是 n 个随机变量。但作了试验后,记录下来的是它们在试验中 所
34、取的数据 (x1, x2, , xn),称为样本的观察值。 因此,样本在做具体试验前可理解为一个随机向量,在 具体试验后可理解为一组观测值,因此,样本一词具有 二重性。,随机抽样:从总体X中抽取部分个体。简称抽样,样本:抽取的部分个体(抽样的结果). 记为(X1, X2 , ,Xn),样本容量:样本所含个体的个数。,三、样本,69,PPT学习交流,简单随机样本:设总体为X,如果样本(X1, X2, , Xn) 满足: (1)代表性: 每个Xi 与总体X 有相同的分布; (2)独立性: X1, X2, , Xn相互独立; 则称 样本(X1, X2, , Xn) 为简单随机样本,简称为简单 样本。
35、,注,在有限总体中要得到简单样本, 必须进行重复抽样。但当总体中个体数相对于样本容量充分大时,不重复抽样得到的样本也可近似看作简单样本.,小样本和大样本:当容量 n 时,研究的是大样本 问题。其分布是极限分布。当容量 n 有限时,样本是小样本。其 分布是随机向量的精确分布。在理论研究中小样本意味着固定样本 容量,不能让它趋于无穷。,70,PPT学习交流,统计推断:分析样本数据 对总体的分布作出结论,样本从总体带出的信息 是分散的、零乱的,统计量,设总体X的分布函数为F(x),(X1, X2, , Xn)是来自总体的样本, Xi的分布函数为F(xi),则(X1, X2, , Xn)的分布函数为
36、F(x1,x2, , xn) = F(x1) F(x2) F( xn),若总体X的密度函数为f(x),(X1, X2, , Xn)是来自总体的样本, Xi的密度函数为f(xi),则(X1, X2, , Xn)的密度函数为 f(x1,x2, , xn) = f(x1) f(x2) f( xn),四、样本的分布,71,PPT学习交流,一、 统计量:设(X1, X2, , Xn)为来自总体 X 的样本,容量为 n , 设h(x1, x2, , xn)为一不含未知参数的 n 元连续函数,则 T = h(X1, X2, , Xn) 是一个随机变量,称为统计量。,5.2 统计量,注 :(1)统计量完全由样
37、本决定,不依赖于任何其它未知的量。 (2)统计量用于估计时称为估计量,用于检验时称为检验统计量 (3)把样本观测值代入统计量,得到统计量的观测值。,72,PPT学习交流,例: 当总体 XN( , 2) ,其中参数 , 2 未知时,不是统计量,因它们都包含了未知参数。,例:统计量,当参数 已知, 2 未知时,结论如何?,练习:178页第1题,73,PPT学习交流,二、常用统计量,定义5.2 设样本 (X1, X2, , Xn) 来自总体 X,常用统计量:,样本均值:,样本方差:,样本k阶原点矩:,样本k阶中心矩:,样本标准差 :,74,PPT学习交流,样本均值和样本方差的性质,定理5.1:设总体
38、 X 的均值为 EX=,方差为 DX= 2, 样本 (X1, X2, , Xn) 来自总体 X ,则,证:由于(X1, X2, , Xn) 是简单样本,所以EXi=EX= , DXi=DX= 2 (i=1, 2, , n),而且有,75,PPT学习交流,注意到:,76,PPT学习交流,有:,77,PPT学习交流,定义:若连续随机变量X 的概率密度为,其中 为常数, 0 为常数,则称 X 服从参数为 , 2 的正态分布,记为 X N( , 2)。,正态分布满足密度函数的两个性质:,其分布函数为,正态分布,例如 X N(1,4) 则 =1, =2,78,PPT学习交流,正态分布 N ( , 2 )
39、的密度函数图形如右图所示,正态密度曲线呈古钟形曲线。,(1) (x) 图形关于直线 x = 对称。,(4) 参数 决定曲线 (x)的位置,参数 决定曲线 (x)的形状。固定 而改变 值,则曲线左右位置不同但形状不变,即此时 (x)图形沿着 x 轴平行移动;固定 而改变 值,则曲线形状改变而位置不 变。 值越大时曲线越平缓, 值越小,曲线越陡峭。,(3) 在 x = 处, (x)取得最大值:,其特点如下:,(2) (x)在 x 轴上方,且以 x 轴为渐近线。,79,PPT学习交流,正态分布的重要性,正态分布是概率论中最重要的分布,这可以由以下情形加以说明:,正态分布是自然界及工程技术中最常见的分
40、布之一,大量的随机现象都是服从或近似服从正态分布的可以证明,如果一个随机指标受到诸多因素的影响,但其中任何一个因素都不起决定性作用,则该随机指标一定服从或近似服从正态分布,正态分布有许多良好的性质,这些性质是其它许多分布所不具备的,正态分布可以作为许多分布的近似分布,一方面,有些分布(如二项分布、泊松分布)的极限 分布是正 态分布;另一方面,有些分布(如 2 分布、t 分布)又可通过正态分布导出。,80,PPT学习交流,参数 = 0, =1的正态分布称为标准正态分布 其密度函数为:,标准正态分布,记为X N(0,1)。,0 (x)的性质,(1) 0(x) 是偶函数,即有 0(- x) = 0
41、(x)。 曲线0 (x)是关于 纵轴对称的古钟型曲线;,(2)在x=0处0 (x) 取得最大值,(3) 0(x) 在(-,0)内单增,在(0,+)内递减。,(4) 0(x)在x=1,-1点取得拐点,且以x轴为渐近线。,81,PPT学习交流,有关 0(x)的结论:,(3) P ( |X| x) = 0(x) - 0(-x)= 20 (x) - 1 ;,(4) P ( |X| x) = P ( X x) +P ( X -x)= 21- 0(x),(1) 对于 0(x),有 0(- x) = 1- 0(x) 0 (0) = 0.5,其分布函数为:,0(x)的几何意义:曲线 0(x)与x轴之间在直线t
42、=x左边图形的面积,若 X N(0,1),密度函数为,(2) P (aXb) = 0(b) - 0(a),82,PPT学习交流,标准正态分布的密度函数 0(x)和分布函数 0(x)值有表查,例:已知X N(0,1),求:(1) P(X 0.68);(2) P(X 1.74); (3) P( | X | 1.96);(4) P( | X | 1.84) (5) P(X 5.18); (6) P(X - 8.7);,有关标准正态分布的概率计算,解:,(1) P(X 0.68) = P(X 0.68) = 0 (0.68) = 0.7517,(2) P(X 1.74)=1-P(X 1.74)=1-
43、0(1.74)=1-0.9591=0.0409,(3) P( |X| 1.96) = P(-1.96X 1.96)=0(1.96)- 0(-1.96) =20(1.96)-1= 20.975 - 1= 0.95,(4) P( | X | 1.84) = 21 - 0(1.84) = 0.0658,(5) P(X 5.18) = 0 (5.18) 1,(6) P(X-8.7)=0(-8.7)=1-0(8.7) 0,注: 当x 5时 0(x) 1 ,当x - 5时 0(x) 0,当 0x 5时查表 当 -5x 0时 0(x)=1- 0(-x),83,PPT学习交流,一般正态分布与标准正态分布的关系
44、,结论:若 X N( , 2),Y N(0 , 1),它们的密度函数 分别记为 (x)和 0(x) ,分布函数分别记为 (x) 和0 (x) ,则,证:,84,PPT学习交流,对于。 (x),有。 (- x) = 1- 。 (x) 。,由上述性质可推得下面两个结论:,在 x = 0 处, 。 (x) 取得最大值 , 而这时。 (0) = 0.5;,O,。 (- x),x,y,1-。 (x),- x,y = 。 (x),随机变量 X N(0 , 1) 时,对任意 x 0 有:,(1) P ( | X | x) = 2。 (x) - 1 ;,(2) P ( | X | x) = 21-。 (x)。
45、,85,PPT学习交流,若随机变量 X N ( , 2),则随机变量 X 落在区间 (a , b 内的概率可以转化成标准正态分布来计算,即 P(a X b) = (b)- (a)=,例:设X N (1, 4),求:P (0 X 1.6),P (| X | 2)。,P(|X | 2)=P(-2 X 2)= (2)- (-2)= = 0 (0.5) - 0 (- 1.5)= 0(0.5) - 1 - 0 (1.5) = 0.6247,86,PPT学习交流,例4,返回主目录,87,PPT学习交流,例:若 X N(, 2),有:,P (| X - | ) = ( +)- ( -) = 2 0(1) -
46、1 = 0.6826,显然 |X - | 3 的概率是很小的,因此可以认为X 取的值几乎全部 集中在 -3 , +3 区间内。这在统计学上称作“3 准则”,P (| X - | 2 ) = ( +2)- ( -2) = 2 0(2) -1 = 0.9545,P (| X - | 3 ) = ( +3)- ( -3) = 2 0(3) -1 = 0.9973,88,PPT学习交流,0,89,PPT学习交流,定义5.3 设随机变量X1,X2,Xn相互独立,且同服从标准正 态分布,则它们的平方和 2= X12+X22+ +Xn2 服从的分布称为自由度为 n 的 2分布。记为: 2 2(n)。,注:自
47、由度表示独立随机变量的个数,可以证明, 2 的密度函数为:,1、 2 分布,一、 数理统计学的三个重要分布,抽样分布:统计量的分布,90,PPT学习交流, 2分布的性质,定理5.3 若 X 2(n),Y 2(m),且X与Y相互独立, 则 X+Y 2 (n+m),定理5.2 若 X 2 (n),则: EX=n, DX=2n,(2) 若 X1, X2, , Xn相互独立,同服从于正态分布N( i , i2),则,推论:(1) 若 Xi 2(ni), i = 1, 2, , n ,且相互独立, 则:,91,PPT学习交流,2分布的临界值( 分位点),例:,92,PPT学习交流,设随机变量X1,X2,
48、Xn相互独立,且同服从标准正态, 则它们的平方和 设为 X= X12+X22+ +Xn2,X 2 (n),则: EX=n, DX=2n,EXi=0, DXi=1 (i=1, 2, , n).,思考:,93,PPT学习交流,t 分布,94,PPT学习交流,t 分布的临界值( 分位点),例:,1. 397,95,PPT学习交流,问题:若 XN ( , 2),Y/ 2 2(n),且X与Y相互独立,则,证明:,且与Y相互独立,则,96,PPT学习交流,F 分布,其中 n1 叫做第一自由度, n2 叫做第二自由度。,97,PPT学习交流,F 分布的临界值( 分位点),F 分布的性质,例:,98,PPT学
49、习交流,判断: 如果 X与Y 相互独立,且X / 2 2(n), Y / 2 2(m), 则 F = (X/Y)(m/n),证: 如果 X与Y 相互独立,且X / 2 2(n), Y / 2 2(m),,例:179页(B)第4题,解:,F(n, m),99,PPT学习交流,二、 正态总体下的抽样分布,1、样本线性函数的分布,定理5.6:设Y = a1X1+ a2X2+ a n X n ,则,以下假设样本(X1 ,X2 , ,X n )来自正态总体 XN(, 2),其中 a1, a2, , an 为常数,且不全为0。,推论:,100,PPT学习交流,推论2:若样本(X1, X2, , X n)来
50、自总体XN(1,12), 样本 (Y1, Y2, , Y m)来自总体YN(2 ,22),且X与Y相互独立,则,定理:若X1, X2, , Xn 相互独立,XiN(i ,i2) (i = 1, 2, , n) 则,其中 Y = a1X1+ a2X2+ anXn , a1, a2, , an 为常数, 且不全为0。,标准化得UN(0,1),101,PPT学习交流,2、样本均值和样本方差的分布,102,PPT学习交流,定理5.8:,(n-1)S2/ 2 2(n1) ,相互独立,103,PPT学习交流,参数估计,104,PPT学习交流,参 数 估 计,问题的提出:,点估计,区间估计,参数估计,总体X
51、的分布形式已知,未知的只是分布中的参数,要估计的只是参数或参数的某一函数。,总体X的估计有两类:,一、参数估计,二、非参数估计,总体X的分布形式未知,要估计的是总体的分布形式。,105,PPT学习交流,构造点估计的估计量的具体方法有多种,在此, 介绍两种方法。,一、矩估计法,矩估计法的思想是:用样本的各阶矩去估计总体相应的各阶矩, 而总体各阶矩都是总体分布中未知参数的函数,从而,通过估计 总体矩来达到估计总体分布中未知参数的目的。,设总体分布为F(x,1, 2 ,k), i未知,样本(X1, X2, , X n ) 来自总体 X,计算,解未知量 1, 2 ,k,称为参数1, 2 ,k的矩估计量
52、。,6.1 参数的点估计,106,PPT学习交流,例2:设样本(X1, X2, , X n )来自总体 XN( , 2), 求 与 2 的矩估计量。,解:,例1:设样本(X1, X2, , X n )来自总体 X,且总 体的均值 未知,求 的矩估计量。,解:,总体 X 的均值 矩估计量为一阶样本原点矩,107,PPT学习交流,例3:设样本(X1, X2, , X n )来自总体 XP( ), 求 的矩估计量。,解:,另一方面:EX2 = DX + (EX)2 = + 2 ,所以:,此例说明:矩估计可以不唯一。 此时,一般取低阶矩得到的那一个。,一阶样本原点矩作为 的矩估计量,108,PPT学习
53、交流,思想:,进行一次具体的抽样之后, (X1, X2, , X n ) 得到一组观察值 (x1, x2, , x n )。,设总体分布(以离散型为例)为P(X=x)=F(x,1, 2 ,k), (1, 2 ,k )未知,样本(X1, X2, , X n )来自总体 X, 则样本(X1, X2, , X n )的概率分布函数为:,为(1, 2 ,k )的函数。因为(x1, x2, , x n )在一次观察中就出现了,应出现在概率最大的地方。即求函数,取得最大值的最大值点,以此作为(1, 2 ,k )的估计。,二、极大似然估计,109,PPT学习交流,极大似然估计基本思想:,找出使样本观察值出现
54、的概率为最大的参数值,将它作为未知参数的估计值。,110,PPT学习交流,1、极大似然估计(离散型总体),111,PPT学习交流,试求参数p的极大似然估计量,故似然函数为,例1:,112,PPT学习交流,故似然函数为,例2:,113,PPT学习交流,2、极大似然估计(连续型总体),114,PPT学习交流,例6:,115,PPT学习交流,似然函数为:,例3:,116,PPT学习交流,例5:,117,PPT学习交流,极大似然法求估计量的步骤:(一般情况下),说明:若似然方程(组)无解,或似然函数不可导, 此法失效,改用其它方法。,118,PPT学习交流,例7:,方程组无解,119,PPT学习交流,
55、6.2 点估计的优良性准则,我们知道,一个未知参数的估计量可能不止 一个。究竟采用哪个为好呢?这就涉及到用什么 标准来评价估计量的问题。我们介绍三个常用的 标准: 1)无偏性; 2)有效性; 3)一致性。,120,PPT学习交流,一、无偏性,根据样本推得的估计值与真值可能不同, 然而,如果有一系列 抽样构成各个估计,很合理地会要求这些估计的期望值与未知参数 的真值相等,它的直观意义是样本估计量的数值在参数的真值周围 摆动,而无误差,这就是估计量的无偏性。,定义6.2:如果对一切 ,有,这个结论与总体的分布类型没有关系。只要总体期望存在, 样本均值总是它的无偏估计。,证:,121,PPT学习交流
56、,例:设总体X 有期望 EX= 与方差 DX= 2, 与 2 都未知。 样本(X1, X2, , X n)来自 X,试证: (1) 样本方差S2是 2的无偏估计; (2) 样本标准差S不是标准差 的无偏估计; (3) B2不是 2的无偏估计。,证:(1) 由定理知: ES2= 2,(2) DS=ES2 - (ES)2= 2 - (ES)2,(3) 因,122,PPT学习交流,二、无偏估计的有效性,一般地,未知参数 的无偏估计量往往不止一个, 在这些估计量中,当然是取值对于 的离散程度越小的 越好,即方差越小的越好。,定义6.3:,123,PPT学习交流,解:DX1=DX= 2,解:所谓线性估计
57、是指,为样本的线性函数。,124,PPT学习交流,三、一致性(相合性),例:,125,PPT学习交流,126,PPT学习交流,一、假设检验的提出 参数估计是统计推断的一个 主要方面 假设检验是统计推断的另一个 主要方面,参数估计:讨论如何根据样本去得到总体分布所含参数的优良估计;假设检验:讨论怎样在样本的基础上考察上面所得到的估计值与真实值之间在统计意义上相拟合,从而做出一个有较大把握的结论,假设检验问题的处理方法 1、对总体分布中的某些参数或对总体分布的类型做某种假设 2、根据样本值做出接受还是拒绝所做假设的结论,假设检验问题,假设检验的基本概念,127,PPT学习交流,例1:设某厂生产一种
58、灯管,其寿命XN(,40000),从过去较长一 段时间的生产情况看,灯管的平均寿命为=1500小时,现在使用 了新工艺后,在所生产的灯管中抽取25只,测得的平均寿命为 1675小时,问:采用新工艺后,灯管 的寿命是否有显著提高?,拒绝H0(接受H1)-新产品寿命有显著提高,接受H0 -新产品的寿命没有显著提高,H1:新产品的寿命1500,考虑:为判别新产品的寿命是否提高,提出以下两个假设(hypothesis) H0:新产品的寿命=1500,备择假设(H1) (alternative hypothesis),原假设(或零假设H0)(null hypothesis),128,PPT学习交流,例2 某产品的出厂检验规定: 次品率 p 不超 过3%才能出厂. 现从一万件产品中任意抽查100件 发现5件次品, 问该批产品能否出厂?若抽查结果 发现1件次品, 问能否出厂?,该例中问题的 解决转化为由抽样结果来判断 假设 是否成立的问题.,129,PPT学习交流,【例3】一种零件的生产标准是直
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- DB31/T 1169-2019知识产权评议技术导则
- DB31/T 1142-2019燃气工业锅炉能效在线监测技术规范
- DB31/T 1124-2018电梯应急处置公共服务平台功能要求
- 硬件设计中的节能技术与绿色标准考核试卷
- 2024年可降解聚烯烃专用料项目资金申请报告代可行性研究报告
- 2025年中国壁挂式浴室柜行业市场前景预测及投资价值评估分析报告
- 环保设施改造补充协议
- 网红奶茶店区域代理加盟经营合同
- 跨国医疗援助物资运输与配送合同
- 高层住宅小区消防设施日常维护与管理承包协议
- 二次供水水箱清洗消毒制度
- 吸痰护理操作课件
- 2024-2030全球商用车电驱桥行业调研及趋势分析报告
- 2024年度中国中国气候投融资试点建设实践报告
- 七年级数学下册 第11章 单元测试卷(人教版 2025年春)
- 年产10万吨聚丙烯聚合工段工艺设计-本科毕业设计论文管理资料
- 小学生防跟踪安全教育
- DB32/T 4880-2024民用建筑碳排放计算标准
- 浙江大学研究生导师培训心得体会
- 劳动与社会保障专业大学生职业生涯发展
- DB11T 2335-2024 既有建筑外门窗改造及验收技术标准
评论
0/150
提交评论