概率论与数理统计基础_第1页
概率论与数理统计基础_第2页
概率论与数理统计基础_第3页
概率论与数理统计基础_第4页
概率论与数理统计基础_第5页
已阅读5页,还剩148页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

概率论与数理统计基础第1页,课件共153页,创作于2023年2月2023/7/142第一节

概率论基础一、正态分布及其特征二、随机变量的数字特征第2页,课件共153页,创作于2023年2月2023/7/143一、正态分布及其特征若连续型随机变量X的概率密度函数为:其中μ和

σ(σ

>0)都是常数,则称X服从参数为μ和σ的正态分布或高斯分布.记作:第3页,课件共153页,创作于2023年2月2023/7/1441、正态分布概率密度函数的性质(3)f(x)关于x=μ轴对称;(4)函数f(x)在(-∞,μ]上单调增加,在[μ,+∞)上单调减少,在x=μ处取得最大值;(5)

x=μ

σ为f(x)的两个拐点的横坐标;(6)f(x)以x轴为渐近线第4页,课件共153页,创作于2023年2月2023/7/145根据对密度函数的分析,也可初步画出正态分布的概率密度曲线图.正态分布概率密度函数的曲线图第5页,课件共153页,创作于2023年2月2023/7/146决定了图形的中心位置,决定了图形中峰的陡峭程度.2、正态分布N(μ,σ2)的图形特点第6页,课件共153页,创作于2023年2月2023/7/147

设X~,X的分布函数是3、正态分布N(μ,σ2)的分布函数xf(x)第7页,课件共153页,创作于2023年2月2023/7/1484、标准正态分布N(0,1)

μ=0,σ=1的正态分布称为标准正态分布.其密度函数和分布函数常用

Φ(x)

表示:第8页,课件共153页,创作于2023年2月2023/7/149标准正态分布的分布函数标准正态分布的密度函数和分布函数标准正态分布的密度函数-110第9页,课件共153页,创作于2023年2月2023/7/1410标准正态分布N(0,1)的性质:标准正态分布的重要性在于,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布.定理1根据定理1,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题.第10页,课件共153页,创作于2023年2月2023/7/1411标准正态分布函数值表通常所给出的是当

x>0时,Φ(x)的值。即:5、正态分布表当x<0

时,第11页,课件共153页,创作于2023年2月2023/7/1412若~N(0,1)

则5、标准正态分布表第12页,课件共153页,创作于2023年2月2023/7/14136、标准正态分布的上α分位点设若数满足条件则称点为标准正态分布的上分位点.例5:查表试求解:由第13页,课件共153页,创作于2023年2月2023/7/1414二随机变量的数字特征

1、数学期望

2、方差

3、协方差和相关系数第14页,课件共153页,创作于2023年2月2023/7/1415定义1

设X是离散型随机变量,它的分布律是:P{X=xk}=pk,k=1,2,…请注意:离散型随机变量的数学期望是一个绝对收敛的级数的和。数学期望简称期望,又称为均值。若绝对收敛,则称即为随机变量X的数学期望,记为:1)离散型随机变量的数学期望1、随机变量的数学期望第15页,课件共153页,创作于2023年2月2023/7/1416定义2

设X是连续型随机变量,其密度函数为f(x),如果积分绝对收敛,则称此积分值为X的数学期望,即请注意:

连续型随机变量的数学期望是一个绝对收敛的积分.2)、连续型随机变量的数学期望第16页,课件共153页,创作于2023年2月2023/7/1417定理:设Y是随机变量X的函数:Y=g(X),g是连续函数,则有:3)随机变量函数的数学期望若X为离散型若X为连续型该公式的重要性在于:当我们求E[g(X)]时,不必知道g(X)的分布,而只需知道X的分布就可以了.这给求随机变量函数的期望带来很大方便.第17页,课件共153页,创作于2023年2月2023/7/1418

4)数学期望的性质

1.设C是常数,则E(C)=C;

4.设X、Y相互独立,则E(XY)=E(X)E(Y);

2.若k是常数,则E(kX)=kE(X);

3.E(X+Y)=E(X)+E(Y);(诸Xi相互独立)请注意:由E(XY)=E(X)E(Y)不一定能推出X,Y独立第18页,课件共153页,创作于2023年2月2023/7/14191)方差的定义设X是一个随机变量,若E[(X-E(X)]2存在,称E[(X-E(X)]2为X的方差.记为D(X)或Var(X),即D(X)=Var(X)=E[X-E(X)]22、随机变量的方差第19页,课件共153页,创作于2023年2月2023/7/14202)计算方差的一个简化公式

D(X)=E(X2)-[E(X)]2

展开证:D(X)=E[X-E(X)]2=E{X2-2XE(X)+[E(X)]2}=E(X2)-2[E(X)]2+[E(X)]2=E(X2)-[E(X)]2利用期望性质第20页,课件共153页,创作于2023年2月2023/7/14213)方差的性质

1.设C是常数,则D(C)=0;

2.若C是常数,则D(CX)=C2

D(X);

3.设X与Y是两个随机变量,则

D(X+Y)=D(X)+D(Y)+2E{[X-E(X)][Y-E(Y)]}

=D(X)+D(Y)+2[E(XY)-E(X)E(Y)]

4.

D(X)=0P{X=E(X)}=1,第21页,课件共153页,创作于2023年2月2023/7/1422推论:若X,Y相互独立,由数学期望的性质4得此性质可以推广到有限多个相互独立的随机变量之和的情况.第22页,课件共153页,创作于2023年2月2023/7/1423

E{[X-E(X)][Y-E(Y)]}称为随机变量X和Y的协方差,记为Cov(X,Y),即

⑶Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)⑴Cov(X,Y)=Cov(Y,X)2.简单性质⑵Cov(aX,bY)=ab

Cov(X,Y)a,b是常数Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}1.定义3)协方差和相关系数第23页,课件共153页,创作于2023年2月2023/7/1424

Cov(X,Y)=E(XY)-E(X)E(Y)

可见,若X与Y独立,Cov(X,Y)=0.计算协方差的一个简单公式由协方差的定义及期望的性质,可得特别地

Cov(X,X)=E(X2)–[E(X)]2=D(X)D(X+Y)=D(X)+D(Y)+2Cov(X,Y)第24页,课件共153页,创作于2023年2月2023/7/1425协方差的大小在一定程度上反映了X和Y相互间的关系,但它还受X与Y本身度量单位的影响.例如:Cov(kX,kY)=k2Cov(X,Y)为了克服这一缺点,对协方差进行标准化,这就引入了相关系数

.第25页,课件共153页,创作于2023年2月2023/7/1426二、相关系数为随机变量X和Y的相关系数

.定义:

设D(X)>0,D(Y)>0,称在不致引起混淆时,记

.第26页,课件共153页,创作于2023年2月2023/7/1427相关系数的性质:2.X和Y独立时,

=0,但其逆不真.存在常数a,b(b≠0),使P{Y=a+bX}=1,即X和Y以概率1线性相关.第27页,课件共153页,创作于2023年2月2023/7/1428若ρ=0,则Y与X无线性关系;则Y与X有严格线性关系;若若0<|ρ|<1,|ρ|的值越接近于1,Y与X的线性相关程度越高;|ρ|的值越接近于0,Y与X的线性相关程度越弱.相关系数刻划了X和Y间“线性相关”的程度.第28页,课件共153页,创作于2023年2月2023/7/1429但对下述情形,独立与不相关等价若(X,Y)服从二维正态分布,则X与Y独立X与Y不相关前面,我们已经看到:若X与Y独立,则X与Y不相关,但由X与Y不相关,不一定能推出X与Y独立.第29页,课件共153页,创作于2023年2月2023/7/1430定理:N个独立正态随机变量之和仍然服从正态分布正态分布的重要性质推广:N个独立正态随机变量的任意线性组合仍然服从正态分布第30页,课件共153页,创作于2023年2月2023/7/1431例、设X~N(1,2),Y~N(0,1),且X和Y相互独立,试求Z=2X-Y+3的概率密度.

任意线性组合是正态分布,即:解:X~N(1,2),Y~N(0,1),且X与Y独立,故X和Y的D(Z)=4D(X)+D(Y)=8+1=9E(Z)=2E(X)-E(Y)+3=2+3=5Z~N(E(Z),D(Z))故Z

的概率密度是即:Z~N(5,32)第31页,课件共153页,创作于2023年2月2023/7/1432矩阵代数§1.1定义§1.2矩阵的运算§1.3行列式§1.4矩阵的逆§1.5矩阵的秩§1.6特征值、特征向量和矩阵的迹§1.7正定矩阵和非负定矩阵§1.8特征值的极值问题第32页,课件共153页,创作于2023年2月2023/7/1433§1.1定义p×q矩阵:p维列向量:q维行向量:

a′=(a1,a2,⋯,aq)向量a的长度:单位向量:第33页,课件共153页,创作于2023年2月2023/7/1434若A的所有元素全为零,则称A为零矩阵,记作A=0pq或A=0。若p=q,则称A为p阶方阵,a11,a22,⋯,app称为它的对角线元素,其他元素aij(i≠j)称为非对角线元素。若方阵A的对角线下方的元素全为零,则称A为上三角矩阵。显然,aij=0,i>j。若方阵A的对角线上方的元素全为零,则称A为下三角矩阵。显然,aij=0,i<j。若方阵A的所有非对角线元素均为零,则称A为对角矩阵,简记为A=diag(a11,a22,⋯,app)。若p阶对角矩阵A的所有p个对角线元素均为1,则称A为p阶单位矩阵,记作A=Ip或A=I。第34页,课件共153页,创作于2023年2月2023/7/1435若将矩阵A的行与列互换,则得到的矩阵称为A的转置,记作A′,即若方阵A满足A′=A,则称A为对称矩阵。显然,aij=aji。第35页,课件共153页,创作于2023年2月2023/7/1436§1.2矩阵的运算若A=(aij):p×q,B=(bij):p×q,则A与B的和定义为A+B=(aij+bij):p×q若c为一常数,则它与A的积定义为cA=(caij):p×q若A=(aij):p×q,B=(bij):q×r,则A与B的积定义为第36页,课件共153页,创作于2023年2月2023/7/1437运算规律(1)(A+B)′=A′+B′。(2)(AB)′=B′A′。(3)A(B1+B2)=AB1+AB2。(4)

。(5)c(A+B)=cA+cB。第37页,课件共153页,创作于2023年2月2023/7/1438若两个p维向量a和b满足a′b=a1b1+a2b2+⋯+apbp=0

则称a和b正交。几何上,正交向量之间相互垂直。若方阵A满足AA′=I,则称A为正交矩阵。显然,

i=1,2,⋯,p,即A的p个行向量为单位向量;

,即A的p个行向量相互正交。又从A′A=I得: (j≠k),即A的p个列向量也是一组正交单位向量。若方阵A满足A2=A,则称A为幂等矩阵。对称的幂等矩阵称为投影矩阵。第38页,课件共153页,创作于2023年2月2023/7/1439正交矩阵A的几何意义将p维向量x看作是在Rp中的一个点,则x的各分量是该点在相应各坐标轴上的坐标。正交阵A的行列式非1即−1。若|A|=1,则正交变换y=Ax意味着对原p维坐标系作一刚性旋转(或称正交旋转),y的各分量正是该点在新坐标系下的坐标;若|A|=−1,则包含了一个反射的坐标轴。当p=2时,按逆时针方向将直角坐标系x1Ox2旋转一个角度θ,所得新坐标系y1Oy2与原坐标系之间的变换为

当p=3时同样有着直观的几何展示。由于y′y=(Ax)′(Ax)=x′A′Ax=x′x

故在新、旧坐标系下,该点到原点的距离保持不变。第39页,课件共153页,创作于2023年2月2023/7/1440矩阵的分块设A=(aij):p×q,将它分成四块,表示成

其中A11:k×l,A12:k×(q−l),A21:(p−k)×l, A22:(p−k)×(q−l)。若A和B有相同的分块,则第40页,课件共153页,创作于2023年2月2023/7/1441若C为q×r矩阵,分成

其中C11:l×m,C12:l×(r−m),C21:(q−l)×m,C22:(q−l)×(r−m),则有第41页,课件共153页,创作于2023年2月2023/7/1442例1.2.2用矩阵分块方法证明正交矩阵A:p×p的p个列向量和p个行向量都是一组正交单位向量。证明

将矩阵A分别按列向量和行向量分块,并记

由A′A=I,得第42页,课件共153页,创作于2023年2月2023/7/1443

于是

故有

即a1,a2,⋯,ap为一组正交单位向量。同理,由AA′=I可证a(1),a(2),⋯,a(p)也是一组正交单位向量。第43页,课件共153页,创作于2023年2月2023/7/1444§1.3行列式p阶方阵A=(aij)的行列式定义为

这里

表示对1,2,⋯,p的所有排列求和,τ(j1j2⋯jp)

是排列j1,j2,⋯,jp中逆序的总数,称它为这个排列的逆序数,一个逆序是指在一个排列中一对数的前后位置与大小顺序相反,即前面的数大于后面的数。例如,τ(3142)=1+τ(1342)=3+τ(1234)=3。第44页,课件共153页,创作于2023年2月2023/7/1445行列式的一些基本性质(1)若A的某行(或列)为零,则|A|=0。(2)|A′|=|A|。(3)若将A的某一行(或列)乘以常数c,则所得矩阵的行列式为c|A|。(4)若A是一个p阶方阵,c为一常数,则|cA|=cp|A|。(5)若互换A的任意两行(或列),则行列式符号改变。(6)若A的某两行(或列)相同,则行列式为零。(7)若将A的某一行(或列)的倍数加到另一行(或列),则所得行列式不变。(8)若A的某一行(或列)是其他一些行(或列)的线性组合,则行列式为零。第45页,课件共153页,创作于2023年2月2023/7/1446(9)若A为上三角矩阵或下三角矩阵或对角矩阵,则

(10)若A和B均为p阶方阵,则|AB|=|A||B|。(11)|AA′|≥0。(12)若A与B都是方阵,则(13)若A:p×q,B:q×p,则|Ip+AB|=|Iq+BA|例1.3.3设x,y为两个p维向量,则|Ip+xy′|=1+y′x第46页,课件共153页,创作于2023年2月2023/7/1447代数余子式设A为p阶方阵,将其元素aij所在的第i行与第j列划去之后所得(p−1)阶矩阵的行列式,称为元素aij的余子式,记为Mij。Aij=(−1)i+jMij称为元素aij的代数余子式。有以下公式成立第47页,课件共153页,创作于2023年2月2023/7/1448§1.4矩阵的逆若方阵A满足|A|≠0,则称A为非退化方阵;若|A|=0,则称A为退化方阵。设A=(aij)是一非退化方阵,若方阵C满足AC=I,则称C为A的逆矩阵,记为C=A−1,A−1必是一个非退化矩阵。令B′=(Aij)/|A|

其中Aij是aij的代数余子式,则容易验证AB=BA=I。由于C=BAC=B,因此A−1是惟一的,且(A−1)−1=A。第48页,课件共153页,创作于2023年2月2023/7/1449逆矩阵的基本性质(1)AA−1=A−1A=I。(2)(A′)−1=(A−1)′。(3)若A和C均为p阶非退化方阵,则(AC)−1=C−1A−1(4)|A−1|=|A|−1。(5)若A是正交矩阵,则A−1=A′。(6)若A=diag(a11,a22,⋯,app)非退化(即aii≠0,i=1,2,⋯,p),则

(7)若A和B为非退化方阵,则第49页,课件共153页,创作于2023年2月2023/7/1450§1.5矩阵的秩一组同维向量a1,a2,⋯,an,若存在不全为零的常数c1,c2,⋯,cn,使得c1a1+c2a2+⋯+cnan=0

则称该组向量线性相关。若向量a1,a2,⋯,an不线性相关,就称为线性无关。矩阵A的线性无关行向量的最大数目称为行秩,其线性无关列向量的最大数目称为列秩。矩阵的行秩和列秩必相等,故统一将其称为A的秩,记作rank(A)。第50页,课件共153页,创作于2023年2月2023/7/1451矩阵秩的基本性质(1)rank(A)=0,当且仅当A=0。(2)若A为p×q矩阵,且A≠0,则1≤rank(A)≤min{p,q}(若rank(A) =p,则称A为行满秩的;若rank(A)=q,则称A为列满秩的)。(3)rank(A)=rank(A′)。(4)

。(5)rank(AB)≤min{rank(A),rank(B)}。(6)若A和C为非退化方阵,则rank(ABC)=rank(B)(7)p阶方阵A是非退化的,当且仅当rank(A)=p(称作A满秩)。(8)rank(AA′)=rank(A′A)=rank(A)。第51页,课件共153页,创作于2023年2月2023/7/1452§1.6特征值、特征向量和矩阵的迹一、特征值和特征向量二、矩阵的迹第52页,课件共153页,创作于2023年2月2023/7/1453一、特征值和特征向量设A是p阶方阵,若对于一个数λ,存在一个p维非零向量x,使得Ax=λx,则称λ为A的一个特征值或特征根,而称x为A的属于特征值λ的一个特征向量。依该定义有,(A−λI)x=0,而x≠0,故必有|A−λI|=0 |A−λI|是λ的p次多项式,称为特征多项式。上式有p个根 (可能有重根),记作λ1,λ2,⋯,λp,它们可能为实数,也可能为复数(虽然A是实数矩阵)。反过来,若λi是上式的一个根,则A−λiI为退化矩阵,故存在一个p维非零向量xi,使得(A−λiI)xi=0

即λi是A的一个特征值,而xi是相应的特征向量。今后,一般取xi为单位向量,即满足xi′xi=1。第53页,课件共153页,创作于2023年2月2023/7/1454特征值和特征向量的基本性质(1)A和A′有相同的特征值。(2)若A和B分别是p×q和q×p矩阵,则AB和BA有相同的非零特征值。(3)若A为实对称矩阵,则A的特征值全为实数,p个特征值按大小依次表示为λ1≥λ2≥⋯≥λp。若λi≠λj,则相应的特征向量xi和xj必正交,即xi′xj=0。(4)若A=diag(a11,a22,⋯,app),则a11,a22,⋯,app为A的p个特征值,相应的特征向量分别为e1=(1,0,⋯,0)′,e2=(0,1,0,⋯,0)′,⋯,ep=(0,⋯,0,1)′。(5)

,即A的行列式等于其特征值的乘积。可见,A

为非退化矩阵,当且仅当A的特征值均不为零;A为退化矩阵,当且仅当A至少有一个特征值为零。第54页,课件共153页,创作于2023年2月2023/7/1455例1.6.4设方阵A:p×p的p个特征值为λ1,λ2,⋯,λp,试证: (i)若A可逆,相应于λ1,λ2,⋯,λp的特征向量分别为x1,x2,⋯,xp,则A−1的p个特征值为

,相应的特征向量仍为x1,x2,⋯,xp; (ii)若A为幂等矩阵,则A的特征值为0或1; (iii)若A为正交矩阵,则A的特征值为1或−1。(6)若A为p阶对称矩阵,则存在正交矩阵T及对角矩阵Λ=diag(λ1,λ2,⋯,λp),使得A=TΛT′上式两边右乘T,得AT=TΛ

将T按列向量分块,并记作T=(t1,t2,⋯,tp),于是有(At1,At2,⋯,Atp)=(λ1t1,λ2t2,⋯,λptp)第55页,课件共153页,创作于2023年2月2023/7/1456

故Ati=λiti,i=1,2,⋯,p

这表明λ1,λ2,⋯,λp是A的p个特征值,而t1,t2,⋯,tp为相应的(一组正交单位)特征向量。

称之为A的谱分解。(7)若A为p×q实数矩阵,则存在p阶正交矩阵U和q阶正交矩阵V,使得A=UΛV′

其中Λ的(i,i)元素λi≥0,i=1,2,⋯,min(p,q),其他元素均为零。正数λi称为A的奇异值,上述分解式称为奇异值分解。第56页,课件共153页,创作于2023年2月2023/7/1457设rank(A)=k

,则矩阵Λ中只有k个正数,记为λ1,λ2,⋯,λk。将正交矩阵U和V按列分块有,U=(u1,u2,⋯,up),V=(v1,v2,⋯,vq),令U1=(u1,u2,⋯,uk),V1=(v1,v2,⋯,vk),Λ1=diag(λ1,λ2,⋯,λk),则得到奇异值分解的另一表达式:

这里u1,u2,⋯,uk是一组p维正交单位向量,v1,v2,⋯,vk是一组q维正交单位向量,即有U1′U1=V1′V1=I。由A=UΛV′知,AA′=UΛ2U′,A′A=VΛ2V′,于是AA′ui=λi2ui,i=1,2,⋯,pA′Avi=λi2vi,i=1,2,⋯,q

是AA′的p个特征值,u1,u2,⋯,up

是相应的特征向量;

是A′A

的q个特征值,v1,v2,⋯,vq

是相应的特征向量。第57页,课件共153页,创作于2023年2月2023/7/1458二、矩阵的迹设A为p阶方阵,则它的对角线元素之和称为A的迹,记作tr(A),即tr(A)=a11+a22+⋯+app方阵的迹具有下述基本性质:(1)tr(AB)=tr(BA)。特别地,tr(ab′)=b′a。(2)tr(A)=tr(A′)。(3)tr(A+B)=tr(A)+tr(B)。(4)

。第58页,课件共153页,创作于2023年2月2023/7/1459(5)设A=(aij)为p×q矩阵,则(6)(7)设λ1,λ2,⋯,λp为方阵A的特征值,则tr(A)=λ1+λ2+⋯+λp(7)若A为投影矩阵,则tr(A)=rank(A)第59页,课件共153页,创作于2023年2月2023/7/1460§1.7正定矩阵和非负定矩阵设A是p阶对称矩阵,x是一p维向量,则x′Ax称为A的二次型。若对一切x≠0,有x′Ax>0,则称A为正定矩阵,记作A>0;若对一切x,有x′Ax≥0,则称A为非负定矩阵,记作A≥0。对非负定矩阵A和B,A>B表示A−B>0;A≥B表示A−B≥0。第60页,课件共153页,创作于2023年2月2023/7/1461正定矩阵和非负定矩阵的基本性质(1)设A是对称矩阵,则A是正定(或非负定)矩阵,当且仅当A的所有特征值均为正(或非负)。(2)设A≥0,则A的秩等于A的正特征值个数。(3)若A>0,则A−1>0。(4)设A≥0,则A>0,当且仅当|A|≠0。(5)若A>0(或≥0),则|A|>0(或≥0)。(6)BB′≥0,对一切矩阵B成立。(7)若A>0(或≥0),则存在>0(或≥0),使得

称为A的平方根矩阵。(8)设A≥0是p阶秩为r的矩阵,则存在一个秩为r(即列满秩)的p×r矩阵B,使得A=BB′。第61页,课件共153页,创作于2023年2月2023/7/1462§1.8特征值的极值问题(1)若A是p阶对称矩阵,其特征值依次为λ1≥λ2≥⋯≥λp,则(2)若A是p阶对称矩阵,B是p阶正定矩阵,μ1≥μ2≥⋯≥μp是B−1A的p个特征值,则(3)柯西—许瓦兹不等式(Cauchy−Schwarz)若B>0,则(x′y)2≤(x′Bx)(y′B−1y)第62页,课件共153页,创作于2023年2月2023/7/1463第二节基本概念一随机向量二多元分布三随机向量的数字特征

第63页,课件共153页,创作于2023年2月2023/7/1464

第64页,课件共153页,创作于2023年2月2023/7/1465二、多元分布

第65页,课件共153页,创作于2023年2月2023/7/1466

第66页,课件共153页,创作于2023年2月2023/7/1467

第67页,课件共153页,创作于2023年2月2023/7/1468

第68页,课件共153页,创作于2023年2月2023/7/1469

第69页,课件共153页,创作于2023年2月2023/7/1470

第70页,课件共153页,创作于2023年2月2023/7/1471

第71页,课件共153页,创作于2023年2月2023/7/1472

第72页,课件共153页,创作于2023年2月2023/7/1473三、随机向量的数字特征

第73页,课件共153页,创作于2023年2月2023/7/1474

第74页,课件共153页,创作于2023年2月2023/7/1475

第75页,课件共153页,创作于2023年2月2023/7/1476

第76页,课件共153页,创作于2023年2月2023/7/1477

第77页,课件共153页,创作于2023年2月2023/7/1478

第78页,课件共153页,创作于2023年2月2023/7/1479第三节多元正态分布一多元正态分布的定义

二多元正态分布的性质

第79页,课件共153页,创作于2023年2月2023/7/1480一、多元正态分布的定义

第80页,课件共153页,创作于2023年2月2023/7/1481

第81页,课件共153页,创作于2023年2月2023/7/1482

第82页,课件共153页,创作于2023年2月2023/7/1483

第83页,课件共153页,创作于2023年2月2023/7/1484二、多元正态分布的性质

第84页,课件共153页,创作于2023年2月2023/7/1485

第85页,课件共153页,创作于2023年2月2023/7/1486

第86页,课件共153页,创作于2023年2月2023/7/1487第87页,课件共153页,创作于2023年2月2023/7/1488第88页,课件共153页,创作于2023年2月2023/7/1489第89页,课件共153页,创作于2023年2月2023/7/1490

第90页,课件共153页,创作于2023年2月2023/7/1491第二节

数理统计基础一、样本及其抽样分布二、参数估计三、假设检验第91页,课件共153页,创作于2023年2月2023/7/1492一、样本及其抽样分布例:设某厂1年内生产了1,000,000只灯泡,我们需要考察这一百万只灯泡的寿命情况。

1)总体研究对象的某项数量指标的值的全体称为总体总体中所包含的个体的个数称为总体的容量.总体中每个元素称为个体。每个个体是一个实数第92页,课件共153页,创作于2023年2月2023/7/1493每只灯泡的寿命是随机的,因此可以将其看作一个随机变量X,而X的取值存在一定的分布。这样,总体就可以用一个随机变量及其分布来描述。我们对总体的研究就可以转化为对该随机变量及其性质的研究。

1)总体总体就是一个随机变量第93页,课件共153页,创作于2023年2月2023/7/1494这一抽取过程称为“抽样”,所抽取的部分个体称为样本。样本中所包含的个体数目称为样本容量2)样本总体分布一般是未知,或只知道是包含未知参数的分布,为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息。第94页,课件共153页,创作于2023年2月2023/7/1495一旦取定一组样本X1,…,Xn

,就可以通过观察得到n个具体的数(x1,x2,…,xn)。称(x1,x2,…,xn)为样本的一次观察值,简称样本值

.最常用的一种抽样叫作“简单随机抽样”,其特点:1.代表性:

X1,X2,…,Xn中每一个与所考察的总体有相同的分布.2.独立性:

X1,X2,…,Xn是相互独立的随机变量.2)样本第95页,课件共153页,创作于2023年2月2023/7/1496由样本观察值去推断总体情况,需要对样本值进行“加工”,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来.1)统计量这种不含任何未知参数的样本的函数称为统计量.它是完全由样本决定的量.二、统计量与抽样分布函数第96页,课件共153页,创作于2023年2月2023/7/1497几个常见统计量样本平均值它反映了总体均值的信息样本方差它反映了总体方差的信息样本标准差第97页,课件共153页,创作于2023年2月2023/7/1498统计量值第98页,课件共153页,创作于2023年2月2023/7/1499几个概念之间的关系总体:X样本:X1,X2,…,Xn抽样实验样本观察值:x1,x2,…,xn统计量:f(X1,X2,…,Xn)代入统计量值:f(x1,x2,…,xn)第99页,课件共153页,创作于2023年2月2023/7/14100

2)统计三大抽样分布记为定义:

设相互独立,都服从标准正态分布N(0,1),则称随机变量:

所服从的分布为自由度为

n

分布.Ⅰ、分布自由度(degreeoffreedom,df):是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数称为该统计量的自由度例如,在估计总体的平均值时,样本中的n个数全部加起来,其中任何一个数都和其他数据相独立,从其中抽出任何一个数都不影响其他数据(这也是随机抽样所要求的)。因此一组数据中每一个数据都是独立的,所以自由度就是估计总体参数时独立数据的数目,而平均值是根据n个独立数据来估计的,因此自由度为n。第100页,课件共153页,创作于2023年2月2023/7/14101如图所示:例如:的点为分布的上α分位点对于给定的正数,称满足条件:分布的上α分位数第101页,课件共153页,创作于2023年2月2023/7/14102

定义:

设X~N(0,1),Y~,且X与Y相互独立,则称变量:服从自由度为n的t分布.Ⅱ、t分布记为:t~t(n)t分布又称为学生氏(Student)分布t分布的密度函数关于t=0对称;当n充分大时,t分布近似于标准正态分布N(0,1)第102页,课件共153页,创作于2023年2月2023/7/14103t分布的上α分位点:对于给定的正数α∈(0,1),称满足条件:的点为t(n)分布的上α分位点如图所示:第103页,课件共153页,创作于2023年2月2023/7/14104第104页,课件共153页,创作于2023年2月2023/7/14105Ⅲ、F分布服从自由度为n1及n2的F分布,n1称为第一自由度,n2称为第二自由度。F~F(n1,n2).记作:

定义:

,且U与V相互独立,则称随机变量:~F(n2,n1)若F~F(n1,n2),则1/F~F(n2,n1)第105页,课件共153页,创作于2023年2月2023/7/14106F分布的上α分位点的点Fα(n1,n2)为F(n1,n2)分布的上α分位点如图所示:第106页,课件共153页,创作于2023年2月2023/7/14107第107页,课件共153页,创作于2023年2月2023/7/141083、几个重要的抽样分布定理特别地,当总体为正态分布时,以下将给出几个重要的抽样分布定理.第108页,课件共153页,创作于2023年2月2023/7/14109

定理1(样本均值的分布)设X1,X2,…,Xn是来自正态总体的样本,是样本均值,则有第109页,课件共153页,创作于2023年2月2023/7/14110定理2

(样本方差的分布)设X1,X2,…,Xn是来自正态总体的样本,分别为样本均值和样本方差,则有第110页,课件共153页,创作于2023年2月2023/7/14111

定理3设X1,X2,…,Xn是取自正态总体的样本,分别为样本均值和样本方差,则有第111页,课件共153页,创作于2023年2月2023/7/14112

定理3设X1,X2,…,Xn是取自正态总体的样本,分别为样本均值和样本方差,则有第112页,课件共153页,创作于2023年2月2023/7/14113

定理4若:,则定理5若:,则定理6若:,且是幂等矩阵则其中第113页,课件共153页,创作于2023年2月2023/7/14114点估计估计量的评选标准区间估计

二、参数估计第114页,课件共153页,创作于2023年2月2023/7/14115参数估计问题的一般提法X1,X2,…,Xn要依据该样本对参数θ作出估计,或估计θ的某个已知函数g(θ)。现在从该总体抽样,得到样本设有一个统计总体,总体的分布函数为F(x,

θ),其中θ为未知参数(θ可以是向量).

这类问题称为参数估计.

二、参数估计第115页,课件共153页,创作于2023年2月2023/7/141161、点估计概念随机抽查100个婴儿,…得100个体重数据10,7,6,6.5,5,5.2,

…呢?据此,我们应如何估计和例1

已知某地区新生婴儿的体重,未知第116页,课件共153页,创作于2023年2月2023/7/14117

为估计:我们需要构造出适当的样本的函数T(X1,X2,…Xn)

,每当有了样本,就代入该函数中算出一个值,用来作为的估计值.称统计量T(X1,X2,…Xn)

为参数的一个点估计量把样本的一组观察值代入点估计量T(X1,X2,…Xn)

中,就可以得到参数的一个点估计值。第117页,课件共153页,创作于2023年2月2023/7/14118我们知道,若,则

.用样本体重的均值估计.类似地,用样本体重的方差估计.第118页,课件共153页,创作于2023年2月2023/7/14119样本均值是否是的一个好的估计量?样本方差是否是的一个好的估计量?

2、估计量的评选标准问题是:估计量的常用评判标准:1.无偏性2.有效性3.一致性第119页,课件共153页,创作于2023年2月2023/7/14120估计量是随机变量,对于不同的样本值会得到不同的估计值.我们希望估计值在未知参数真值附近摆动,而它的期望值等于未知参数的真值.这就导致无偏性这个标准.1)、无偏性则称为的无偏估计

.设是未知参数的估计量,若第120页,课件共153页,创作于2023年2月2023/7/14121所以无偏估计以方差小者为好,这就引进了有效性这一概念.的大小来决定二者谁更优.和一个参数往往有不止一个无偏估计,若和都是参数的无偏估计量,我们可以比较由于2)、有效性第121页,课件共153页,创作于2023年2月2023/7/141222)、有效性D()≤D()则称较有效.都是参数的无偏估计量,若对任意,设和且至少对于某个上式中的不等号成立,第122页,课件共153页,创作于2023年2月2023/7/141233)、一致性任意,当时依概率收敛于,则称为的一致估计量.设是参数的估计量,若对于无偏性和有效性都是在样本容量n固定的前提下提出来的,我们自然希望随着样本容量的增大,一个估计量的值能稳定于待估参数的真实值,因此对估计量又有下述一致性的要求:第123页,课件共153页,创作于2023年2月2023/7/14124

引言前面,我们讨论了参数点估计.它是用样本算得的一个值去估计未知参数.但是,点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误差范围,使用起来把握不大.区间估计正好弥补了点估计的这个缺陷.

3、区间估计第124页,课件共153页,创作于2023年2月2023/7/14125

譬如,在估计新生婴儿体重的问题中,若我们根据一个实际样本,得到婴儿平均体重θ的一个点估计值为3千克若我们能给出一个区间,在此区间内我们合理地相信θ

的真值位于其中.这样对婴儿平均体重的估计就有把握多了.实际上,θ的真值可能大于3千克,也可能小于3千克.第125页,课件共153页,创作于2023年2月2023/7/14126也就是说,我们希望确定一个区间,使我们能以比较高的可靠程度相信它包含真参数值.这里所说的“可靠程度”是用概率来度量的,称为置信度或置信水平.习惯上把置信水平记作,这里是一个很小的正数.第126页,课件共153页,创作于2023年2月2023/7/14127置信水平的大小是根据实际需要选定的.置信区间.称区间为的置信水平为的例如,通常选取置信水平1-α=0.99、0.95、0.90根据一个实际样本,由给定的置信水平,我小的区间,使们求出一个尽可能第127页,课件共153页,创作于2023年2月2023/7/14128

1)置信区间定义设是一个待估参数,给定X1,X2,…Xn确定的两个统计量若由样本满足和分别称为置信下限和置信上限.则称区间是的置信水平(置信度)为

的置信区间.第128页,课件共153页,创作于2023年2月2023/7/141291.要求以很大的可能被包含在区间内,就是说,概率要尽可能大.即要求估计尽量可靠.2.估计的精度要尽可能的高.即要求区间长度尽可能短,或能体现该要求的其它准则.可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度.区间估计的两点要求第129页,课件共153页,创作于2023年2月2023/7/14130在求置信区间时,要查表求分位点.2)、置信区间的求法设,对随机变量X,称满足的点为X的概率分布的上分位点.定义第130页,课件共153页,创作于2023年2月2023/7/14131例:若X为连续型随机变量,求X的置信度为1-α的置信区间置信区间解:设所求的置信区间为(a,b),则:第131页,课件共153页,创作于2023年2月2023/7/14132我们总是希望置信区间尽可能短.从上例可以看出,置信区间是不惟一的事实上,若X的概率分布函数为f(u),取置信水平为95%,则对任意两个数a和b,只要它们包含了f(u)下95%的面积,就确定一个95%的置信区间.第132页,课件共153页,创作于2023年2月2023/7/14133在概率密度为单峰且对称的情形,当a=-b时求得的置信区间的长度为最短.a=-b第133页,课件共153页,创作于2023年2月2023/7/14134即使概率密度不对称,如χ2分布,F分布,习惯上仍取对称的分位点来计算置信区间.第134页,课件共153页,创作于2023年2月2023/7/14135~N(0,1)解:选μ的点估计为,求参数的置信度为的置信区间.例1设X1,…Xn是取自的样本,寻找未知参数的一个良好估计量.寻找一个待估参数及其估计量的函数,要求其分布为已知.有了分布,就可以求出U取值于任意区间的概率.明确问题,是求什么参数的置信区间?置信水平是多少?第135页,课件共153页,创作于2023年2月2023/7/14136对给定的置信水平查正态分布表得对于给定的置信水平,根据U的分布,确定一个区间,使得U取值于该区间的概率为置信水平.为什么这样取?第136页,课件共153页,创作于2023年2月2023/7/14137从中解得也可简记为于是所求的置信区间为第137页,课件共153页,创作于2023年2月2023/7/141383)、单正态总体均值的置信区间并设为来自总体的样本,分别为样本均值和样本方差.统计量σ2未知σ2已知置信区间1)均值μ的置信区间(置信水平为1-α

第138页,课件共153页,创作于2023年2月2023/7/14139假设检验的基本思想和方法假设检验的一般步骤单正态总体均值的假设检验单正态总体方差的假设检验四、假设检验第139页,课件共153页,创作于2023年2月2023/7/14140假设检验参数假设检验非参数假设检验这类问题称作假设检验问题.总体分布已知,检验关于未知参数的某个假设总体分布未知时的假设检验问题在本节中,我们将讨论不同于参数估计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论