概率与数理统计课件_第1页
概率与数理统计课件_第2页
概率与数理统计课件_第3页
概率与数理统计课件_第4页
概率与数理统计课件_第5页
已阅读5页,还剩663页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

邊緣分佈(一)邊緣分佈函數

二維隨機向量(X,Y)作為一個整體,具有分佈函數F(x,y).

其分量X和Y也都是隨機變數,也有自己的分佈函數,將其分別記為FX(x),FY(y).依次稱為X和Y的邊緣分佈函數.

而把F(x,y)稱為X和Y的聯合分佈函數.FX(x)=P{X≤x}=P{X≤x,Y<∞}=F(x,∞)FY(y)=P{Y≤y}=P{X<∞,Y≤y}=F(∞,y)

X和Y的邊緣分佈函數,本質上就是一維隨機變數X和Y的分佈函數.之所以稱其為邊緣分佈是相對於(X,Y)的聯合分佈而言的.

同樣地,聯合分佈函數F(x,y)就是二維隨機向量(X,Y)的分佈函數,之所以稱其為聯合分佈是相對於其分量X或Y的分佈而言的.注意求法一般,對離散型r.v(X,Y),則(X,Y)關於X的邊緣概率函數為(X,Y)關於Y的邊緣概率函數為X和Y的聯合概率函數為(二)二維離散型隨機向量的邊緣分佈解:例1

求:例3.2.1(P62)中(X,Y)的分量X和Y的邊緣分佈.把這些數據補充到前面表上:解:例2(舊書P63,新書P60)轉下頁求:例3.2.2中(X,Y)的分量X和Y的邊緣分佈.

P{X=0}=P{X=0,Y=0}+P{X=0,Y=1}=0.00013+0.19987=0.20000P{X=1}=P{X=1,Y=0}+P{X=1,Y=1}=0.00004+0.79996=0.80000P{Y=0}=P{X=0,Y=0}+P{X=1,Y=0}=0.00013+0.00004=0.00017P{Y=1}=P{X=0,Y=1}+P{X=1,Y=1}=0.19987+0.79996=0.99983把這些數據補充到例3.2.2的計算結果上:

(三)、對連續型隨機向量

(X,Y)X和Y的聯合概率密度為則(X,Y)關於X的邊緣概率函數為(X,Y)關於Y的邊緣概率函數為例3

若(X,Y)服從矩形區域a≤x≤b.c≤y≤d上均勻分佈,兩個邊緣概率密度分別為:

上題中X和Y都是服從均勻分佈的隨機變數.但對於其他(不是矩形)區域上的均勻分佈,不一定有上述結論.例4

設(X,Y)服從單位圓域x2+y2≤1上的均勻分佈,求:X和Y的邊緣概率密度.解:當x<-1或x>1時當-1≤x≤1時(注意積分限的確定方法)

由X和Y在問題中地位的對稱性,將上式中的x改為y,就得到Y的邊緣概率密度:例5

設(X,Y)的概率密度是求(1)c的值;(2)兩個邊緣密度。=5c/24=1,c=24/5解:(1)由確定Cxy01y=x例5

設(X,Y)的概率密度是解:(2)求(1)

c的值;(2)兩個邊緣密度.注意積分限注意取值範圍xy01y=x例5

設(X,Y)的概率密度是解:(2)求(1)

c的值;(2)兩個邊緣密度.注意積分限注意取值範圍xy01y=x即即解:例6

設:(X,Y)∼N(

1,2,,)求:X,Y的邊緣概率密度.這說明X∼同理得Y∼

說明對於確定的

1,2,1,2,當

不同時,對應了不同的二維正態分佈。對這個現象的解釋是:邊緣概率密度只考慮了單個分量的情況,而未涉及X與Y之間的關係.(X1,X2)∼N(

1,2,,)

X1∼X2∼(與參數

無關)

X與Y之間的關係這個資訊是包含在(X,Y)的聯合概率密度函數之內的.

在下一章將指出,對於二維正態分佈而言,參數

正好刻畫了X和Y之間關係的密切程度.

因此,僅由X和Y的邊緣概率密度(或邊緣分佈),一般不能確定(X,Y)的概率密度函數(或概率分佈)

參數估計

總體是由總體分佈來刻畫的.

總體分佈類型的判斷──在實際問題中,我們根據問題本身的專業知識或以往的經驗或適當的統計方法,有時可以判斷總體分佈的類型.

總體分佈的未知參數的估計──總體分佈的參數往往是未知的,需要通過樣本來估計.通過樣本來估計總體的參數,稱為參數估計,它是統計推斷的一種重要形式.

本章討論:

參數估計的常用方法.

估計的優良性準則.

若干重要總體的參數估計問題.例如

(1)為了研究人們的市場消費行為,我們要先搞清楚人們的收入狀況.

假設某城市人均年收入X∼N(,2).但參數

2的具體值並不知道,需要通過樣本來估計.(2)假定某城市在單位時間(譬如一個月)內交通事故發生次數X∼P(

).

參數

未知,需要從樣本來估計.這類問題稱為參數估計.參數估計問題的一般提法X1,X2,…,Xn要依據該樣本對參數作出估計,或估計的某個已知函數.現從該總體抽樣,得樣本設有一個統計總體,總體的分佈函數向量).為F(x,),其中為未知參數(可以是參數估計點估計區間估計(假定身高服從正態分佈)設這5個數是:1.651.671.681.781.69估計為1.68,這是點估計.這是區間估計.估計在區間[1.57,1.84]內,假如我們要估計某隊男生的平均身高.

現從該總體選取容量為5的樣本,我們的任務是要根據選出的樣本(5個數)求出總體均值的估計.而全部資訊就由這5個數組成.一、點估計概念及討論的問題例1

已知某地區新生嬰兒的體重X~隨機抽查100個嬰兒…得100個體重數據9,7,6,6.5,5,5.2,

…呢?據此,我們應如何估計和而全部資訊就由這100個數組成.

為估計,我們需要構造出適當的樣本的函數T(X1,X2,…,Xn),每當有了樣本,就代入該函數中算出一個值,用來作為的估計值.把樣本值代入T(X1,X2,…,Xn)

中,得到

的一個點估計值.T(X1,X2,…Xn)稱為參數的點估計量,

二、尋求估計量的方法1.矩估計法2.極大似然法3.最小二乘法4.貝葉斯方法……這裏我們主要介紹前面兩種方法.

第七章第一節矩估計其基本思想是用樣本矩估計總體矩.

理論依據:

矩是基於一種簡單的“替換”思想建立起來的一種估計方法.是英國統計學家K.皮爾遜最早提出的.大數定律記總體k階矩為樣本k階矩為用相應的樣本矩去估計總體矩的估計方法就稱為矩估計法.記總體k階中心矩為樣本k階中心矩為

設總體X的分佈函數中含有k個未知參數

步驟一、我們把總體X的m階原點矩E(Xm)記為am,m=1,2,

,k

一般地,am(m=1,2,

,k)是總體分佈中的參數

1,2,,k的函數.

故應該把am

(m=1,2,

,k)記之為:am(

1,2,,k)(m=1,2,

,k)方法步驟二、

算出m階樣本原點矩:步驟三、令am(

1,2,,k)=Am

(m=1,2,

,k)得關於

1,2,,k的方程組步驟四、解這個方程組,其解記為

它們就可以做為

1,2,,k的估計.這樣求出的估計叫做矩估計.

∵X1,X2,

,Xn是獨立同分佈的.∴X1m,X2m,

,Xnm也是獨立同分佈的.於是有:E(X1m)=E(X2m)=

=E(Xnm)=E(Xm)=am.根據大數定律,樣本原點矩Am作為X1m,X2m,

,Xnm的算術平均值依概率收斂到均值am=E(Xm).即:原理解釋解:由矩法,樣本矩總體矩從中解得的矩估計.即為數學期望是一階原點矩

例1

設總體X的概率密度為是未知參數,其中X1,X2,…,Xn是取自X的樣本,求參數的矩估計.解:由密度函數知

例2

設X1,X2,…Xn是取自總體X的一個樣本其中>0,求的矩估計.具有均值為的指數分佈故E(X-)=

Var(X-)=即

E(X)=Var(X)=解得令用樣本矩估計總體矩即

E(X)=Var(X)=

設總體的均值為,方差為

2,於是由此列出方程組:例3

均值,方差

2的矩估計∴均值,方差

2的矩估計是:

例如

求正態總體N(,2)兩個未知參數

2的矩估計為總體均勻分佈

X∼U(a,b).求:兩個參數a,b的矩估計解:又如

但是由方程組求解出a,b的矩估計:

矩法的優點是簡單易行,並不需要事先知道總體是什麼分佈.

缺點是,當總體類型已知時,沒有充分利用分佈提供的資訊.一般場合下,矩估計量不具有唯一性.

其主要原因在於建立矩法方程時,選取那些總體矩用相應樣本矩代替帶有一定的隨意性.

大數定律

概率論與數理統計是研究隨機現象統計規律性的學科.隨機現象的規律性只有在相同的條件下進行大量重複試驗時才會呈現出來.也就是說,要從隨機現象中去尋求必然的法則,應該研究大量隨機現象.

研究大量的隨機現象,常常採用極限形式,由此導致對極限定理進行研究.極限定理的內容很廣泛,其中最重要的有兩種:

與大數定律中心極限定理下麵我們先介紹大數定律

大量的隨機現象中平均結果的穩定性

大數定律的客觀背景大量拋擲硬幣正面出現頻率字母使用頻率生產過程中的廢品率……幾個常見的大數定律定理1(切比雪夫大數定律)

設X1,X2,…是相互獨立的隨機變數序列,它們都有有限的方差,並且方差有共同的上界,即Var(Xi)≤K,i=1,2,…,切比雪夫則對任意的ε>0,

切比雪夫大數定律表明,獨立隨機變數序列{Xn},如果方差有共同的上界,則與其數學期望

偏差很小的

概率接近於1.隨機的了,取值接近於其數學期望的概率接近於1.即當n充分大時,差不多不再是切比雪夫大數定律給出了平均值穩定性的科學描述

證明切比雪夫大數定律主要的數學工具是切比雪夫不等式.

設隨機變數X有期望E(X)和方差,則對於任給>0,

作為切比雪夫大數定律的特殊情況,有下麵的定理.定理2(獨立同分佈下的大數定律)

設X1,X2,…是獨立同分佈的隨機變數序列,且E(Xi)=,Var(Xi)=,i=1,2,…,則對任給

>0,

下麵給出的貝努裏大數定律,是定理2的一種特例.貝努裏

設Sn是n重貝努裏試驗中事件A發生的次數,p是事件A發生的概率,引入i=1,2,…,n則是事件A發生的頻率

於是有下麵的定理:

設Sn是n重貝努裏試驗中事件A發生的次數,p是事件A發生的概率,則對任給的ε>0,定理3(貝努裏大數定律)或貝努裏

貝努裏大數定律表明,當重複試驗次數n充分大時,事件A發生的頻率Sn/n與事件A的概率p有較大偏差的概率很小.

貝努裏大數定律提供了通過試驗來確定事件概率的方法.任給ε>0,貝努裏大數定律請看演示下麵給出的獨立同分佈下的大數定律,不要求隨機變數的方差存在.

設隨機變數序列X1,X2,…獨立同分佈,具有有限的數學期E(Xi)=μ,i=1,2,…,則對任給ε>0,定理3(辛欽大數定律)辛欽大數定律辛欽請看演示

例如要估計某地區的平均畝產量,要收割某些有代表性的地塊,例如n塊.計算其平均畝產量,則當n

較大時,可用它作為整個地區平均畝產量的一個估計.這一講我們介紹了大數定律

大數定律以嚴格的數學形式表達了隨機現象最根本的性質之一:它是隨機現象統計規律的具體表現.大數定律在理論和實際中都有廣泛的應用.平均結果的穩定性

二維離散型隨機向量

如果二維隨機向量(X,Y)的每個分量都是離散型隨機變數,則稱(X,Y)是二維離散型隨機向量.

二維離散型隨機向量(X,Y)所有可能取的值也是有限個或可列無窮個.

二維隨機變數(X,Y)聯合分佈離散型i,j=1,2,…X和Y的聯合概率分佈k=1,2,…離散型一維隨機變數Xk=1,2,…X的概率分佈概率分佈也可以用表格表示.

表3.2.1.(II)二維分佈律與二維分佈函數設二維離散型隨機向量(X,Y)的分佈律為

piji=1,2,;j=1,2,

.

於是

(X,Y)的分佈函數解:例1

設有10件產品,其中7件正品,3件次品.現從中任取兩次,每次取一件產品,取後不放回.令:X=1:若第一次取到的產品是次品.X=0:若第一次取到的產品是正品.Y=1:若第二次取到的產品是次品.Y=0:若第二次取到的產品是正品.求:二維隨機向量(X,Y)的概率分佈.(X,Y)所有可能取的值是(0,0),(0,1),(1,0,),(1,1).P{X=0,Y=0}=P{第一次取到正品且第二次也取到正品},

利用古典概型,得:P{X=0,Y=0}=(76)/(109)=7/15

同理求得:P{X=0,Y=1}=(73)/(109)=7/30P{X=1,Y=0}=(37)/(109)=7/30P{X=1,Y=1}=(32)/(109)=1/15例2

為了進行吸煙與肺癌關係的研究,隨機調查了23000個40歲以上的人,其結果列在下表之中.X=1若被調查者不吸煙,X=0若被調查者吸煙,Y=1若被調查者未患肺癌,Y=0若被調查者患肺癌.令:從表中的每一種情況出現的次數計算出它們的頻率,就產生了二維隨機向量(X,Y)的概率分佈:P{X=0,Y=0}≈3/23000=0.00013,P{X=1,Y=0}≈1/23000=0.00004,P{X=0,Y=1}≈4597/23000=0.19987,P{X=1,Y=1}≈18399/23000=0.79996.(I)概率密度函數

設二維隨機向量(X,Y)的分佈函數為F(x,y).如果存在一個非負函數f(x,y),使得對任意實數x,y,總有則稱(X,Y)為連續型隨機向量概率密度函數,簡稱概率密度.

二維連續型隨機向量

連續型一維隨機變數XX的密度函數二維隨機變數(X,Y)連續型X和Y的聯合密度函數

對連續型r.v(X,Y),其概率密度與分佈函數的關係如下:在f(x,y)的連續點解:(1)例1

設(X,Y)的概率密度函數為其中A是常數.(1)求常數A.(2)求(X,Y)的分佈函數;(3)計算P{0<X<4,0<Y<5}.(3)P{0<X<4,0<Y<5}(二)均勻分佈定義

設D是平面上的有界區域,其面積為d,若二維隨機向量(X,Y)的概率密度函數為:則(X,Y)稱

服從D上的均勻分佈.(X,Y)落在D中某一區域A內的概率P{(X,Y)

A},與A的面積成正比而與A的位置和形狀無關.P{(X,Y)

A}=A的面積/d解:例2

設(X,Y)服從圓域x2+y2≤4上的均勻分佈.

計算P{(X,Y)

A},

這裏A是圖中陰影部分的區域

圓域x2+y2≤4的面積d=4

區域A是x=0,y=0和x+y=1三條直線所圍成的三角區域,並且包含在圓域x2+y2≤4之內,面積=0.5

∴P{(X,Y)

A}=0.5/4=1/8

若二維隨機變數(X,Y)具有概率密度記作(X,Y)~N()則稱(X,Y)服從參數為

的二維正態分佈.其中均為常數,且(三)二維正態分佈二維正態分佈(X,Y)的概率密度函數

f(x,y)滿足:

性質證明見黑板(1)(2)二維正態分佈

這一講我們介紹了二維連續型隨機向量的概率密度函數,深入瞭解其概念及性質是十分重要的.

另外,還介紹的二維均勻分佈,二維正態分佈.

方差

例如,某零件的真實長度為a,現用甲、乙兩臺儀器各測量10次,將測量結果X用座標上的點表示如圖:

若讓你就上述結果評價一下兩臺儀器的優劣,你認為哪臺儀器好一些呢?乙儀器測量結果

甲儀器測量結果較好測量結果的均值都是a因為乙儀器的測量結果集中在均值附近又如,甲、乙兩門炮同時向一目標射擊10發炮彈,其落點距目標的位置如圖:你認為哪門炮射擊效果好一些呢?甲炮射擊結果乙炮射擊結果乙較好因為乙炮的彈著點較集中在中心附近.

中心中心

為此需要引進另一個數字特徵,用它來度量隨機變數取值在其中心附近的離散程度.這個數字特徵就是我們這一講要介紹的方差一、方差的定義

採用平方是為了保證一切差值X-E(X)都起正面的作用

由於它與X具有相同的度量單位,在實際問題中經常使用.設X是一個隨機變數,若E{[X-E(X)]2}<∞,則稱Var(X)=E{[X-E(X)]2}(1)為X的方差.注:有的書上記作D(X)若X的取值比較分散,則方差較大.若方差Var(X)=0,則r.v.X

以概率1取常數值.

方差刻劃了隨機變數的取值對於其數學期望的離散程度.若X的取值比較集中,則方差較小;Var(X)=E[X-E(X)]2X為離散型,P{X=xk}=pk

由定義知,方差是隨機變數X的函數g(X)=[X-E(X)]2的數學期望.X為連續型,X~f(x)二、計算方差的一個簡化公式

Var(X)=E(X2)-[E(X)]2

展開證:Var(X)=E[X-E(X)]2=E{X2-2XE(X)+[E(X)]2}=E(X2)-2[E(X)]2+[E(X)]2=E(X2)-[E(X)]2利用期望性質請自己用此公式計算常見分佈的方差.例1

設r.v.

X服從幾何分佈,概率函數為P(X=k)=p(1-p)k-1,k=1,2,…,n其中0<p<1,求Var(X)解:記q=1-p求和與求導交換次序無窮遞縮等比級數求和公式

Var(X)=E(X2)-[E(X)]2

+E(X)求:Var(X)解:例2

設連續型隨機變數X的密度函數f(x)為:例3設隨機變數X的期望和方差為E(X)和Var(X),且Var(X)>0,求:解:

設:X為某加油站在一天開始時貯存的油量,Y為一天中賣出的油量,(當然Y≤X).設(X,Y)具有概率密度函數:

這裏1表明1個容積單位.

求:每日賣出的油量Y的期望與方差.例4解:

當y<0或y>1時當0≤y≤1時三、方差的性質1.設C是常數,則Var(C)=0;2.若C是常數,則Var(CX)=C2

D(X);3.若X1與X2

獨立,則

Var(X1+X2)=Var(X1)+Var(X2);可推廣為:若X1,X2,…,Xn相互獨立,則X1與X2不一定獨立時,Var(X1+X2

)=?請思考

4.

Var(X)=0P(X=C)=1,這裏C=E(X)P(X=x)下麵我們用一例說明方差性質的應用.

兩點分佈

X∼B(1,p),Var(X)=p(1-p)四、常見隨機變數的方差

二項分佈

X∼B(n,p),(其中0<p<1)Var(X)=np(1-p)泊松分佈

X∼P(

)其中

>0,Var(X)=泊松分佈

X∼P(

)其中

>0∴Var(X)=E(X2)-[E(X)]2=

2+-2=

均勻分佈

X∼U(a,b)

指數分佈

正態分佈X∼N(,2)

由第一節E(X)=

小結:這一講,我們介紹了隨機變數的方差.它是刻劃隨機變數取值在其中心附近離散程度的一個數字特徵.通過方差,可以判斷均值相同的隨機變數的取值情況.下麵,我們將介紹刻劃兩r.v.間線性相關程度的兩個重要的數字特徵:協方差與相關係數

古典概率模型

I.什麼是古典概率模型如果試驗E滿足

(1)試驗結果只有有限種,

(2)每種結果發生的可能性相同。則稱這樣的試驗模型為等可能概率模型或古典概率模型,簡稱為等可能概型或古典概型。II.古典概率模型中事件概率求法

因試驗E的結果只有有限種,即樣本點是有限個:

1,

2,…,

n

,其中

Ω={1}∪{

2}∪…∪{

n},{

i}是基本事件,且它們發生的概率都相等。

於是,有

1=P(Ω)=P({1}∪{

2}∪…∪{

n})=P({1})+P({

2})+…+P({

n})=nP({

i}),i=1,2,…n。從而,P({

i})=1/n,i=1,2,…n。因此,若事件A包含k個基本事件,有

P(A)=k(1/n)=k/n。III.古典概模型的例例1:擲一顆均勻骰子,設:A表示所擲結果為“四點或五點”;

B表示所擲結果為“偶數點”。求:P(A)和P(B)。解:由n=6,kA=2,得P(A)=2/6=1/3;再由kB=3,得P(B)=3/6=1/2。例2:解:

貨架上有外觀相同的商品15件,其中12件來自產地甲,3件來自地乙。現從15件商品中隨機地抽取兩件,求這兩件商品來自一同產地的概率。

從15件商品中取出2商品,共有C215=105種取法,且每種取法都是等可能的,故n=105。令A={兩件商品都來自產地甲},kA=C212=66,B={兩件商品都來自產地乙},kB=C23=3,而事件:{兩件商品來自同一產地}=A∪B,且A與B互斥,A∪B包含基本事件數66+3=69。故,所求概率=69/105=23/35。例3

:有外觀相同的三極管6只,按其電流放大係數分類,4只屬甲類,2只屬乙類。按下列兩種方案抽取三極管兩只,(1).每次抽取一個只,測試後放回,然後再抽取下一只(放回抽樣);(2).每次抽取一只,測試後不放回,然後在剩下的三極管中再抽取下一只(不放回抽樣)。設A={抽到兩只甲類三極管},B={抽到兩只同類三極管},C={至少抽到一只甲類三極管},D={抽到兩只不同類三極管}。求:P(A),P(B),P(C),P(D)。解:(1).由於每次抽測後放回,因此,每次都是在6只三極管中抽取。因第一次從6只中取一只,共有6種可能取法;第二次還是從6只中取一只,還是有6種可能取法。故,取兩只三極管共有6

6=36種可能的取法。從而,n=36。注意:這種分析方法使用的是中學學過的

乘法原理

因每個基本事件發生的可能性相同,第一次取一只甲類三極管共有4種可能取法,第二次再取一只甲類三極管還是有4種可能取法。所以,取兩只甲類三極管共有4

4=16種可能的取法,即kA=16。故

P(A)=16/36=4/9;令E={抽到兩只乙類三極管},kE=2

2=4。故

P(E)=4/36=1/9;因C是E的對立事件,故

P(C)=1-P(E)=8/9;因B=A∪E,且A與E互斥,得

P(B)=P(A)+P(E)=5/9;D是B的對立事件,得P(D)=1-P(B)=4/9。(2).由於第一次抽測後不放回,因此,第一次從6只中取一只,共有6種可能的取法;第二次是從剩餘的5只中取一只,有5種可能的取法。由乘法原理,知取兩只三極管共有n=6

5=30種可能的取法。由乘法原理,得kA=43=12,P(A)=12/30=2/5;kE=2

1=2,P(E)=2/30=1/15;由C是E的對立事件,得P(C)=1-P(E)=14/15;由B=A∪E,且A與E互斥,得

P(B)=P(A)+P(E)=7/15;由D是B的對立事件,得P(D)=1-P(B)=8/15。解:例4:n個球隨機地放入N(N≥n)個盒子中,若盒子的容量無限制。求“每個盒子中至多有一球”的概率。

因每個球都可以放入N個盒子中的任何一個,故每個球有N種放法。由乘法原理,將n個球放入N個盒子中共有Nn種不同的放法。每個盒子中至多有一個球的放法(由乘法原理得):N(N-1)…(N-n+1)=ANn種。故,

P(A)=ANn/Nn。

設每個人在一年(按365天計)內每天出生的可能性都相同,現隨機地選取n(n≤365)個人,則他們生日各不相同的概率為

A365n/365n。於是,n個人中至少有兩人生日相同的概率為1-A365n/365n。(請打開P14表1.3.1)

許多問題和上例有相同的數學模型。例如(生日問題):

某人群有n個人,他們中至少有兩人生日相同的概率有多大?

把n個物品分成k組,使第一組有n1個,第二組有n2個,…,第k組有nk個,且n=n1+n2+…+nk

。則:不同的分組方法有公式種。解:例5:

某公司生產的15件品中,有12件是正品,3件是次品。現將它們隨機地分裝在3個箱中,每箱裝5件,設:A={每箱中恰有一件次品},B={三件次品都在同一箱中}。求:P(A)和P(B)。15件產品裝入3個箱中,每箱裝5件,共有種等可能的裝法。故,基本事件總數有個。續:

把三件次品分別裝入三個箱中,共有3!種裝法。這樣的每一種裝法取定以後,把其餘12件正品再平均裝入3個箱中,每箱裝4件,有個基本事件。再由乘法原理,可知裝箱總方法數有即A包含從而,續:

把三件次品裝入同一箱中,共有3種裝法.這樣的每一種裝法取定以後,再把其餘12件正品裝入3個箱中(一箱再裝2件,另兩箱各裝5件)又有個基本事件。故,由乘法原理,知裝箱方法共有即B包含解:例6:設N件產品中有K件是次品,N-K件是正品,K<N。現從N件中每次任意抽取1件產品,在檢查過它是正品或是次品後再放回,這樣共抽取了n次。求:事件A={所取的n件產品中恰有k件次品}的概率,k=0,1,2,…,n。

假定N件產品是有編號的,從中任意取出一件,每次都有N種取法.由乘法原理,n次共有Nn種取法,故,基本事件總數為Nn。

當所取的n件產品中恰有k件次品時,由於取到這k件次品的次序的不同,因此從次序考慮共有Cnk種情況。續:

這Cnk種情況確定以後,從K件次品中取出k件,共有Kk種取法。從N-K件正品中取n-k件,共有(N-K)n-k種取法。由乘法原理,共有CnkKk(N-K)n-k種取法,∴A中基本事件個數為CnkKk(N-K)n-k。小結

本節首先給出古典概型的定義;然後討論了古典概型中事件概率求法:若事件A包含k個基本事件,有

P(A)=k(1/n)=k/n;最後,給出了幾個古典概型中求隨機事件概率的應用實例。

基本概念

一、隨機試驗與事件I.隨機試驗

1.隨機試驗

把對某種隨機現象的一次觀察、觀測或測量等稱為一個試驗。如果這個試驗在相同的條件下可以重複進行,且每次試驗的結果事前不可預知,則稱此試驗為隨機試驗,也簡稱為試驗,記為E。注:以後所提到的試驗均指隨機試驗。隨機試驗舉例:

E1:擲一顆骰子,觀察所擲的點數是幾;

E2:觀察某城市某個月內交通事故發生的次數;

E3:對某只燈泡做試驗,觀察其使用壽命;

E4:對某只燈泡做試驗,觀察其使用壽命是否小於200小時。

對於隨機試驗,僅管在每次試驗之前不能預知其試驗結果,但試驗的所有可能結果所組成的集合卻是已知的。

若以Ωi表示試驗Ei的樣本空間,i=1,2,3,4,則

◆E1:擲一顆骰子,觀察所擲的點數是幾,

Ω1={1,2,3,4,5,6};

稱試驗所有可能結果所組成的集合為樣本空間,記為Ω。2.樣本空間

樣本空間的元素,即隨機試驗的單個結果稱為樣本點。E2:觀察某城市某個月內交通事故發生次數,

Ω2={0,1,2,…};E3:對某只燈泡實驗,觀察其使用壽命,

Ω3={t,t≥0};E4:對某只燈泡做實驗,觀察其使用壽命是否小於200小時,

Ω4={壽命小於200小時,壽命不小於200小時}。II.隨機事件

把樣本空間的任意一個子集稱為一個隨機事件,簡稱事件。常用大寫字母A,B,C,…表示。

特別地,如果事件只含一個試驗結果(即樣本空間的一個元素),則稱該事件為基本事件。

寫出試驗E1的樣本空間

Ω1={1,2,3,4,5,6}的下述子集合表示什麼事件?指出哪些是基本事件。

A1={1},A2={2},…,A6={6}

━━分別表示擲的結果為“一點”至“六點”,都是基本事件;

B={2,4,6}

━━

表示擲的結果為“偶數點”,非基本事件;

C={1,3,5,}

━━

表示“擲的結果為奇數點”,非基本事件;

D={4,5,6}

━━

表示“擲的結果為四點或四點以上”,非基本事件。例1:

當結果A時,稱事件A發生。

注意:

(1).由於樣本空間Ω包含了所有的樣本點,且是

Ω自身的一個子集。故,在每次試驗中Ω總是發生。因此,稱Ω必然事件。

(2).空集

不包含任何樣本點,但它也是樣本空間Ω的一個子集,由於它在每次試驗中肯定不發生,所以稱

為不可能事件。注意:

只要做試驗,就會產生一個結果,即樣本空間Ω中就會有一個點(樣本點

)出現。二、事件的關係與運算I.集合與事件回憶:做試驗E時,若A,則稱事件A發生。集合A包含於集合B:若對A,總有B,則稱集合A包含於集合B,記成AB。事件A包含於事件B:若事件A發生必有事件B發生,則稱事件A包含於事件B,記成AB。集合A與B的並或和:若

C,當且僅當A或B,則稱集合C為集合A與B的並或和,記成A∪B或A+B。事件A與B的並或和:若事件C發生,當且僅當事件A或C發生,則稱事件C為事件A與B的並或和,記成A∪B或A+B。若A

B,且B

A,則稱事件A與B相等,記成A=B。無窮多個事件A1,A2,…的和n個事件A1,A2,…,An的和C發生就是A1,A2,…,An中至少一個事件發生。C發生就是A1,A2…中至少一個發生。集合A與集合B的交或積:若

C,當且僅當A且B,則稱集合C為集合A與B的交或積,記成A∩B或AB。事件A與B的積或交:若事件C發生,當且僅當事件A與B同時發生,則稱事件C為事件A與B的積或交,記成A∩B或AB。特別地,當AB=Ø時,稱A與B為互斥事件(或互不相容事件),簡稱A與B互斥。也就是說事件A與B不能同時發生。例1(續)

A1={1},A2={2},於是A1A2=Ø。故A1與B2互斥;

B={2,4,6},C={1,3,5},於是BC=Ø,故B與C也互斥。無窮多個事件A1,A2,…的積n個事件A1,A2,…,An的積C發生就是A1,A2,…,An都發生。C發生就是A1,A2,…,都發生。.集合A與集合B的差:若

C當且僅當A且B

,則稱集合C為集合A與B的差,記成A-B。事件A與B的差:若事件C發生當且僅當事件A發生且事件B不發生,則稱事件C為事件A與B的差,記成A-B。特別地,稱Ω-A為A的對立事件(或A的逆事件、補事件)等,記成A。例1(續)A1={1},B={2,4,6},於是A就是A不發生。交換律:A∪B=B∪AAB=BA結合律:A∪(B∪C)=(A∪B)∪CA(BC)=(AB)C分配律:A(B∪C)=AB∪ACA∪(BC)=(A∪B)(A∪C)對偶律:II.事件的運算法則

(與集合運算法則相同)還有常用不是A,B中至少有一個發生A,B都不發生對於多個隨機事件,上述運算規則也成立A(A1∪A2∪…∪An)=(AA1)∪(AA2)∪…∪(AAn)

基本概念

假設檢驗參數假設檢驗非參數假設檢驗這類問題稱作假設檢驗問題.總體分佈已知,檢驗關於未知參數的某個假設總體分佈未知時的假設檢驗問題

在本講中,我們將討論不同於參數估計的另一類重要的統計推斷問題.這就是根據樣本的資訊檢驗關於總體的某個假設是否正確.讓我們先看一個例子.這一講我們討論對參數的假設檢驗.

某工廠生產10歐姆的電阻.根據以往生產的電阻實際情況,可以認為其電阻值X~N(,2),標準差σ=0.1.現在隨機抽取10個電阻,測得它們的電阻值為:9.9,10.1,10.2,9.7,9.9,9.9,10,10.5,10.1,10.2.

試問:從這些樣本,我們能否認為該廠生產的電阻的平均值

為10歐姆?例1(一)一個例子

確定總體:記X為該廠生產的電阻的測量值.根據假設,X~

N(,2),這裏

=0.1.

明確任務:

通過樣本推斷X的均值μ是否等於10歐姆.

Hypothesis:上面的任務就是要通過樣本去檢驗“X的均值μ=10”這樣一個假設是否成立.(在數理統計中把“X的均值μ=10”這樣一個待檢驗的假設記作“H0:μ=10”稱為“原假設”或“零假設”問題怎麼建立:

原假設的對立面是“X的均值μ≠10”記作“H1:μ≠10”稱為“對立假設”或“備擇假設”.把它們合寫在一起就是:

H0:μ=10

H1:μ≠10解決問題的思路分析:

∵樣本均值是μ的一個良好估計.∴如果μ=10,即原假設成立時,那麼:

應該比較小.反之,如果它過於大,那麼想必是原假設不成立.

的大小可以用來檢驗原假設是否成立.這裏的問題是,我們如何確定常數c呢

合理的思路是找出一個界限c,

細緻的分析:根據定理6.4.1,

∵n=10

=0.1時,我們就接受原假設H0,當而當時,我們就拒絕原假設H0.

於是,當原假設H0:μ=10成立時,有:

為確定常數c,現在我們考慮一個相當小的正數(理由下麵講).例如=0.05.

於是,當原假設H0:μ=10成立時,有:我們就拒絕原假設H0:μ=10.我們就接受原假設H0:μ=10.

現在我們就得到檢驗準則如下:

用以上檢驗準則處理我們的問題.∴接受原假設H0:μ=10.

我們的原假設是H0:μ=10由上面分析,當H0成立時,有:

相當小.這就是說:如果H0這個假設是正確的話,檢驗統計量落入拒絕域就是一個發生的概率很小的事件.

過去我們提到過,通常認為:小概率事件在一次試驗中基本上是不會發生的.(我們把它稱做實際推斷原理.)(II)道理

那麼如果小概率事件發生了,即:

我們就拒絕,這時我們說:“H0不成立.”

下麵我們指出這很符合人們的邏輯,實際上這種思維也叫:

帶概率性質的反證法

通常的反證法設定一個假設以後,如果出現的事實與之矛盾,(即如果這個假設是正確的話,出現一個概率等於0的事件)則絕對地否定假設.

帶概率性質的反證法的邏輯是:

即如果假設H0是正確的話,出現一個概率很小的事件,則以很大的把握否定假設H0.

∵檢驗一個H0時是根據檢驗統計量來判決是否接受H0的,而檢驗統計量是隨機的,這就有可能判決錯誤.這種錯誤有以下兩類:H0事實上是正確的,但被我們拒絕了,稱犯了“棄真”的(或稱第一類)錯誤.H0事實上是不正確的,但被我們接受了,稱犯了“采偽”的(或稱第二類)錯誤.(III)兩類錯誤與顯著性水準

假設檢驗的兩類錯誤H0為真實際情況決定拒絕H0接受H0H0不真第一類錯誤正確正確第二類錯誤P{拒絕H0|H0為真}=,P{接受H0|H0不真}=.

犯兩類錯誤的概率:顯著性水準為犯第一類錯誤的概率.

由於檢驗統計量的隨機性,所以無論犯以上哪類錯誤都是隨機事件,從而都有一定的概率.當樣本容量n固定,犯兩類錯誤的概率就不能同時被控制.

在統計學中,通常控制犯第一類錯誤的概率.一般事先選定一個數,(0<<1),要求犯第一類錯誤的概率≤.

為假設檢驗的顯著性水準,簡稱水準.

由於犯第二類錯誤的概率的研究與計算超出了本書的範圍,因此不作討論.

說明例1(續)

分析該例的顯著性水準我們就拒絕原假設H0:μ=10.

現在讓我們分析一下:

取上述c後,如果假設H0是正確的,卻被我們拒絕了,即犯第一類錯誤的概率是多少.

可見此例我們用的檢驗方法犯第一類錯誤的概率等於.∴顯著性水準等於.∵當原假設H0:μ=10成立時,有:分析:

一般我們把顯著性水準限定在一個比較小的值,通常

=0.05或0.01.

這樣,如果H0是正確的

這就是說:如果H0是正確的話,檢驗統計量落入拒絕域就是一個小概率事件.

說明

如果根據舊經驗我們很相信H0是對的.要使人樂意放棄這個信念就要有十分過硬的依據,此時

應取得很小.

如果根據舊經驗我們很相信H0是對的.要使人樂意放棄這個信念就要有十分過硬的依據,此時

應取得很小.

極大似然估計極大似然法

是在總體類型已知條件下使用的一種參數估計方法.

它首先是由德國數學家高斯在1821年提出的,GaussFisher然而,這個方法常歸功於英國統計學家費歇.

費歇在1922年重新發現了這一方法,並首先研究了這種方法的一些性質.

極大似然法的基本思想

先看一個簡單例子:一只野兔從前方竄過.是誰打中的呢?某位同學與一位獵人一起外出打獵.如果要你推測,你會如何想呢?只聽一聲槍響,野兔應聲倒下.

你就會想,只發一槍便打中,獵人命中的概率一般大於這位同學命中的概率.看來這一槍是獵人射中的.

這個例子所作的推斷已經體現了極大似然法的基本思想.極大似然估計原理:

當給定樣本X1,X2,…Xn時,定義似然函數為:

設X1,X2,…Xn是取自總體X的一個樣本,樣本的聯合密度(連續型)或聯合概率函數(離散型)為f(X1,X2,…Xn;).f(X1,X2,…Xn;)

似然函數:

極大似然估計法就是用使達到最大值的去估計.稱為的極大似然估計(MLE).

看作參數的函數,它可作為將以多大可能產生樣本值X1,X2,…Xn的一種度量.f(X1,X2,…Xn;)(4)在最大值點的運算式中,用樣本值代入就得參數的極大似然估計值.求極大似然估計(MLE)的一般步驟是:(1)由總體分佈導出樣本的聯合概率函數

(或聯合密度);(2)把樣本聯合概率函數(或聯合密度)中自變量看成已知常數,而把參數看作引數,

得到似然函數L();(3)求似然函數L()的最大值點(常常轉化為求lnL()的最大值點),即

的MLE;兩點說明:1、求似然函數L()的最大值點,可以應用微積分中的技巧。由於ln(x)是x的增函數,lnL()與L()在的同一值處達到它的最大值,假定是一實數,且lnL()是的一個可微函數。通過求解所謂“似然方程”:可以得到的MLE.

若是向量,上述方程必須用似然方程組代替.2、用上述求導方法求參數的MLE有時行不通,這時要用極大似然原則來求.兩點說明:

下麵舉例說明如何求極大似然估計L(p)=f(X1,X2,…Xn;p)

例1設X1,X2,…Xn是取自總體X~B(1,p)的一個樣本,求參數p的極大似然估計.解:似然函數為:對數似然函數為:對p求導並令其為0,=0得即為p

的MLE.

正態總體

N(,2)兩個未知參數

2的極大似然估計.(注:我們把

2看作一個參數)解:例2

似然方程組為根據第一式,就得到:代入第二式,就得到:

由上,似然方程組的解唯一.下麵驗證它是極大值點.是L(,2)的最大值點.∴和

2的極大似然估計量是

總體泊松分佈X∼P(

).

求:參數

的極大似然估計.解:例3似然方程為

是logL(

)的最大值點.∴的極大似然估計量是

總體均勻分佈X∼U(a,b).

求:兩個參數a,b的極大似然估計

解:例4

我們由上看到,L(a,b)作為a和b的二元函數是不連續的.所以我們不能用似然方程組來求極大似然估計,而必須從極大似然估計的定義出發,求L(a,b)的最大值.

為使L(a,b)達到最大,b-a應該儘量地小.但b又不能小於max{x1,x2,

,xn}.否則,L(a,b)=0.類似地a不能大過min{x1,x2,

,xn}.

因此,a和b的極大似然估計為解:似然函數為對數似然函數為例5設X1,X2,…Xn是取自總體X的一個樣本求的極大似然估計.其中

>0,求導並令其為0=0從中解得即為的MLE.對數似然函數為解:似然函數為

例6

設X1,X2,…Xn是取自總體X的一個樣本其中>0,求的極大似然估計.i=1,2,…,n對數似然函數為解:似然函數為i=1,2,…,n=0(2)由(1)得=0(1)對分別求偏導並令其為0,對數似然函數為用求導方法無法最終確定用極大似然原則來求.是對故使達到最大的即的MLE,於是

取其他值時,即為的MLE.且是的增函數由於

矩、協方差矩陣簡介協方差Cov(X,Y)是X和Y的二階混合中心矩.稱它為X和Y的k+L階混合(原點)矩.若存在,稱它為X和Y的k+L階混合中心矩.設X和Y是隨機變數,若k,L=1,2,…存在,可見,協方差矩陣的定義

將二維隨機變數(X1,X2)的四個二階中心矩排成矩陣的形式:稱此矩陣為(X1,X2)的協方差矩陣.這是一個對稱矩陣類似定義n維隨機變數(X1,X2,…,Xn)的協方差矩陣.下麵給出n元正態分佈的概率密度的定義.為(X1,X2,…,Xn)的協方差矩陣稱矩陣都存在,i,j=1,2,…,n若f(x1,x2,…,xn)則稱X服從n元正態分佈.其中C是(X1,X2,…,Xn)的協方差矩陣.|C|是它的行列式,表示C的逆矩陣,X和是n維列向量,表示X的轉置.

設=(X1,X2,…,Xn)是一個n維隨機向量,若它的概率密度為n元正態分佈的幾條重要性質1.X=(X1,X2,…,Xn)服從n元正態分佈a1X1+a2

X2+…+anXn均服從正態分佈.對一切不全為0的實數a1,a2,…,an,n元正態分佈的幾條重要性質2.若

X=(X1,X2,…,Xn)服從n元正態分佈,

Y1,Y2,…,Yk是Xj(j=1,2,…,n)的線性函數,則(Y1,Y2,…,Yk)也服從多元正態分佈.這一性質稱為正態變數的線性變換不變性.n元正態分佈的幾條重要性質

3.設(X1,X2,…,Xn)服從n元正態分佈,則“X1,X2,…,Xn相互獨立”等價於“X1,X2,…,Xn兩兩不相關”例2

設隨機變數X和Y相互獨立且X~N(1,2),Y~N(0,1).試求Z=2X-Y+3的概率密度.

故X和Y的聯合分佈為正態分佈,X和Y的任意線性組合是正態分佈.解:X~N(1,2),Y~N(0,1),且X與Y獨立,Var(Z)=4Var(X)+Var(Y)=8+1=9E(Z)=2E(X)-E(Y)+3=2+3=5即Z~N(E(Z),Var(Z))Z~N(5,32)故Z的概率密度是Z~N(5,32)這一講我們介紹了協方差和相關係數相關係數是刻劃兩個變數間線性相關程度的一個重要的數字特徵.注意獨立與不相關並不是等價的.當(X,Y)服從二維正態分佈時,有X與Y獨立X與Y不相關

設X是一個離散型隨機變數,它可能取的值是x1,x2,….

為了描述隨機變數X

,我們不僅需要知道隨機變數X的取值,而且還應知道X取每個值的概率.

離散型隨機變數

這樣,我們就掌握了X這個隨機變數取值的概率規律.從中任取3個球取到的白球數X是一個隨機變數X可能取的值是0,1,2取每個值的概率為例1且其中(k=1,2,…)滿足:

k=1,2,…(1)(2)

定義1:設xk(k=1,2,…)是離散型隨機變數X所取的一切可能值,稱

k=1,2,……

為離散型隨機變數X的概率分佈或分佈律,有的書上也稱概率函數.用這兩條性質判斷一個函數是否是概率分佈一、離散型隨機變數概率分佈的定義解:依據概率分佈的性質:P(X=k)≥0,

a≥0從中解得欲使上述函數為概率分佈應有這裏用到了常見的冪級數展開式例2.設隨機變數X的概率分佈為:k=0,1,2,…,試確定常數a.二、表示方法(1)列表法:(2)公式法X~再看例1任取3個球X為取到的白球數X可能取的值是0,1,2三、舉例例3.

某籃球運動員投中籃圈概率是0.9,求他兩次獨立投籃投中次數X的概率分佈.解:X可取0、1、2為值

P(X=0)=(0.1)(0.1)=0.01

P(X=1)=2(0.9)(0.1)=0.18

P(X=2)=(0.9)(0.9)=0.81

且P(X=0)+P(X=1)+P(X=2)=1常常表示為:這就是X的概率分佈.例4

如上圖所示.電子線路中裝有兩個並聯的繼電器.假設這兩個繼電器是否接通具有隨機性,且彼此獨立.已知每個電器接通的概率為0.8,記X為線路中接通的繼電器的個數.

求:(1)X的分佈律.(2)線路接通的概率.解:

(1).記Ai={第i個繼電器接通},i=1,2.∵兩個繼電器是否接通是相互獨立的,∴A1和A2相互獨立,另外P(A1)=P(A2)=0.8.下麵求X的分佈律.

首先:X可能取0,1,2,三個值.P{X=0}=P{表示兩個繼電器都沒接通}轉下頁P{X=1}=P{恰有一個繼電器接通}P{X=2}=P{兩個繼電器都接通},,∴X的分佈律為2)∵是並聯電路

∴P(線路接通)=P(只要一個繼電器接通)=P{X≥1}=P{X=1}+P{X=2}=0.32+0.64=0.96.(二)常見的離散型隨機變數的概率分佈(I)兩點分佈(

設E是一個只有兩種可能結果的隨機試驗,用Ω={

1,

2}表示其樣本空間.P({

1})=p,P({

2})=1-p來源X(

)=1,=

10,=

2

200件產品中,有196件是正品,4件是次品,今從中隨機地抽取一件,若規定例5X(

)=1,取到合格品0,取到不合格品

則P{X=1}=196/200=0.98,P{X=0}=4/200=0.02

故X服從參數為0.98的兩點分佈.

即X∼B(1,0.98).例6

設生男孩的概率為p,生女孩的概率為q=1-p,令X表示隨機抽查出生的4個嬰兒中“男孩”的個數.貝努裏概型和二項分佈(II)我們來求X的概率分佈.X的概率分佈是:男女X表示隨機抽查的4個嬰兒中男孩的個數,生男孩的概率為p.X=0X=1X=2X=3X=4X可取值0,1,2,3,4.例7

將一枚均勻骰子拋擲3次,令X表示3次中出現“4”點的次數X的概率分佈是:不難求得,

擲骰子:“擲出4點”,“未擲出4點”

一般地,設在一次試驗中我們只考慮兩個互逆的結果:A或,或者形象地把兩個互逆結果叫做“成功”和“失敗”.

新生兒:“是男孩”,“是女孩”

抽驗產品:“是正品”,“是次品”再設我們重複地進行n次獨立試驗(“重複”是指這次試驗中各次試驗條件相同)

這樣的n次獨立重複試驗稱作n重貝努裏試驗,簡稱貝努裏試驗或貝努裏概型.

每次試驗成功的概率都是p,失敗的概率都是q=1-p.

用X表示n重貝努裏試驗中事件A(成

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论