抽样分布与估计式ppt课件_第1页
抽样分布与估计式ppt课件_第2页
抽样分布与估计式ppt课件_第3页
抽样分布与估计式ppt课件_第4页
抽样分布与估计式ppt课件_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第7章 抽樣分佈與估計式 .前言抽樣的目的並不意味著我們關心的焦點是在樣本的資料上。樣本背後的母體才是關心的重點。以樣本的統計量statistic,如樣本平均數、樣本變異數等,來推論母體的參數parameter,如母體平均數、母體變異數等。要達到此目的,必須知道樣本的統計量的機率分佈,以及如何在眾多的統計量中,選擇最恰當的,以便估計母體參數。.第一節 抽樣誤差 (1)不針對母體進行普查的主要缘由有:1. 母體太大,客觀條件限制。2. 無法確知母體的範圍。3. 破壞性檢測。4. 從樣本的結果已經可以有效推知母體。.第一節 抽樣誤差 (2)估計誤差抽樣誤差sampling error :任何因為抽

2、樣中的機遇chance所產生的變動。添加樣本數,可以降低抽樣誤差。运用恰當的樣本統計量來估計母體參數,也是降低抽樣誤差的方法之一。適當的抽樣方法,可以降低抽樣誤差。非抽樣誤差nonsampling error :一切不是因為抽樣所產生的誤差。例如樣本沒有代表性,在資料的蒐集、整理、分析時也能够產生誤差。.第二節 抽樣方法 (1)抽樣方法隨機抽樣random sampling:按照隨機的方式,使母群體中的每一個份子都有能够被抽到。非隨機抽樣nonrandom sampling:取決於研讨者主觀的想法或是參照客觀環境的限制,所設計出來的抽樣方法,因此母群體的某些份子完全沒有被抽到的機會。 .第二節

3、 抽樣方法 (2)隨機抽樣1. 簡單隨機抽樣simple random sampling2. 間隔抽樣interval sampling3. 分層抽樣stratified sampling4. 集群抽樣cluster sampling5. 分段抽樣staged sampling非隨機抽樣1. 配額抽樣quota sampling2. 判斷抽樣judgment sampling.第二節 抽樣方法 (3)簡單隨機抽樣先將母體加以編號,然後如抽籤般的抽出200位即可。也可以利用均勻分佈所產生的數值來替代抽籤。假设母群體很大,將母體加以編號恐怕不切實際。有時研讨者並不確知母群體的大小,簡單隨機抽樣並不

4、見得可行。 .第二節 抽樣方法 (4)間隔抽樣每隔幾個就抽取一個。在工商界中,常用此方法進行抽樣,如每隔幾個上門的顧客就訪問一位,每隔幾個產品就抽樣一個。运用間隔抽樣時,必須確保樣本的資料並無規律性變化才可。 .第二節 抽樣方法 (5)分層抽樣先決定有哪幾個重要的層strata,接著就按照母體分佈的比率,隨機抽樣。這樣一來可以保證樣本與母群體的分佈情形非常相近,因此所得到的調查結果比簡單隨機抽樣更能夠推論到母群體。假设選擇一些不相关的層,就會一點效果都沒有。因此在實務上,通常只選取少數幾個最為重要的層而已。 .第二節 抽樣方法 (6)集群抽樣先將母群體分為數個类似的集群,然後隨機抽取數個集群,

5、加以調查。在集群抽樣裡,集群與集群間要非常类似,集群內則差異要大越接近母群體的分佈越好。在分層抽樣裡,層與層之間的差異要大,但層之內要非常类似。 .第二節 抽樣方法 (7)分段抽樣採用多種抽樣的方法。例如先集群抽樣,然後再簡單隨機抽樣。或先集群再分層抽樣。實務上,仍以兩階段和三階段的抽樣最為普遍。 .第二節 抽樣方法 (8)配額抽樣它和分層抽樣的概念非常類似,只不過在分層抽樣裡,研讨者確知母群體中各層的比率,但在配額抽樣裡,事先並不完全知道母群體的分佈,但按照研讨者的學識和判斷,研擬出配額的依據。.第二節 抽樣方法 (9)判斷抽樣它必須仰賴研讨者主觀的判斷來進行抽樣。判斷抽樣又比配額抽樣更為主

6、觀。因為在配額抽樣中,研讨者只是去估計母體的比例而已。但在判斷抽樣裡,研讨者甚至判斷哪些份子較具代表性,以決定能否要對它進行調查。.第三節 抽樣分佈 (1)推論統計學就是利用樣本統計量來估計母體參數的一門學問。統計量的機率分佈稱為抽樣分佈理論sampling distribution theory。根本上我們關心該分佈是何種機率分佈,平均數和變異數各為多少,藉以估計母體參數。.第三節 抽樣分佈 (2)定理7.1令X1, , Xn為獨立隨機變項,其平均數分別為m1, , m n,其變異數分別為 , , 。假设令Y的平均數和變異數分別為 .第三節 抽樣分佈 (3)例子1令X1表示丟公平硬幣出現的點

7、數,X2表示丟公平骰子出現的點數,則3X1 2X2的平均數和變異數分別是多少?作法公平硬幣出現的點數的平均數和變異數分別為0.5以及0.25。丟骰子出現的點數為間斷均勻分佈,平均數和變異數分別為3.5以及2.92。X1和X2互為獨立,得3X1 2X2的平均數為3 0.5 2 3.5 = -5.5,變異數為32 0.25 + 22 2.92 = 13.93。 .第三節 抽樣分佈 (4)例子2X和Y變項互為獨立,X變項的變異數為 ,Y變項的變異數為 ,aX + bY的變異數是多少?作法aX + bY的變異數為a2 + b2 。.第三節 抽樣分佈 (5)推論1X1,Xn的平均數均為m,變異數均為 ,

8、且ai 都等於1/n: 的平均數會等於母體平均數m,變異數會等於母體變異數除以n,即s2/n。即: .第三節 抽樣分佈 (6)定理7.2令X1, , Xn為來自常態分佈的獨立隨機變項,其平均數分別為m1, , mn,變異數分別為 , , 。假设令則Y為常態分佈,平均數為和變異數分別為.第三節 抽樣分佈 (7)推論 1令X1, , Xn為來自常態分佈N(m, s2)的獨立隨機變項,則樣本平均數 推論2令X1, , Xn為來自常態分佈N(m, s2)的獨立隨機變項,則.第三節 抽樣分佈 (8)推論3令X1, , Xn為來自標準常態分佈N(0, 1)的獨立隨機變項,則.第三節 抽樣分佈 (9)例子3

9、假設智商的分佈為N(100, 225)。隨機抽樣25人調查其智商,並計算智商的樣本平均數。假设重複抽樣無數次,每次抽樣25人,並計算樣本平均數,則樣本平均數會成何分佈?其平均數和變異數各為多少? 作法令這25人的智商分別為X1, , X25。知它們均服從常態分佈N(100, 225),根據定理7.2得知,樣本平均數的抽樣分佈為N(100, 225/25)。 .第三節 抽樣分佈 (10)定理7.3令Z1, , Zn為標準常態分佈的獨立隨機變項,則定理7.4令X1, , Xn為來自常態分佈N(m, s2)的獨立隨機變項,且其樣本平均數為 ,樣本變異數為S2 ,則 (1) 和S2相互獨立,(2).第

10、三節 抽樣分佈 (11)例子4假設智商的分佈為常態分佈,平均數和變異數分別為100和225。假设隨機抽樣25人調查其智商,並計算智商的樣本變異數S2。假设重複抽樣無數次,每次抽樣25人,並計算樣本變異數,則樣本變異數S2會成何分佈?其平均數和變異數各為多少? .第三節 抽樣分佈 (12)作法令這25人的智商分別為X1, , X25,均服從常態分佈N(100, 225),因此由於卡方分佈的平均數是其自在度,變異數為2倍的自在度,因此 的平均數是24,變異數是48。所以S2的平均數是225,變異數是4218.7 (=48 / (24/225)2)。 .第三節 抽樣分佈 (13)定理7.5 中央極限

11、定理令X1, , Xn為來自某平均數為m,變異數為s2的母體的獨立隨機變項,當n趨近無限大時,其樣本平均數會趨近於N(m, s2/n)。在實用上,只需樣本數n夠大如n 25,樣本平均數就會很接近常態分佈。其實即使n小於25,只需母體分佈與常態分佈相去不遠,如類似單峰和左右對稱形狀,樣本平均數會近似常態分佈。.第三節 抽樣分佈 (14)例子5知丟骰子出現點數為間斷均勻分佈,平均數和變異數分別為3.5和2.92。現丟骰子25次,計算骰子點數的平均數。假设這樣無數次,每次均丟骰子25次,並計算骰子點數的平均數,則骰子點數的平均數會成何分佈?其平均數和變異數各為多少?作法根據中央極限定理,樣本平均數接

12、近常態分佈,其平均數為母體平均數3.5,變異數為0.12 (=2.92/25)。 .第三節 抽樣分佈 (15) 定理7.6 假设由平均數為m1和m2,變異數為 和 的常態分佈母體抽隨機抽出樣本數為n1和n2的獨立樣本,則假设母體並非常態分佈,只需樣本數n1和n2夠大如均大於25,就可放心运用常態分佈了。 .第三節 抽樣分佈 (16)例子6丟硬幣25次,計算出現點數的平均數正面一點,反正零點,也丟骰子25次,計算出現點數的平均數。然後將硬幣的平均數減骰子的平均數,得到兩平均數差異。假设重複這樣無數多次,這些無數多次的平均數差異成何分佈?平均數和變異數各式多少?.第三節 抽樣分佈 (17)作法丟硬

13、幣出現的點數的平均數和變異數分別為0.5以及0.25。丟骰子出現的點數的平均數和變異數分別為3.5以及2.92。令 為硬幣的平均數, 為骰子的平均數,則 的平均數為0.53.5 = -3,變異數為 根據中央極限定理, 近似常態分佈。 .第四節 估計式 (1)推論統計包括兩大部份:估計和假設檢定。估計分為點估計和區間估計。母體參數的點估計:利用統計量的某一個值加以估計。例如用樣本平均數這個統計量的大寫表示變項,小寫表示特定的數值估計母體平均數m。統計量又稱為估計式estimator,以阐明其估計母體參數的功用。同一個參數可以有好多個估計式。.第四節 估計式 (2)不偏性 令q為所欲估計的參數,

14、唸做theta hat為其估計式。假设 E ( ) = q,那麼 就具有不偏性。或謂 是q的不偏估計式unbiased estimator。 樣本平均數的期望值為母體平均數,因此樣本平均數是母體平均數的不偏估計式。 .第四節 估計式 (3)例子7令X1, X2, X3, X4為隨機從母體抽出的4個值,樣本平均數是母體平均數m的不偏估計式,已如上述。但X1、 、 、 能否也是母體平均數的不偏估計式? .第四節 估計式 (3)作法E(X1) =m.第四節 估計式 (4)例子8樣本變異數S2是母體變異數s2的不偏估計式嗎?作法.第四節 估計式 (5)有效性 假設q是所欲估計的參數, 是眾多估計式中的

15、一種。假设E( -q )2在一切的估計式中最小, 就是最有效的估計式。在一切的估計式中,具有最小的均方誤,就是最有效的估計式。假设只限於從不偏估計式中挑選最有效的,那麼該估計式就是不偏的最小變異估計式。 .第四節 估計式 (6)例子9在例子7中, 、X1、Y1、Y2都是母體平均數的不偏估計式。何者較為有效?作法 .第四節 估計式 (7)一致性假设樣本數n越大,估計式 與母體參數q 的誤差量越小。假设樣本數趨近於無限大, 與q 的差量小於微量e的機率趨近1。即該估計式 就具有一致性consistency 是母體平均數的不偏估計式,且變異數為s2/n。假设n趨近於無限大,則s2/n趨近於0 ,因此

16、 具有一致性。 .第四節 估計式 (8)例子10例子7中的X1、Y1、Y2能否具有一致性?作法即使樣本數n再大,X1、Y1、Y2的變異數都不會改變,當然也不會趨近於0。換句話說,樣本數添加,並無助於X1、Y1、Y2趨近於母體平均數,因此它們不具有一致性。 .第四節 估計式 (9)充分性令X1,Xn為隨機變項,其聯合機率函數為f(x1, , xn; q)。統計量 是q的充分統計式或具有充分性,假设且為假设f(x1, , xn; q) = g( ; q) h(x1, , xn)其中h(x1, , xn) 與q 無關。此時, 包含了一切從樣本資料來推估q的訊息,再也沒有其他剩餘的訊息了。固定充分統計量後,X1,Xn的條件機率就與q無關。 .第四節 估計式 (10)在二項式分佈中,樣本中胜利次數就是胜利機率p的充分統計量。其他的訊息例如這幾次試驗中,哪幾次是胜利,哪幾次是失敗。是無法

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论