抽样与抽样分配_第1页
抽样与抽样分配_第2页
抽样与抽样分配_第3页
抽样与抽样分配_第4页
抽样与抽样分配_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七章 抽樣與抽樣分配所謂的抽抽樣,是是指從一一個母體體中抽出出一組樣樣本,利利用此樣樣本來推推估母體特性性的一種種方法或或程序,而我們們所抽出出的樣本本是否能能夠具體體的代表整個個母體,與我們們所使用用的抽樣樣方法有有關。一一般而言言,抽樣樣的方法可以以分為兩兩種,一一種是隨隨機抽樣樣,另一一種則是是非隨機機抽樣。由隨機抽樣樣所抽出出的樣本本都具有有隨機性性,亦即即每組樣樣本被抽抽出的機機率皆相同,而且所所抽出的的樣本是是互相獨獨立的;至於非非隨機抽抽樣則沒沒有這個特性性。在此此我們僅僅介紹隨隨機抽樣樣的部分分。隨機抽樣樣所抽出出的樣本本,稱之之為隨機機樣本。常見的的隨機抽抽樣方法法有簡單隨

2、機機抽樣法法(SimpleRandom Sampling)、分層隨機機抽樣法法(Stratified RandomSampling)、部落抽樣樣法(Cluster Sampling)以及系統抽樣樣法(Systematic Sampling)。7.1常見的抽抽樣方法法在這一節節中我們們所討論論的是隨隨機性的的抽樣法法,常見見的有以以下四種種:簡單隨機機抽樣、分層隨隨機抽樣樣、部落落抽樣以以及系統統抽樣,以下便便將這四種方方法加以以說明。7.1.1簡單隨機機抽樣法法設從含有有N個元素的的母體中中,隨機機抽取個個為一組組樣本,而每一一個樣本本被抽出的的機會均均相同,此種抽抽樣的方方法,稱稱之為簡簡單

3、隨機機抽樣法法;而按此種種方法所所抽出的的樣本,則稱之之為簡單單隨機抽抽樣樣本本。在採採用此種抽樣樣方法時時,依其其抽取的的樣本放放回或不不放回,又可分分為抽樣樣放回(samplingwith replacement)與抽樣不不放回(samplingwithoutreplacement)兩種。這這兩者在在抽樣的的時候,樣本出出現的機機率並不不相同。當我們採採取抽樣樣放回的的方式時時,每組組樣本出出現的機機率為,而當當我們採用抽樣樣不放回回的方式式時,其其每組樣樣本出現現的機率率則為,然而而當母體相當大大的時候候,兩者者均可視視為獨立立的狀況況,也就就是說不不管樣本本放回或是不不放回,對於下下一

4、次抽抽取並不不會造成成影響。7.1.2分層隨機機抽樣法法分層隨機機抽樣法法就是指指將整個個母體分分成若干干個不重重疊之部部份母體體,此部份母母體稱之之為層,每個層層與層之之間互相相排斥。例如將將班上個個同學的身高高依160公分分以下、160170公分分、170公分分以上三三種層次次分為三個不不同的部部份母體體,而每每個母體體的個數數分別為為、與,然後在在每一層中各各別抽取取一簡單單隨機樣樣本,其其樣本數數分別為為、與。若將各各層的樣本數數加總起起來,便便為總樣樣本。由由上述的的例子,我們不不難看出出層內的變異異較小,而層與與層之間間的變異異則較大大。然而而當我們們在採用用分層隨機抽抽樣法時時,

5、要如如何來決決定每一一層內到到底要抽抽出幾個個樣本呢呢?一般而言言,最常常用的方方法是比例配配置法,以下下便加以以說明。【例7.1】某個研究究機構想想要研究究大學教教育的問問題,於於是想要要在台灣灣地區以以隨機抽樣法法選取1200名大學學生作為為樣本。倘若已已知全省省大學各各年級之之總人數及及其學業業平均成成績的資資料如下下表所示示:試問倘若若以分層層比例抽抽樣法來來選取樣樣本,則則各年級級應該抽抽取多少少名學生?解:首先我們們先求出出台灣地地區大學學生之總總個數NN=25,000+21,000+18,000+16,000=80,000令n1,n2,n3與n4分別表示示依分層層比例抽抽樣法所所

6、應該抽抽取之大大一、大大二、大大三與大大四的學學生人數數。則根根據(7.1)式我們們可以求求出因此,倘倘若以分分層比例例抽樣法法來選取取樣本時時,則應應該選取取大一的的學生375位,大二的的學生315位位,大三三的學生生270位以及及大四的的學生240位。7.1.3部落抽樣樣法部落抽樣樣法是將將整個母母體依其其標準分分成若干干個部落落(部落落內的每每個元素彼此間間的差異異較大,而部落落與部落落間的差差異較小小),然然後任取取數個部落為隨隨機樣本本,而被被抽中之之部落內內的每個個元素皆皆為調查查的對象象。例如人口口調查,以家庭庭為抽樣樣單位,被選中中的家庭庭其全部部成員皆皆必須接受調調查。採採用

7、部落落抽樣法法的誤差差通常較較大,然然而因為為可以就就近集中調查查,可因因此而省省下不少少的時間間與調查查費用,故此種種抽樣法法還是有其可可用之處處。部落落抽樣法法與分層層抽樣法法看似相相同,然然而實際際上,兩者卻有有很大的的不同之之處,茲茲將這兩兩種抽樣樣方法的的差異列列表如下下:7.1.4系統抽樣樣法將母體所所有的元元素依次次排列,然後將將其分成成數個間間隔,每每隔若干干元素抽取一一個,此此種抽樣樣方法稱稱之為系系統抽樣樣法。此此種抽樣樣方法的的優點便是在在使用時時非常方方便,只只需隨機機選取出出第一個個元素之之後,每每隔若干個單單位之後後再抽取取一個元元素,以以此類推推,其餘餘的樣本本元

8、素便便能夠決定出出來,一一直到抽抽取了所所需的樣樣本個數數為止。然而採採用此種種抽樣方法時時,其所所使用的的資料應應該避免免有週期期性的現現象,否否則將會會造成嚴重的的偏差。例如在在探討冷冷氣機平平均每月月的銷售售數量時時,倘若若每隔12個個月抽取取一個元元素,則則所得到到的資料料都是同同一月份份的資料料,將無法提供供充分的的情報,因此在在採用此此方法時時必須加加以注意意。以下下便將此系統統抽樣法法的步驟驟加以說說明:(1)首首先先先將所有有的N個母體元元素依序序排列。(2)依依次將將母體劃劃分為n個相等大大小的區區間,每每一區間間內的元元素個數為(若若k為非整數數,則取取最接近近的整數數來代

9、替替)。 (3)採採用簡簡單隨機機的抽樣樣方法從從第一個個區間的的k個元素中中,抽出出 一個元素,作為起起始點。(4)由由起始始點算起起,每隔隔k個單位抽抽取一個個元素,即為樣樣本元素素,共取n個元素合合成一組組樣本。7.2抽樣分配配統計量乃乃為樣本本內隨機機變數的的實數值值函數,但此實實數值函函數不包包含未知參數數。統計計量本身身亦為一一隨機變變數並以以大寫字字母表示示,如樣樣本平均數,樣樣本變異異數,而而以小寫寫字母表表示統計計量的計計算值或或觀察值,如樣樣本平均均數,樣樣本變異異數。舉舉個例子子來說,假若我我們從一一母體中隨隨機抽出出一組樣樣本,則像像等皆為樣樣本內隨隨機變數數的實數數值

10、函數數,但這這些實數數值函數數不包含含未知參數,這些皆皆可稱之之為統計計量。但隨機變變數並並不是是統計量量,因包包含未知知參數。當當我們在在作資料料分析時,主要要的目的的便是利利用統計計量來推推估母體體的某些些數值特特徵,這這些母體的數數值特徵徵稱為母母體參數數。一般般在統計計學上較較常使用用到的統統計量包含有有樣本平平均數、樣本變變異數、樣本比比例等等。為了了要充分分地利用樣本統統計量來來對母體體的參數數作估計計,我們們必須對對每一種種可能的的樣本作探討討。倘若若我們將將所有可可能的樣樣本組合合都考慮慮進去,那麼統統計量的機率率分配便便稱為抽抽樣分配配。7.2.1樣本平均均數的抽抽樣分配配倘

11、若我們們從一個個平均數數為,標準差差為的的母體中中,隨機機抽出一一組樣本,那麼麼樣本平平均數則則為為樣本平均均數的抽抽樣分配配之期望望值與變變異數如如下:期望值變異數【例7.2】設一個母母體,其其元素包包含1、2、3、4、5共N=5個數值,若從此此一母體體中抽出出n=2個為一組組隨機樣樣本。倘倘若採用用抽取後後放回的的方式,試求樣樣本平均均數的抽抽樣分配配,平均均數與變變異數。解:首先可以以由題意意求出母母體平均均數與母母體變異異數母體平均均數母體變異異數 若從此一一無限母母體中抽抽取n=2個為一組組隨機樣樣本,則則所有可可能的不不同樣本本組合列列表如下下:編號樣樣本編編號樣樣本編編號樣樣本1

12、(1,1)111(3,1)221(5,1)32(1,2)1.512(3,2)2.522(5,2)3.53(1,3)213(3,3)323(5,3)44(1,4)2.514(3,4)3.524(5,4)4.55(1,5)315(3,5)425(5,5)56(2,1)1.516(4,1)2.57(2,2)217(4,2)38(2,3)2.518(4,3)3.59(2,4)319(4,4)410(2,5)3.520(4,5)4.5由上表可可知,的的可能組組合有25種,而每每一種組組合的機機率皆為為,所以以的抽樣樣分配為為11.522.533.544.55從的抽樣樣分配表表中可以以計算出出的平均均數與

13、與變異數數由以上所所得到的的結果可可知,所所有可能能組合之之樣本平平均數的的期望值值與母體體平均數數相等(),而樣本本平均數數的變異異數等於於母體變變異數除除以n的值()。而對所所有的有有限母體體且抽出出後不放放回,使使用簡單單隨機抽抽樣,則則樣本平平均數的的抽樣分分配之期期望值與與變異數數:期望值變異數(7.4)上述定理理中是在在有限母母體且抽抽出的元元素不放放回母體體中的情情況。而而式子中中則則稱稱為有限限母體校校正因子子(f.p.c),在此將將一些有有限母體體校正因因子的特特性加以以說明:1.由於樣本本數固固定定,所以以當母體體數愈大大時,愈愈接接近於1。2.若樣本數數與母體體數N的比例

14、相相當小時時,則可可以將之之視為無無限母體體;一般而而言,當當時時,便便可將有有限母體體校正因因子省略略。3.當樣本數數接接近於於母體數數N時,有限限母體校校正因子子便趨近近於0,亦即表表示也也將趨趨近於0。一般來說說,當我我們在考考慮樣本本平均數數之之抽抽樣分配配的型態態時,樣樣本大小以及及母體本本身的分分配型態態都會影影響此統統計量之之抽樣分分配。當當這些因素處處於不同同的情況況之下,則的的抽樣樣分配將將會有所所差異,以下便加以探探討在不不同的特特性因素素下,抽抽樣分分配所呈呈現的各各種型態態。自常態分分配母體體中抽樣樣時:自非常態態分配母母體中抽抽樣時:【例7.4】一個常態態分配母母體其

15、平平均數80而變異數數16,若從此此一母體體中隨機機抽取出出樣本大大小為100的隨機樣樣本,其其樣本平平均數用用來估計計母體平平均數。試求之之期望值值與與標標準差為為何?並並且說明明的抽樣樣分配。解:由題意我我們可以以得知,母體平平均數80,母體變變異數16而樣本大大小n=100,且母體體本身為為常態分分配,因因此其樣樣本平均均數的期期望值與與標準差差分別為為而之抽樣樣分配則則是平均均數為80,標準差差為0.4的常態分分配。7.2.2中央極限限定理(Central Limit Theorem;C.L.T)中央極限限定理在在統計學學中相當當地重要要,該定定理是指指從一個個具有平平均數與變異異數的

16、母母體中抽抽取樣本本數為的的一組隨隨機樣本本,其樣樣本平均均數為,則當當n趨近無限限大時時時,的的分配趨趨近於標標準常態態分配。因此,當當我們不不知母體體的分配配型態,或是母母體本身身並非常常態分配配,只要樣本本個數夠夠大,我我們均可可以將其其樣本平平均數之之抽樣分分配視為為常態分配,並且我我們也可可以利用用此定理理來求有有關樣本本平均數數的某些些機率。【例7.6】一個在全全省各地地開了三三千家分分店的大大企業,想要抽抽樣估計計去年每每家分店店發生物物品損壞壞的平均均損失金金額。假假設母體體平均數數元元,而而母體標標準差元元,試求求(a)倘若抽取取n=100家分店當當成隨機機樣本,則樣本本平均

17、數數與母體體平均數數之差在在60元以內的的機率是是多少?(b)倘若將抽抽取的分分店家數數增加到到n=256家,則樣樣本平均均數與母母體平均均數之差差在60元以內的的機率又又是多少少?解:由題意可可以得知知,母體體平均數數與與標準差差分分別為與與,令X代表該企企業的去去年的損損失金額額,則XN(1630, )。(a)由於母體體總數N=3000,而樣本本數n=100,這兩者者的比例例相當小小,因此此在求時時,可以將將有限母母體校正正因子省省略不計計,因此此我們可可以求得得由此可知知,樣本本平均數數的的抽樣分分配為N(1630,),而所欲欲求的機機率為:由以上的的結果,我們有有約87的信心心,斷定定

18、的誤差差不會超超過60元。(b)倘若將樣樣本數增增加到n=256時,其依依然然等於母母體平均均數,而而樣本平平均數的的標標準差則則為此時樣本本平均數數的的抽樣分分配為N(1630,),而所欲欲求的機機率為為:當樣本數數增加到到256家分店時時,其估估計誤差差不超過過60元的機率率也增加加到了98,由此此我們可可以得到到一個結結論:當當樣本數數愈大時時,估計計值將愈愈精確,其樣本本平均數數愈愈趨近於於母體的的平均數數。7.3樣本比例例的抽樣樣分配在7.2節中我我們談到到了樣本本平均數數的抽樣樣分配,這一節節我們將將討論另另一種重要要的樣本本統計量量,樣本本比例(proportion)的抽樣分分配

19、。樣樣本比例在統計計學上應應用也相相當廣泛泛,他可可用來推推估某種種特性(如性別別,不良品,成成功)在在整個母母體中所所佔的比比例,其其定義如如下:上面的(7.5)式中中,Y代表不良良品,成成功或某某種特性性之觀測測值所發發生的次數,例例如成功功的次數數或者男男性的人人數等,而n則表示樣樣本的大大小,此時Y的機率分分配,則則相當於於前面章章節中所所討論到到的二項項分配。假若母體為有有限母體體且抽樣樣放回,母體比比例為p的情況下下,樣本本比例的抽樣分分配之期期望值(7.6)變異數(7.7)在此,我我們將上上面的(7.6)式與(7.7)式證明如如下: 上面所討討論的是是有限母母體且抽抽樣放回回的情

20、況況,倘若若此時的的母體為為有限母母體且抽抽出後不不放回的的抽樣方方式時,抽取n個樣本,則樣本本比例的的抽抽樣分配配之期望望值與變變異數分分別如下下:期望值變異數(7.8)我們曾經經在之前前討論二二項分配配時提過過,當樣樣本數足足夠大的的時候,二項分分配可以以用常態態分配來來近似,而一般般來說,當以以及這兩個條條件皆成成立時,都可將將其視為為大樣本本的情況況,亦即即可用常常態分配配來處理理二項分分配的問問題。而而當我們們在探討討樣本比比例的抽抽樣分分配時時,若樣樣本數夠夠大,則則有限母母體校正正因子(f.p.c)可以省略略,因此此根據中中央極限限定理,在大樣樣本的情情況下,的的抽抽樣分配配近似

21、於於一個平平均數等等於,標準差差為的的常態態分配。亦即當且且時時,的的分配近近似於常常態分配配(7.9)【例7.8】解:7.4與常態分分配有關關之三種抽抽樣分配配常態分配配在統計計學的應應用非常常地廣泛泛,然而而,除了了常態分分配之外外,另外還有有三種相相當重要要的抽樣樣分配:卡方分分配、t分配、F分配。我我們將在在下面的的各小節節中分別別一一加加以介紹紹。7.4.1卡方分配配上面的(7.10)式式表示卡卡方分配配的機率率密度函函數。卡卡方分配配是由“標準常態”平平方和所所組成的的分配,它主要要是用來來作適合合度檢定定,亦即即檢定資料是否否符合某某種分配配,有時時也用來來求母體體變異數數的信賴

22、賴區間與與檢定單一母母體的變變異數。至於卡卡方分配配的圖形形,則如如以下圖圖7.2所示。卡方分配配為右偏偏的分配配曲線,我們由由圖中可可以看出出,當自自由度r越大時,其卡卡方分配配所呈現現的圖形形會愈趨趨近於常常態分配配。卡方分配配的性質質:1.卡方方分配之之加法性性:設X與Y皆為互相相獨立之之卡方分分配,其其自由度度各為及及,若一一統計量量,則則Z為自由度度的的卡方分配。2.若隨隨機變數數X為具有自自由度為為r的卡方分分配,則則(1)期期望值(2)變變異數.3.卡方方分配是是右偏的的分配曲曲線,隨隨著自由由度的增增加,其其變異數數也會跟跟著增大。4.,其中r表示其自自由度,此機率率代表點點的

23、右尾面面積為。舉個個例子來來說,表表示自由由度為10之卡卡方分配配的數值值,比15.987大大的機率率為10%,而而比15.987小的機率則則為90%。【例7.10】利用卡方方分配表表求出下下列的卡卡方值:(a)自由度=15,(b)自由度=28,(c)自由度= 5,求求使得的的卡方值值。解:(a)從後面附附錄的卡卡方分配配表中,我們可可以看出出因此我們們可以得得到(b)同(a)小題的查查表方法法,我們們亦可得得到亦即表示示說的的機機率為0.01(c)由題意得得知,此此卡方分分配的自自由度為為5。因為所以 查卡方分分配表中中,以以及及所對對應應的卡方方值因此便可可以求出出使使得的的卡方值值為12

24、.8325。【例7.11】由一個平平均數未未知,而變異異數的的常態分分配母體體中抽出出一組樣樣本數為為20的隨機樣樣本,試試求:(a)其樣本變變異數會會超超過27.67的機率為為多少?(b)其樣本變變異數會會介介於8.52與25.384之間的機機率為多多少?解:(a)由題意可可知母體體的變異異數,樣樣本數n=20,由定理理7.4.5可知,則樣本本變異數數超超過27.67的 機率率為 我們由卡卡方分配配表中可可以看出出,當自自由度d.f.=19,而時時,其卡方方值,因因此我們們可以求求出=0.025故樣本變變異數超超過27.67的機率為為0.025。(b)樣本變異異數會會介於於8.52與25.384之間的機機率為我們由卡卡方分配配表中可可以看出出,其卡卡方值,因此我們們可以求求出=0.95-0.05=0.9故我們可可以求出出樣本變變異數會會介介於8.52與25.384之間的機機率為0.9。7.4.2t分配上面的(7.13)式式表示分配的機機率密度度函數,而此分分配的平平均數與與變異數分別別表示如如下:;,r為自由度度且。分配的性性質:【例7.12】解:【例7.13】假設X表示某國國中之男男生的體體重,已已知其分分配為平平均數,而標標準差未未知知的常態態分配,亦即XN(63,)。倘若今今從此班班級中隨隨機抽出出n=

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论