生物统计课件_第1页
生物统计课件_第2页
生物统计课件_第3页
生物统计课件_第4页
生物统计课件_第5页
已阅读5页,还剩954页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

绪论

第一節生物統計在畜禽、水產科學研究中的作用

下一張

主頁

退出

上一張

為了推動畜牧業、水產業的發展,常常要進行科學研究。進行科學研究離不開調查或試驗。進行調查或試驗必須解決二個問題:

如何合理地進行調查或試驗設計;如何科學地整理、分析所收集得來的具有變異的資料,揭示出隱藏在其內部的規律性。下一張

主頁

退出

上一張

合理地進行調查或試驗設計、科學地整理、分析所收集得來的資料是生物統計(Biometrics)的根本任務。

生物統計是數理統計的原理和方法在生物科學研究中的應用,是一門應用數學。它在畜禽、水產科學研究中具有十分重要的作用。

一、提供試驗或調查設計的方法

試驗設計這一概念有廣義與狹義之分:下一張

主頁

退出

上一張

廣義的試驗設計是指試驗研究課題設計,也就是指整個試驗計畫的擬定,包含課題名稱、試驗目的,研究依據、內容及預期達到的效果,試驗方案,供試單位的選取、重複數的確定、試驗單位的分組,試驗的記錄專案和要求,試驗結果的分析方法,經濟效益或社會效益的估計,已具備的條件,需要購置的儀器設備,參加研究人員的分工,試驗時間、地點、進度安排和經費預算,成果鑒定,學術論文撰寫等內容。下一張

主頁

退出

上一張

狹義的試驗設計主要是指試驗單位(如動物試驗的畜、禽)的選取、重複數目的確定及試驗單位的分組。生物統計中的試驗設計主要指狹義的試驗設計。合理的試驗設計能控制和降低試驗誤差,提高試驗的精確性,為統計分析獲得試驗處理效應和試驗誤差的無偏估計提供必要的數據。下一張

主頁

退出

上一張

調查設計這一概念也有廣義與狹義之分:

廣義的調查設計是指整個調查計畫的制定,包括調查研究的目的、對象與範圍,調查專案及調查表,抽樣方法的選取,抽樣單位、抽樣數量的確定,數據處理方法,調查組織工作,調查報告撰寫與要求,經費預算等內容。下一張

主頁

退出

上一張

狹義的調查設計主要包含抽樣方法的選取,抽樣單位、抽樣數目的確定等內容。生物統計中的調查設計主要指狹義的調查設計。合理的調查設計能控制與降低抽樣誤差,提高調查的精確性,為獲得總體參數的可靠估計提供必要的數據。

試驗或調查設計主要解決合理地收集必要而有代表性資料的問題。下一張

主頁

退出

上一張

二、提供整理、分析資料的方法整理資料的基本方法是根據資料的特性將其整理成統計表、繪製成統計圖。通過統計表、圖可以大致看到所得資料集中、離散的情況。並利用所收集得來的數據計算出幾個統計量,以表示該資料的數量特徵、估計相應的總體參數。下一張

主頁

退出

上一張

統計分析最重要的內容是差異顯著性檢驗。通過抽樣調查或控制試驗,獲得的是具有變異的資料。產生變異的原因是什麼?是由於進行比較的處理間,例如不同品種、不同飼料配方間有實質性的差異或是由於無法控制的偶然因素所引起?顯著性檢驗的目的就在於承認並儘量排除這些無法控制的偶然因素的干擾,將處理間是否存在本質差異揭示出來。顯著性檢驗的方法很多,常用的有:下一張

主頁

退出

上一張

t檢驗——主要用於檢驗兩個處理平均數差異是否顯著;

方差分析——主要用於檢驗多個處理平均數間差異是否顯著;

檢驗——

主要用於由品質性狀得來的次數資料的顯著性檢驗等。下一張

主頁

退出

上一張

統計分析的另一個重要內容是對試驗指標或畜禽性狀間的關係進行研究,或者研究它們之間的聯繫性質和程度,或者尋求它們之間的聯繫形式,即進行相關分析與回歸分析。通過對資料進行相關、回歸分析,可以揭示出試驗指標或性狀間的內在聯繫,為畜禽、水產新品種選育等提供強有力的依據。下一張

主頁

退出

上一張

還有一類統計分析方法不考慮資料的分佈類型,也不事先對有關總體參數進行估算,這類統計分析方法叫非參數檢驗法。非參數檢驗法計算簡便。當通常的檢驗方法對畜禽、水產科研中的某些資料無能為力時,非參數檢驗法則正好發揮作用。下一張

主頁

退出

上一張

第二節生物統計的常用術語

一、總體與樣本根據研究目的確定的研究對象的全體稱為總體(population);总体中的一个研究单位称为個體

(individual);总体的一部分称为樣本(sample);含有有限个个体的总体称为有限总体;包含有無限多個個體的總體叫無限總體;下一張

主頁

退出

上一張

在實際研究中還有一類假想總體。例如進行幾種飼料的飼養試驗,實際上並不存在用這幾種飼料進行飼養的總體,只是假設有這樣的總體存在,把所進行的試驗看成是假想總體的一個樣本;樣本中所包含的個體數目叫樣本容量或大小(samplesize),樣本容量常記為n。通常把n≤30的樣本叫小樣本,n>30的樣本叫大樣本。研究的目的是要瞭解總體,然而能觀測到的卻是樣本,通過樣本來推斷總體是統計分析的基本特點。下一張

主頁

退出

上一張

為了能可靠地從樣本來推總體,要求樣本具有一定的含量和代表性。只有從總體隨機抽取的樣本才具有代表性。所謂隨機抽取(randomsampling)的樣本是指總體中的每一個個體都有同等的機會被抽取組成樣本。樣本畢竟只是總體的一部分,儘管樣本具有一定的含量也具有代表性,通過樣本來推斷總體也不可能是百分之百的正確。有很大的可靠性但有一定的錯誤率這是統計分析的又一特點。下一張

主頁

退出

上一張

二、參數與統計量為了表示總體和樣本的數量特徵,需要計算出幾個特徵數。由總體計算的特徵數叫參數(parameter);由样本计算的特征数叫統計量(staistic)。常用希腊字母表示参数,例如用μ表示總體平均數,用σ表示總體標準差;常用拉丁字母表示統計量,例如用表示樣本平均數,用S表示樣本標準差。下一張

主頁

退出

上一張

總體參數由相應的統計量來估計,例如用估計μ,用S估計σ等。

三、準確性與精確性

準確性(accuracy)也叫準確度,指在調查或試驗中某一試驗指標或性狀的觀測值與其真值接近的程度。設某一試驗指標或性狀的真值為μ,觀測值為

x,若x與μ相差的絕對值|x-μ|小,則觀測值x的準確性高;反之則低。下一張

主頁

退出

上一張

精確性(precision)也叫精確度,指調查或試驗中同一試驗指標或性狀的重複觀測值彼此接近的程度。若觀測值彼此接近,即任意二個觀測值xi

、xj

相差的絕對值|xi-xj|小,則觀測值精確性高;反之則低。準確性、精確性的意義見圖1-1。調查或試驗的準確性、精確性合稱為正確性。下一張

主頁

退出

上一張

在調查或試驗中應嚴格按照調查或試驗計畫進行,準確地進行觀測記載,力求避免人為差錯,特別要注意試驗條件的一致性,即除所研究的各個處理外,供試畜禽的初始條件如品種、性別、年齡、健康狀況、飼養條件、管理措施等應儘量控制一致,並通過合理的調查或試驗設計努力提高試驗的準確性和精確性。

由於真值μ常常不知道,所以準確性不易度量,但利用統計方法可度量精確性。下一張

主頁

退出

上一張

四、隨機誤差與系統誤差隨機誤差(randomerror)與系統誤差(systematicerror)

隨機誤差也叫抽樣誤差(samplingerror),這是由於許多無法控制的內在和外在的偶然因素所造成。隨機誤差帶有偶然性質,在試驗中,即使十分小心也難以消除。隨機誤差影響試驗的精確性。下一張

主頁

退出

上一張

統計上的試驗誤差指隨機誤差。這種誤差愈小,試驗的精確性愈高。

系統誤差也叫片面誤差(lopsidederror),這是由於試驗動物的初始條件相差較大,飼料種類、品質、數量、飼養條件未控制相同,測量的儀器不准、標準試劑未經校正,以及觀測、記載、抄錄、計算中的錯誤所引起。系統誤差影響試驗的準確性。下一張

主頁

退出

上一張

t檢驗

統計推斷是根據樣本和假定模型對總體作出的以概率形式表述的推斷,它主要包括假設檢驗(testofhypothesis)和參數估計(parametricestimation)二個內容。下一張

主頁

退出

上一張

假設檢驗又叫顯著性檢驗(testofsignificance)。显著性检验的方法很多,常用的有t檢驗、F檢驗和

2檢驗等。儘管這些檢驗方法的用途及使用條件不同,但其檢驗的基本原理是相同的。本章以兩個平均數的差異顯著性檢驗為例來闡明顯著檢驗的原理,介紹幾種t檢驗的方法,然後介紹總體參數的區間估計(intervalestimation)。下一張

主頁

退出

上一張

第一節顯著性檢驗的基本原理

一、顯著性檢驗的意義隨機抽測10頭長白豬和10頭大白豬經產母豬的產仔數,資料如下:長白:11,11,9,12,10,13,13,8,10,13

大白:8,11,12,10,9,8,8,9,10,7

經計算,得長白豬10頭經產母豬產仔平均數=11頭,標準差S1=1.76頭;大白豬10頭經產母豬產仔平均數=9.2頭,標准差S2=1.549頭。下一張

主頁

退出

上一張

能否僅憑這兩個平均數的差值-=1.8頭,立即得出長白與大白兩品種經產母豬產仔數不同的結論呢?統計學認為,這樣得出的結論是不可靠的。這是因為如果我們再分別隨機抽測10頭長白豬和10頭大白豬經產母豬的產仔數,又可得到兩個樣本資料。由於抽樣誤差的隨機性,兩樣本平均數就不一定是11頭和9.2頭,其差值也不一定是1.8頭。造成這種差異可能有兩種原因,一是品種造成的差異,即是長白豬與大白豬本質不同所致,另一可能是試驗誤差(或抽樣誤差)。下一張

主頁

退出

上一張

對兩個樣本進行比較時,必須判斷樣本間差異是抽樣誤差造成的,還是本質不同引起的。如何區分兩類性質的差異?怎樣通過樣本來推斷總體?這正是顯著性檢驗要解決的問題。兩個總體間的差異如何比較?一種方法是研究整個總體,即由總體中的所有個體數據計算出總體參數進行比較。這種研究整個總體的方法是很準確的,但常常是不可能進行的,因為總體往往是無限總體,或者是包含個體很多的有限總體。因此,不得不採用另一種方法,即研究樣下一張

主頁

退出

上一張

樣本,通過樣本研究其所代表的總體。例如,設長白豬經產母豬產仔數的總體平均數為,大白豬經產母豬產仔數的總體平均數為,試驗研究的目的,就是要給、是否相同做出推斷。由於總體平均數、未知,在進行顯著性檢驗時只能以樣本平均數、作為檢驗對象,更確切地說,是以(-)作為檢驗對象。為什麼以樣本平均數作為檢驗對象呢?這是因為樣本平均數具有下述特徵:

1、離均差的平方和∑(-)2最小。說明樣本平均數與樣本各個觀測值最接近,平均數是資料的代表數。下一張

主頁

退出

上一張

2、樣本平均數是總體平均數的無偏估計值,即E()=μ。

3、根據統計學中心極限定理,樣本平均數服从或逼近正态分布。所以,以樣本平均數作為檢驗對象,由兩個樣本平均數差異的大小去推斷樣本所屬總體平均數是否相同是有其依據的。由上所述,一方面我們有依據由樣本平均數和的差異來推斷總體平均數、相同與否,另一方面又不能僅據樣本平均數表面上的差異直接作出結論,其根本原因在於試驗誤差(或抽樣誤差)的不可避免性。下一張

主頁

退出

上一張

通過試驗測定得到的每個觀測值,既由被測個體所屬總體的特徵決定,又受個體差異和諸多無法控制的隨機因素的影響。所以觀測值由兩部分組成,即

=+

總體平均數反映了總體特徵,表示誤差。若樣本含量為n,則可得到n

個觀測值:,,,。於是樣本平均數下一張

主頁

退出

上一張

說明樣本平均數並非總體平均數,它還包含試驗誤差的成分。對於接受不同處理的兩個樣本來說,則有:

=+,=+

這說明兩個樣本平均數之差(-)也包括了兩部分:一部分是兩個總體平均數的差(-),叫做試驗的處理效應(treatmenteffect);另一部分是試驗誤差(-)。下一張

主頁

退出

上一張

也就是說樣本平均數的差(-)包含有試驗誤差,它只是試驗的表面效應。因此,僅憑(-)就對總體平均數、是否相同下結論是不可靠的。只有通過顯著性檢驗才能從(-)中提取結論。對(-)進行顯著性檢驗就是要分析:

試驗的表面效應(-)主要由處理效應(-)引起的,還是主要由試驗誤差所造成。下一張

主頁

退出

上一張

雖然處理效應(-)未知,但試驗的表面效應是可以計算的,借助數理統計方法可以對試驗誤差作出估計。所以,可從試驗的表面效應與試驗誤差的權衡比較中間接地推斷處理效應是否存在,這就是顯著性檢驗的基本思想。二、顯著性檢驗的基本步驟

(一)首先對試驗樣本所在的總體作假設

下一張

主頁

退出

上一張

這裏假設=或-=0,即假設長白豬和大白豬兩品種經產母豬產仔數的總體平均數相等,其意義是試驗的表面效應:-=1.8頭是試驗誤差,處理無效,這種假設稱為無效假設(nullhypothesis),記作:=或。無效假設是被檢驗的假設,通過檢驗可能被接受,也可能被否定。提出:=或-=0的同時,相應地提出一對應假設,稱為備擇假設(alternativehypothesis),記作。備擇假設是在無效假設被否定時準備接受的假設。下一張

主頁

退出

上一張

本例的備擇假設是:≠或-≠0,即假設長白豬與大白豬兩品種經產母豬產仔數的總體平均數與不相等或與之差不等於零,亦即存在處理效應,其意義是指試驗的表面效應,除包含試驗誤差外,還含有處理效應在內。

(二)在無效假設成立的前提下,構造合適的統計量,並研究試驗所得統計量的抽樣分佈,計算無效假設正確的概率下一張

主頁

退出

上一張

對於上述例子,研究在無效假設:=成立的前提下,統計量(-)的抽樣分佈。經統計學研究,得到一個統計量t:其中=

叫做均數差異標準誤;n1、n2為兩樣本的含量。下一張

主頁

退出

上一張

所得的統計量t服從自由度df=(n1-1)+(n2-1)的t分佈。根據兩個樣本的數據,計算得:-=11-9.2=1.8;下一張

主頁

退出

上一張

我們需進一步估計出|t|≥2.426的兩尾概率,即估計P(|t|≥2.426)是多少?查附表3,在df=(n1-1)+(n2-1)=(10-1)+(10-1)=18時,兩尾概率為0.05的臨界值:=2.101,兩尾概率為0.01的臨界t值:=2.878,即:

P(|t|>2.101)=P(t>2.101)

+P(t<-2.101)=0.05P(|t|>2.878)=P(t>2.878)

+P(t<-2.878)=0.01下一張

主頁

退出

上一張

由於根據兩樣本數據計算所得的t值為2.426,介於兩個臨界t值之間,即:

t0.05<2.426<t0.01

所以,|t|≥2.426的概率P介於0.01和0.05之間,即:0.01<P<0.05。

圖5-1|t|≥2.426的兩尾概率如圖5-1所示,說明無效假設成立的可能性,即試驗的表面效應為試驗誤差的可能性在0.01─0.05之間。下一張

主頁

退出

上一張

(三)根據“小概率事件實際不可能性原理”否定或接受無效假設在統計學上,把小概率事件在一次試驗中看成是實際上不可能發生的事件,稱為小概率事件實際不可能原理。根據這一原理,當試驗的表面效應是試驗誤差的概率小於0.05時,可以認為在一次試驗中試驗表面效應是試驗誤差實際上是下一張

主頁

退出

上一張

不可能的,因而否定原先所作的無效假設:

=,接受備擇假設:≠,即認為:試驗的處理效應是存在的。當試驗的表面效應是試驗誤差的概率大於0.05時,則說明無效假設:=成立的可能性大,不能被否定,因而也就不能接受備擇假設:≠。下一張

主頁

退出

上一張

本例中,按所建立的:=,試驗的表面效應是試驗誤差的概率在0.01─0.05之間,小於0.05,故有理由否定:=,從而接受:≠。可以認為長白豬與大白豬兩品種經產母豬產仔數總體平均數和不相同。綜上所述,顯著性檢驗,從提出無效假設與備擇假設到根據小概率事件實際不可能性原理來否定或接受無效假設,這一過程實際上是應用所謂“概率性質的反證法”對試驗樣本所屬總體所作的無效假設的統計推斷。下一張

主頁

退出

上一張

三、顯著水準與兩種類型的錯誤在顯著性檢驗中,否定或接受無效假設的依據是“小概率事件實際不可能性原理”。用來確定否定或接受無效假設的概率標準叫顯著水平(significancelevel),记作α。在生物學研究中常取α=0.05或α=0.01。对于上述例子所用的检验方法(t檢驗)來說:下一張

主頁

退出

上一張

若|t|<t0.05

,則說明試驗的表面效應屬於試驗誤差的概率P>0.05,即表面效應屬於試驗誤差的可能性大,不能否定:=,統計學上把這一檢驗結果表述為:“兩個總體平均數與差異不顯著”,在計算所得的t值的右上方標記“ns”或不標記符號;下一張

主頁

退出

上一張

若t0.05≤|t|<t0.01,則說明試驗的表面效應屬於試驗誤差的概率P在0.01—0.05之間,即0.01<P≤0.05,表面效應屬於試驗誤差的可能性較小,應否定:=,接受:≠,統計學上把這一檢驗結果表述為:“兩個總體平均數與差異顯著”,在計算所得的t值的右上方標記“*”;下一張

主頁

退出

上一張

若|t|≥t0.01,則說明試驗的表面效應屬於試驗誤差的概率P不超過0.01,即P≤0.01,表面效應屬於試驗誤差的可能性更小,應否定:=,接受:≠,統計學上把這一檢驗結果表述為:“兩個總體平均數與差異極顯著”,在計算所得的t值的右上方標記“**”。下一張

主頁

退出

上一張

這裏可以看到,是否否定無效假設,是用實際計算出的檢驗統計量t的絕對值與顯著水準α對應的臨界t值:ta比較。若|t|≥ta,則在α水準上否定;若|t|<ta,則不能在α水準上否定。區間和稱為α水準上的否定域,而區間()則稱為α水準上的接受域。下一張

主頁

退出

上一張

假設檢驗時選用的顯著水準,除α=0.05和0.01為常用外,也可選α=0.10或α=0.001等等。到底選哪種顯著水準,應根據試驗的要求或試驗結論的重要性而定。如果試驗中難以控制的因素較多,試驗誤差可能較大,則顯著水準可選低些,即α值取大些。反之,如試驗耗費較大,對精確度的要求較高,不容許反復,或者試驗結論的應用事關重大,則所選顯著水準應高些,即α值應該小些。顯著水準α對假設檢驗的結論是有直接影響的,所以它應在試驗開始前即確定下來。下一張

主頁

退出

上一張

因為顯著性檢驗是根據“小概率事件實際不可能性原理”來否定或接受無效假設的,所以不論是接受還是否定無效假設,都沒有100%的把握。也就是說,在檢驗無效假設時可能犯兩類錯誤。第一類錯誤是真實情況為H0成立,卻否定了它,犯了“棄真”錯誤,也叫Ⅰ型錯誤(typeⅠerror)。Ⅰ型錯誤,就是把非真實差異錯判為真實差異,即為真,卻接受了。下一張

主頁

退出

上一張

第二類錯誤是H0不成立,卻接受了它,犯了“納偽”錯誤,也叫Ⅱ型錯誤(typeⅡerror)。Ⅱ型錯誤,就是把真實差異錯判為非真實差異,即為真,卻未能否定。我們是基於“小概率事件實際不可能性原理”來否定H0,但在一次試驗中小概率事件並不是絕對不會發生的。如果我們抽得一個樣本,它雖然來自與H0對應的抽樣總體,但計算所得的統計量t卻落入了否定域中,因而否定了H0,於是犯了Ⅰ型錯誤。但犯這類錯誤的概率不會超過a。下一張

主頁

退出

上一張

Ⅱ型錯誤發生的原因可以用圖5-2來說明。圖中左邊曲線是為真時,(-)的分佈密度曲線;右邊曲線是為真時,(-)的分佈密度曲線(>),它們構成的抽樣分佈相疊加。有時我們從抽樣總體抽取一個(-)恰恰在成立時的接受域內(如圖中橫線陰影部分),這樣,實際是從總體抽的樣本,經顯著性檢驗卻不能否定,因而犯了Ⅱ型錯誤。犯Ⅱ型錯誤的概率用表示。Ⅱ型下一張

主頁

退出

上一張

錯誤概率值的大小較難確切估計,它只有與特定的結合起來才有意義。一般與顯著水準α、原總體的標準差σ、樣本含量n、以及相互比較的兩樣本所屬總體平均數之差-等因素有關。在其他因素確定時,α值越小,值越大;反之,α值越大,值越小;樣本含量及

-越大、σ越小,值越小。下一張

主頁

退出

上一張

由於值的大小與α值的大小有關,所以在選用檢驗的顯著水準時應考慮到犯Ⅰ、Ⅱ型錯誤所產生後果嚴重性的大小,還應考慮到試驗的難易及試驗結果的重要程度。若一個試驗耗費大,可靠性要求高,不允許反復,那麼α值應取小些;下一張

主頁

退出

上一張

當一個試驗結論的使用事關重大,容易產生嚴重後果,如藥物的毒性試驗,α值亦應取小些。對於一些試驗條件不易控制,試驗誤差較大的試驗,可將α值放寬到0.1,甚至放寬到0.25。下一張

主頁

退出

上一張

在提高顯著水準,即減小α值時,為了減小犯Ⅱ型錯誤的概率,可適當增大樣本含量。因為增大樣本含量可使()分布的方差σ2(1/n1+1/n2)變小,使圖5-2左右兩曲線變得比較“高”、“瘦”,疊加部分減少,即值變小。我們的願望是α

值不越過某個給定值,比如α=0.05或0.01的前提下,值越小越好。因為在具體問題中和σ相對不變,所以值的大小主要取決於樣本含量的大小。下一張

主頁

退出

上一張

表5-1兩類錯誤的關係兩類錯誤的關係可歸納如下:四、雙側檢驗與單側檢驗

在上述顯著性檢驗中,無效假設與備擇假設。此時,備擇假設中包括了或两种可能。这个假设的目的在于判断与有无差异,而不考虑谁大谁小。如比较长白猪与大白猪两品种猪经产母猪的产仔数,长白猪可能高于大白猪,也可能低于大白猪。下一張

主頁

退出

上一張

此時,在α

平上否定域為和,對稱地分配在t分佈曲線的兩側尾部,每側的概率為α/2,如图5-3所示。這種利用兩尾概率進行的檢驗叫雙側檢驗(two-sidedtest),也叫雙尾檢驗(two-tailedtest),為雙側檢驗的臨界t值。下一張

主頁

退出

上一張

但在有些情況下,雙側檢驗不一定符合實際情況。如採用某種新的配套技術措施以期提高雞的產蛋量,已知此種配套技術的實施不會降低產蛋量。此時,若進行新技術與常規技術的比較試驗,則無效假設應為,即假設新技術與常規技術產蛋量是相同的,備擇假設應為,即新配套技術的實施使產蛋下一張

主頁

退出

上一張

量有所提高。檢驗的目的在於推斷實施新技術是否提高了產蛋量,這時H0的否定域在t分佈曲線的右尾。在α水準上否定域為,右側的概率為α,如圖5-4A所示。若無效假設H0為,備擇假設HA為,此時H0的否定域在t分佈曲線的左尾。在α水準上,H0的否定域為,左側的概率為α。如圖5-4A所示。下一張

主頁

退出

上一張

這種利用一尾概率進行的檢驗叫單側檢驗(one-sidedtest)也叫单尾检验(one-tailedtest)。此时tα為單側檢驗的臨界t值。顯然,單側檢驗的tα=雙側檢驗的t2α。由上可以看出,若對同一資料進行雙側檢驗也進行單側檢驗,那麼在α水準上單側檢驗顯著,只相當於雙側檢驗在2α水準上顯著。所以,同一資料雙側檢驗與單側檢驗所得的結論不一定相同。

雙側檢驗顯著,單側檢驗一定顯著;但單側檢驗顯著,雙側檢驗未必顯著。

下一張

主頁

退出

上一張

五、顯著性檢驗中應注意的問題

上面我們已詳細闡明了顯著性檢驗的意義及原理。進行顯著性檢驗還應注意以下幾個問題:

(一)為了保證試驗結果的可靠及正確,要有嚴密合理的試驗或抽樣設計,保證各樣本是從相應同質總體中隨機抽取的。並且處理間要有可比性,即除比較的處理外,其他影響因素應盡可能控制相同或基本相近。否則,任何顯著性檢驗的方法都不能保證結果的正確。下一張

主頁

退出

上一張

(二)選用的顯著性檢驗方法應符合其應用條件。上面我們所舉的例子屬於“非配對設計兩樣本平均數差異顯著性檢驗”。由於研究變數的類型、問題的性質、條件、試驗設計方法、樣本大小等的不同,所用的顯著性檢驗方法也不同,因而在選用檢驗方法時,應認真考慮其適用條件,不能濫用。

下一張

主頁

退出

上一張

(三)要正確理解差異顯著或極顯著的統計意義。顯著性檢驗結論中的“差異顯著”或“差異極顯著”不應該誤解為相差很大或非常大,也不能認為在專業上一定就有重要或很重要的價值。“顯著”或“極顯著”是指表面上如此差別的不同樣本來自同一總體的可能性小於0.05或0.01,已達到了可以認為它們有實質性差異的顯著水準。有些試驗結果雖然差別大,但由於試驗誤差大,也許還不能得出“差異顯著”的結論,而有些試驗的結果間的差異雖小,但由於試驗誤差小,反而可能推斷為“差異顯著”。下一張

主頁

退出

上一張

顯著水準的高低只表示下結論的可靠程度的高低,即在0.01水準下否定無效假設的可靠程度為99%,而在0.05水準下否定無效假設的可靠程度為95%。下一張

主頁

退出

上一張

“差異不顯著”是指表面上的這種差異在同一總體中出現的可能性大於統計上公認的概率水準0.05,不能理解為試驗結果間沒有差異。下“差異不顯著”的結論時,客觀上存在兩種可能:一是本質上有差異,但被試驗誤差所掩蓋,表現不出差異的顯著性來。如果減小試驗誤差或增大樣本含量,則可能表現出差異顯著性;二是可能確無本質上差異。顯著性檢驗只是用來確定無效假設能否被推翻,而不能證明無效假設是正確的。

(四)合理建立統計假設,正確計算檢驗統計量。就兩個樣本平均數差異顯著性檢驗來說,無效假設與備擇假設的建立,一般如前所述,但也有時也例外。如經收益與成本的綜合經濟分析知道,飼喂畜禽以高質量的Ⅰ號飼料比飼喂Ⅱ號飼料提高的成本需用畜禽生產性能提高個d單位獲得的收益來相抵,那麼在檢驗喂Ⅰ號飼料與Ⅱ號飼料在收益上是否有差異時,無效假設應為,備擇假設為(雙側檢驗)或(單側檢驗);t檢驗計算公式為:下一張

主頁

退出

上一張

(5-1)如果不能否定無效假設,可以認為喂高質量的Ⅰ號飼料得失相抵,只有當()>d達到一定程度而否定了H0,才能認為喂Ⅰ號飼料可獲得更多的收益。下一張

主頁

退出

上一張

(五)

結論不能絕對化。經過顯著性檢驗最終是否否定無效假設則由被研究事物有無本質差異、試驗誤差的大小及選用顯著水準的高低決定的。同樣一種試驗,試驗本身差異程度的不同,樣本含量大小的不同,顯著水準高低的不同,統計推斷的結論可能不同。否定H0時可能犯Ⅰ型錯誤,接受H0時可能犯Ⅱ型錯誤。尤其在P接近α時,下結論應慎重,有時應用重複試驗來證明。總之,具有實用意義的結論要從多方面綜合考慮,不能單純依靠統計結論。下一張

主頁

退出

上一張

此外,報告結論時應列出,由樣本算得的檢驗統計量值(如t值),注明是單側檢驗還是雙側檢驗,並寫出P值的確切範圍,如0.01<P<0.05,以便讀者結合有關資料進行對比分析。下一張

主頁

退出

上一張

第二節樣本平均數與總體平均數差異顯著性檢驗

在實際工作中我們往往需要檢驗一個樣本平均數與已知的總體平均數是否有顯著差異,即檢驗該樣本是否來自某一總體。已知的總體平均數一般為一些公認的理論數值、經驗數值或期望數值。如畜禽正常生理指標、懷孕期、家禽出雛日齡以及生產性能指標等,都可以用樣本平均數與之比較,檢驗差異顯著性。檢驗的基本步驟是:下一張

主頁

退出

上一張

(一)提出無效假設與備擇假設,,其中為樣本所在總體平均數,為已知總體平均數;

(二)計算t值計算公式為:(5-2)式中,n為樣本含量,為樣本標準誤。

(三)查臨界t值,作出統計推斷由查附表3得臨界值t0.05,t0.01。將計算所得的t值的絕對值與其比較:下一張

主頁

退出

上一張

若|t|<t0.05,則P>0.05,不能否定,表明樣本平均數與總體平均數差異不顯著,可以認為樣本是取自該總體;若t0.05≤|t|<t0.01,則0.01<P≤0.05,否定,接受,表明樣本平均數與總體平均數差異顯著,有95%的把握認為樣本不是取自該總體;

若|t|≥t0.01,則P≤0.01,表明樣本平均數與總體平均數差異極顯著,有99%的把握認為樣本不是取自該總體。若在0.05水準上進行單側檢驗,只要將計算所得t值的絕對值|t|與由附表3查得a=0.10的臨界t值t0.10比較,即可作出統計推斷。下一張

主頁

退出

上一張

【例5.1】母猪的怀孕期为114天,今抽測10頭母豬的懷孕期分別為116、115、113、112、114、117、115、116、114、113(天),試檢驗所得樣本的平均數與總體平均數114天有無顯著差異?根據題意,本例應進行雙側t檢驗。

1、提出無效假設與備擇假設,

下一張

主頁

退出

上一張

2、計算t值經計算得:=114.5,S=1.581

所以

=

=

=1.000

3、查臨界t值,作出統計推斷由=9,查t值表(附表3)得t0.05(9)=2.262,因為|t|<t0.05,P>0.05,故不能否定H0:=114,表明樣本平均數與總體平均數差異不顯著,可以認為該樣本取自母豬懷孕期為114天的總體。下一張

主頁

退出

上一張

【例5.2】按饲料配方规定,每1000kg某種飼料中維生素C不得少於246g,現從工廠的產品中隨機抽測12個樣品,測得維生素C含量如下:255、260、262、248、244、245、250、238、246、248、258、270g/1000kg,若樣品的維生素C含量服從正態分佈,問此產品是否符合規定要求?下一張

主頁

退出

上一張

按題意,此例應採用單側檢驗。

1、提出無效假設與備擇假設

H0:=246,HA:>250

2、計算t

值經計算得:=114.5,S=1.581下一張

主頁

退出

上一張

所以

===2.281

3、查臨界t值,作出統計推斷

因為單側=雙側=1.796,t=2.281>單側t0.05(11),P<0.05,否定H0

:=246,接受HA

:>246,可以認為該批飼料維生素C含量符合規定要求。下一張

主頁

退出

上一張

第三節兩個樣本平均數的差異

顯著性檢驗

在實際工作中還經常會遇到推斷兩個樣本平均數差異是否顯著的問題,以瞭解兩樣本所屬總體的平均數是否相同。對於兩樣本平均數差異顯著性檢驗,因試驗設計不同,一般可分為兩種情況:下一張

主頁

退出

上一張

一是非配對設計或成組設計兩樣本平均數差異顯著性檢;二是配對設計兩樣本平均數差異顯著性檢。一、非配對設計兩樣本平均數的差異顯著性檢驗

非配對設計或成組設計是指當進行只有兩個處理的試驗時,將試驗單位完全隨機地分成兩個組,然後對兩組隨機施加一個處理。在這種設計中兩組的試驗單位相互獨立,所得的二個樣本相互獨立,其含量不一定相等。非配對設計資料的一般形式見表5-2。下一張

主頁

退出

上一張

表5-2非配對設計資料的一般形式下一張

主頁

退出

上一張

非配對設計兩樣本平均數差異顯著性檢驗的基本步驟如下:

(一)提出無效假設與備擇假設,

(二)計算t值

計算公式為:(5-3)下一張

主頁

退出

上一張

其中:

(5-4)

當時(5-5)下一張

主頁

退出

上一張

為均數差異標準,、,、,、分別為兩樣本含量、平均數、均方。

(三)根據df=(n1-1)+(n2-1),查臨界值:t0.05、t0.01,將計算所得t值的絕對值與其比較,作出統計推斷

【例5.3】某种猪场分别测定长白后备种猪和蓝塘后备种猪90kg時的背膘厚度,測定結果如表5-3所示。設兩品種後備種豬90kg時的背膘厚度值服從正態分佈,且方差相等,問該兩品種後備種豬90kg時的背膘厚度有無顯著差異?下一張

主頁

退出

上一張

表5-3長白與藍塘後備種豬背膘厚度

1、提出無效假設與備擇假設,

2、計算t值

此例n1=12、n2=11,經計算得:=1.202、=0.0998、=0.1096,

=1.817、=0.123、=0.1508下一張

主頁

退出

上一張

、分別為兩樣本離均差平方和。

=0.0465下一張

主頁

退出

上一張

=(12-1)+(11-1)=21

下一張

主頁

退出

上一張

3、查臨界t值,作出統計推斷

當df=21時,查臨界值得:t0.01(21)=2.831,|t|>2.831,P<0.01,否定,接受,表明长白后备种猪与蓝塘后备种猪90kg背膘厚度差異極顯著,這裏表現為長白後備種豬的背膘厚度極顯著地低於藍塘後備種豬的背膘厚度。下一張

主頁

退出

上一張

【例5.4】某家禽研究所对粤黄鸡进行饲养对比试验,试验时间为60天,增重結果如表5-4,問兩種飼料對粵黃雞的增重效果有無顯著差異?表5-4粵黃雞飼養試驗增重下一張

主頁

退出

上一張

此例,經計算得

1、提出無效假設與備擇假設

2、計算t值因為於是下一張

主頁

退出

上一張

3、查臨界值,作出統計推斷當df=14時,查臨界值得:t0.05(14)=2.145,|t|<2.145,P>0.05,故不能否定無效假設,表明两种饲料饲喂粤黄鸡的增重效果差异不显著,可以认为两种饲料的质量是相同的。下一張

主頁

退出

上一張

在非配對設計兩樣本平均數的差異顯著性檢驗中,若總的試驗單位數()不變,則兩樣本含量相等比兩樣本含量不等有較高檢驗效率,因為此時使最小,從而使t的絕對值最大。所以在進行非配對設計時,兩樣本含量以相同為好。下一張

主頁

退出

上一張

二、配對設計兩樣本平均數的差異顯著性檢驗非配對設計要求試驗單位盡可能一致。如果試驗單位變異較大,如試驗動物的年齡、體重相差較大,若採用上述方法就有可能使處理效應受到系統誤差的影響而降低試驗的準確性與精確性。為了消除試驗單位不一致對試驗結果的影響,正確地估計處理效應,減少系統誤差,降低試驗誤差,提高試驗的準確性與精確性,可以利用局部控制的原則,採用配對設計。下一張

主頁

退出

上一張

配對設計是指先根據配對的要求將試驗單位兩兩配對,然後將配成對子的兩個試驗單位隨機地分配到兩個處理組中。配對的要求是,配成對子的兩個試驗單位的初始條件儘量一致,不同對子間試驗單位的初始條件允許有差異,每一個對子就是試驗處理的一個重複。配對的方式有兩種:自身配對與同源配對。下一張

主頁

退出

上一張

1、自身配對指同一試驗單位在二個不同時間上分別接受前後兩次處理,用其前後兩次的觀測值進行自身對照比較;或同一試驗單位的不同部位的觀測值或不同方法的觀測值進行自身對照比較。如觀測某種病畜治療前後臨床檢查結果的變化;觀測用兩種不同方法對畜產品中毒物或藥物殘留量的測定結果變化等。下一張

主頁

退出

上一張

2、同源配對指將來源相同、性質相同的兩個個體配成一對,如將畜別、品種、窩別、性別、年齡、體重相同的兩個試驗動物配成一對,然後對配對的兩個個體隨機地實施不同處理。配對設計試驗資料的一般形式見表5-5。下一張

主頁

退出

上一張

表5-5配對設計試驗資料的一般形式配對設計兩樣本平均數差異顯著性檢驗的基本步驟如下:下一張

主頁

退出

上一張

(一)提出無效假設與備擇假設,其中為兩樣本配對數據差值d總體平均數,它等於兩樣本所屬總體平均數與之差,即=-。所設無效假設、備擇假設相當於,。

(二)計算t值計算公式為(5-6)下一張

主頁

退出

上一張

式中,為差異標準誤,計算公式為:

(5-7)

d為兩樣本各對數據之差

Sd為d的標準差;n為配對的對子數,即試驗的重複數。

(三)查臨界t值,作出統計推斷根據df=n-1查臨界t值:t0.02(n-1)和t0.01(n-1),將計算所得t值的絕對值與其比較,作出推斷。下一張

主頁

退出

上一張

【例5.5】用家兔10只試驗某批註射液對體溫的影響,測定每只家兔注射前後的體溫,見表5-6。設體溫服從正態分佈,問注射前後體溫有無顯著差異?表5-610只家兔注射前後的體溫下一張

主頁

退出

上一張

1、提出無效假設與備擇假設,即假定注射前後體溫無差異,即假定注射前後體溫有差異

2、計算t值經過計算得故且=10-1=9下一張

主頁

退出

上一張

3、查臨界t值,作出統計推斷由df=9,查t值表得:t0.01(9)=3.250,因為|t|>t0.01(9),P<0.01,否定,接受,表明家兔注射該批註射液前後體溫差異極顯著,這裏表現為注射該批註射液可使體溫極顯著升高。

【例5.6】现从8窩仔豬中每窩選出性別相同、體重接近的仔豬兩頭進行飼料對比試驗,將每窩兩頭仔豬隨機分配到兩個飼料組中,時間30天,試驗結果見表5-7。問兩種飼料喂飼仔豬增重有無顯著差異?下一張

主頁

退出

上一張

表5-7仔豬飼料對比試驗單位:kg下一張

主頁

退出

上一張

1、提出無效假設與備擇假設,即假定兩種飼料喂飼仔豬平均增重無差異,即假定兩種飼料喂飼仔豬平均增重有差異

2、計算t值計算得故且下一張

主頁

退出

上一張

3、查臨界t值,作出統計推斷由df=7,查t值表得:t0.01(7)=3.499,因為|t|>3.499,P<0.01,表明甲種飼料與乙種飼料喂飼仔豬平均增重差異極顯著,這裏表現為甲種飼料喂飼仔豬的平均增重極顯著高於乙種飼料喂飼的仔豬平均增重。一般说来,相对于非配对设计,配对设计能够提高试验的精确性。在進行兩樣本平均數差異顯著性檢驗時,亦有雙側與單側檢驗之分。關於單側檢驗,只要注意問題的性質、備擇假設HA的建立和臨界值的查取就行了,具體計算與雙側檢驗相同。下一張

主頁

退出

上一張

第三節百分數資料差異顯著性檢驗

在第四章介紹二項分佈時曾指出:由具有兩個屬性類別的品質性狀利用統計次數法得來的次數資料進而計算出的百分數資料,如成活率、死亡率、孵化率、感染率、陽性率等是服從二項分佈的。這類百分數的假設檢驗應按二項分佈進行。當樣本含量n較大,p不過小,下一張

主頁

退出

上一張

且np和nq均大於5時,二項分佈接近於正態分佈。所以,對於服從二項分佈的百分數資料,當n足夠大時,可以近似地用u檢驗法,即自由度為無窮大時(df=∞)的t檢驗法,進行差異顯著性檢驗。適用於近似地採用u檢驗所需的二項分佈百分數資料的樣本含量n見表5-8。下一張

主頁

退出

上一張

表5-8適用於近似地採用u檢驗所需要的二項分佈百分數資料的樣本含量n下一張

主頁

退出

上一張

一、樣本百分數與總體百分數差異顯著性檢驗需要檢驗一個服從二項分佈的樣本百分數與已知的二項總體百分數差異是否顯著,其目的在於檢驗一個樣本百分數所在二項總體百分數p是否與已知二項總體百分數p0相同,換句話說,檢驗該樣本百分數是否來自總體百分數為p0的二項總體。下一張

主頁

退出

上一張

這裏所討論的百分數是服從二項分佈的,但n足夠大,p不過小,np和nq均大於5,可近似地採用u檢驗法來進行顯著性檢驗;若np或nq小於或等於30時,應對u進行連續性矯正。檢驗的基本步驟是:

(一)提出無效假設與備擇假設,

(二)計算u值或值

u值的計算公式為:

(5-8)下一張

主頁

退出

上一張

矯正u值uc的計算公式為:(5-9)其中為樣本百分數,P0為總體百分數,為樣本百分數標準誤,計算公式為:(5-10)

(三)將計算所得的u或uc的絕對值與1.96、2.58比較,作出統計推斷

下一張

主頁

退出

上一張

若(或)<1.96,p>0.05,不能否定,表明樣本百分數與總體百分數差異不顯著;若<2.58,0.01<p≤0.05,否定,接受,表明樣本百分數與總體百分數PO差異顯著;若,,否定,接受,表明樣本百分數與總體百分數PO差異極顯著。下一張

主頁

退出

上一張

【例5.7】据往年调查某地区的乳牛隐性乳房炎一般为30%,現對某牛場500頭乳牛進行檢測,結果有175頭乳牛凝集反應陽性,問該牛場的隱性乳房炎是否與往年相同?此例總體百分數PO=30%,樣本百分數

=175/500=35%,因為=150>30,不須進行連續性矯正。

1、提出無效假設與備擇假設

,下一張

主頁

退出

上一張

2、計算u值因為於是

3、作出統計推斷

因為1.96<u<2.58,0.01<p<0.05,表明樣本百分數=35%與總體百分數PO=30%差異顯著,這裏表現為該奶牛場的隱性乳房炎顯著高於往年。

二、兩個樣本百分數差異顯著性檢驗檢驗服從二項分佈的兩個樣本百分數差異是否顯著。其目的在於檢驗兩個樣本百分數、所在的兩個二項總體百分數P1、P2是否相同。當兩樣本的np、nq均大於5時,可以近似地採用u檢驗法進行檢驗,但在np和(或)nq小於或等於30時,需作連續性矯正。檢驗的基本步驟是:下一張

主頁

退出

上一張

(一)提出無效假設與備擇假設,

(二)計算u值或uc值(5-11)(5-12)其中,為兩個樣本百分數,為樣本百分數差異標準誤,計算公式為:

為合併樣本百分數:

(三)將u或uc的絕對值與1.96、2.58比較,作出統計推斷

若(或)<1.96,p>0.05,不能否定,表明兩個樣本百分數、差異不顯著;下一張

主頁

退出

上一張

若<2.58,0.01<p≤0.05,否定,接受,表明兩個樣本百分數、差異顯著;若,,否定,接受,表明两个样本百分数、差异极显著。下一張

主頁

退出

上一張

【例5.8】某养猪场第一年饲养杜长大商品仔猪9800頭,死亡980頭;第二年飼養杜長大商品仔豬10000頭,死亡950頭,試檢驗第一年仔豬死亡率與第二年仔豬死亡率是否有顯著差異?此例,兩樣本死亡率分別為:合併的樣本死亡率為:

因為即、、、均大於5,並且大於30,可利用u檢驗法,不需作連續矯正。檢驗基本步驟是:

1、提出無效假設與備擇假設

,下一張

主頁

退出

上一張

2、計算u值因為

=0.00422

於是=

3、作出統計推斷由於u<1.96,p>0.05,不能否定,表明第一年仔豬死亡率與第二年仔豬死亡率差異不顯著。下一張

主頁

退出

上一張

第四節總體參數的區間估計

所謂參數估計就是用樣本統計量來估計總體

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论