品质统计原理——变异数分析_第1页
品质统计原理——变异数分析_第2页
品质统计原理——变异数分析_第3页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、授課目錄第偉導論第2章 統計資料的整理與描述第3章機率導論第4章 常用的機率分配與統計分佈第5章描樣方法與描樣分佈第6章統計估計第7章統計檢定第8章變異數分析第9章相關分析與迴歸模式第10章無母數統計檢定第11章類別資料分析-列聯表與卡方檢定第八章變異數分析般統計檢定係討論兩個常態母體下檢定平均值的方法。倘對k個常態母體,欲檢定其 平均值是否一致時,採逐一比對程序檢定則效率差且會增型I誤差的機率變異數分析 ANOV A(Analysis of Variance)的主要觀念即利用各組資料平均值的差異與各組資料整體之間差異做比較,來檢定平均值是否相同的方法。ANOVA可對k個母體檢定其平均值是否一

2、致。ANOVA即將一組資料的總變 異,依其變異來源分割成數區 ,然後針對其各區內變異 與各區間變異加以探討分析。ANOVA依據因子的數目 -One-way ANOV A, Two-way ANOV A。8.1 實驗設計與ANOVA十九世紀初,英國為了改良農作物的品質與產量,由Ronald A. Fisher爵士首先提出應用 ANOV A於實驗設 計(DOE, Design of Experiment)中。實驗的目的是將不 同的處理仃reatment),指定給不同的 實驗單位(Unit), 以便觀察其結果好壞。實驗的目的是將不同的處理,指予不同的實驗單位,2、 決定這些最具影響力變數x的值,使反

3、應y幾乎永遠都是在所想要的目標值(Nominal Value)的附近。3、 決定這些最具影響力變數x的值使反應y變異較小。4、決定這些最具影響力變數x的值使得不可控變數 z的影響極小以一般實驗設計方法分為二大類:完全隨機設計(Completely Randomized Design)與集區隨機設計 (Randomized Block Design),以增處理效果的可信度。1、完全隨機設計 係在考慮一個因子 的情況下,有m ,n2 ,卅固實驗單位分別指定到k個處理上。這些實驗單位的實驗順序是隨機決定 的。完全隨機設計因為只考慮一個因子,故 亦稱一因變異數分析(One-way ANOVA)。可中和

4、其他因子對實驗的影響。2、集區隨機設計 係事先將實驗對象劃分成若干同質性的集區,即在每個集區內涵具同質性環境下,進行不同實驗處理。實驗設計亦可以一函數表示之:y = f(x1 , X2 ,耐(8.1)式中:輸入 x-可控因子(變數"Control Factors(Variables),輸出 y-依變量(Dependent Variable),輸出y8.2 一因子變異數分析 仃he One-way ANOV A)倘工管系欲採三種 工廠實習課程:(1)電視教學(2)講師講 習(3)實地觀摩,研究其對 學生學習效果 是否有不同的影響。 此3種實習課程稱之 處理仃reatment)。於是將實

5、習生隨 機分成3組,分別施以不同實習課程。茲隨機抽樣21位實習生進行分組,第 1組有7位,第2組有8位,第3組有6 位。此m = 7 , n2 = 8 , n3 = 6稱之實驗單位(Unit)。本研究 僅以工廠實習課程此一因子(Factor)來對母體作分類探討,故此稱之 一因子變異數分析。典型資料如下:處理(水準)觀測值總和平均值Treatment(Level)(Observations)仃 otals)(Average)1y11 y12 y 1n2y21 y22 y 2n aya1 ya2 月 1nyaYa.y«y»N = anyij :第i個處理、第j個觀測值一因子變異

6、數分析是根據變異來源:組內、組間、與總變異等統計量,建立變異數分析表(ANOV A Table),以進行檢定工作。變異來源平方和SS自由度df均方和MSF因子(組間)SSTa-1MST=SST/(a-1)MST/MSE隨機(組內)SSEN-aMSE=SSE/(N-a)總和SSN-1MS=SS/(N-1)其中:總變異 仃otal Sum of Squared Deviation)anaanss =、-(Yj -y.)n,®i-y J . (yi 1 j =1i ±i ± j ±(82)=SST+SSE組間變異(Treatment Sum of Square

7、s) (Between Treatment)SST = n(yi-y)(83)組內變異(Error Sum of Squares) (Within Treatment)an_ SSE =二二(yj -(84)i ± j1簡化之:2SS = y:-y;/N ; SST =丄y:-晋i 11n izinSSE = SS 七ST(8.5)一因子變異數分析的統計假設為H0: 1= 2 = ;即因子對依變數無影響。H1:和不全等;即因子對依變數有影響。上述的假設中,S2,.,U分別為k個因子水準所造 成的效果。若Ho為真,即表示k個效果不存在,因子對依 變數無影響。檢定統計式:F = MST/

8、MSE(8.6)若各組樣本均來自常態分佈,則檢定統計量為一 F分佈, 在顯著水準下,倘F 乞 F , a-1, N-a= = Accept HoF > F : , a-i, N-a 二二 Reject H o各組樣本數相等範例、隨機抽取IDF、F16、與幻象2000等三種戰機各10架,測其速度,這三種戰機的平均速度有差異?SOL :(1) 建立統計假設H0: != 2 = l3 ; Hi:和不全等(2)顯著水準:=0.05IDFF162000單因子變異數分析2.251.992.782.122.482.64摘要1.892.512.98組個數總和平均變異數1.932.082.84IDF102

9、0.952.0950.03572.432.313.01F161022.062.2060.05931.872.272.7220001028.322.8320.01532.041.842.852.111.992.692.322.082.89ANOVA1.992.512.92變源SSdfMSFP-值組間3.15788721.57894342.9384.1E-09組內0.99285270.036772臨界值3.354131總和4.15073729F(=42.94)值遠大於臨界值(=3.35),且P-值為4.1E-09遠小於顯著水準0.05Reject H 0二=即至少有二種戰機(母體)的平均速度是有差

10、異的。各組樣本數不等範例、工管系欲採三種工廠實習課程:(1)電視教學(2)講師講習(3)實地觀摩,其對學習效果是否有不同的影響?SOL :(1)建立統計假設Hg: 1= 2 = l3 ; H1: < 不全等(2)顯著水準=0.05電視教學講師 講習實地觀摩單因子變異數分析707682838580摘要888075組個數總和平均變異數929089電視教學75888455858570講師講習86888634808872實地觀摩64687850909094ANOVA變源SS自由度MSFP-值組間228.95242114.47622.5190360.108502組內8181845.44444臨界值

11、3.554561總和1046.95220F(=2.52)值小於臨界值(=3.55),且P-值為0.1085大於顯著水準0.05Accept H0=三種工廠實習課程對學生學習效果無差異的。8.3 集區隨機設計 仃he Randomized Block Design)在任何實驗中,擾動因子(Nuisance Factor)引起的變異對 其結果會有影響。擾動因子之定義:一設計因子,其對反應有效果而實驗者卻對此效果無興趣。未知且無法控制(Unknown and Uncontrolled)的擾動因子:不知其存在及實 驗進行時可能改變水準。隨機化是一種設計技巧用來防範此潛伏的擾動因子。然而,已知但不可控制

12、(Known butUncontrollable)的擾動因子,倘於每次實驗時會觀測到此的 擾動因子之值,則於 ANOVA時其會被補償。如擾動變異來源是已知且可控制(Known and Controllable)時,集區劃分 (Blocking)之設計將可系統化地消除其對處理間統計比較的 影響。上節敘述一因子變異數分析,且完全隨機設計,藉此中和或消弭一些非特定因子(不是我們想知道的重點)對依變量 (輸出y)所造成的影響。但某些情況下,非特定因子對依變量 的干擾過大,甚至完全隨機設計亦無法消弭這些干擾。此時 依變量不只受到特定因子的影響,亦受到非特定因子的影 響。倘致遠管理學院欲對 6個學系有開統

13、計學課程,採4種不同教學方式,以研究統計學對各系學生學習效果是否有不 同的影響。此時,學生學習效果為依變量(輸出y),教學方式 為特定因子,但學生學習效果卻不只受到教學方式的影響, 而受到各學系的影響,因為各學系各具不同的特性。若用上 節的檢定方式,會將各系所導致的影響計入 SSE中,而使得 SSE膨脹起來,因而影響結論的正確性。如欲評鑑各系學生學習統計學的效果,則各系學生學習 成績形成一個集區(Block)。因此總變異的分解為:SS(總變異)=SST(組間變異)+ SSB(集區變異)+ SSE(隨機誤差)Block 1Block 2 Block byiiyi2 yiby2iy22 y2by3

14、iy32 y3b ya1ya2 yab變異來源平方和SS自由度df均方和MSF因子(組間)SSTa-iMST=SST/(a-i)MST/MSE集區SSBb-iMSB=SSB/(b-i)MSB/MSE隨機(組內)SSE(a-i)(b-i)MSE=SSE/(a-1)(b-1)總和SSN-1MS=SS/(N-1)其中:SS =SST + SSB+ SSE(8.7)aSST =叭(y“-yj2(8.8)SSB = a(y*_y2*去(8.9)SSE = :(y* -Vi.-y* yj2i 去 * 1:(8.10)簡化之:a baSS =送 z y2 y;/ N ; SST =送 y:. y:/ Ni

15、fc j fcb i =iSSB = 1by:_y;/N ; SSE = SS 七ST- SSB(8.11) aj±*林集區隨機設計的統計假設為Ho:!=2 = . = ;即因子對依變數無影響Hi: i不全等;即因子對依變數有影響。上述的假設中,Ji厂1'2,.,分別為k個因子水準所造成 的效果。若Ho為真,即表示k個效果不存在,因子對依變 數無影響。檢定統計式:F = MST/MSE(8.12)若各組樣本均來自常態分佈,則檢定統計量為一 F分佈 在顯著水準下,倘F - F , a-1, (a-1)(b-1)=二 Accept HoF > F : , a-1,(a-1)

16、(b-1)二二 Reject H 0範例、欲研究硬度實驗。共有 4種尖銳物和4塊可供測試的金屬物品。每1種尖銳物在每塊金屬物品上測試一次,成為一個集區隨機設計。尖銳物種類金屬物品(集區)123419.39.49.610.029.49.39.89.939.29.49.59.749.79.610.010.2SOL:變異來源平方和SS自由度df均方和MSF處理(尖銳38.50312.8314.44物種類)集區(金屬82.50327.50P-Value物品)誤差8.0090.890.0009總和129.0015F(=14.44)值大於臨界值(=3.86),且P-值為0.0009小於顯著水準0.05Re

17、ject Ho =尖銳物種類的確會影響平均硬度讀值(即尖銳物對平均硬度有效)。SOL:(考慮集區)變異來源平方和SS自由度df均方和MSF處理(尖銳38.50312.8314.44物種類)集區(金屬82.50327.50P-Value物品)誤差8.0090.890.0009總和129.0015SOL:(倘無考慮集區)變異來源平方和SS自由度df均方和MSF處理(尖銳38.50312.831.70物種類)誤差90.50127.54總和129.0015F(=1.70)值小於臨界值(=3.49)。Accept H0=尖銳物種類的平均硬度讀值相等,即尖銳物種類不會影響平均硬度讀值(即尖銳物對平均硬度無

18、效)。8.4二因子變異數分析 (Two-way ANOVA)在上述一因子變異數分析和集區隨機設計中,均研究一 個因子對依變量所造成的影響,將此觀念擴展至二因子時, 此研究架構即為 二因子變異數分析。在進行二因子變異數分析時,須考因子間是否對依變數有 交互作用(Interaction),此作用不存在,則變異數分析的結構 較簡單,則二個因子對依變量的影響可分開研究;倘此作用存在,則變異數分析的結構較複雜,則二個因子對依變量的 影響須置於一起討論。考慮一般情況,令 yjk為A因子在第 i個水準(i = 1, 2,、B)因子在第j個水準(j = 1, 2,、)在第k次重複(k = 1, 2,),時所觀

19、測到的反應值。如下:y2bi ,y2b2 ,2bnB因子12bA1ym , yii2,yny121 , y122 ,12ny1b1 , y1b2,y)n因2 1y211 , y212 , ,21ny221 , y222 ,22ny2b1 , y2b2 ,y)n子aya11 , ya12 ,ynya21 , ya22 ,ynyab1 , yab2 ,abn總變異=A因子變異+ B因子變異+ AB因子交互變異 +隨機誤差變異來源平方和SS自由度df均方和MSF因子ASSAa-1MSA=SSA/(a-1)MSA/MSE因子BSSBb-1MSB=SSB/(b-1)MSB/MSE交互作用SSAB(a-1

20、)(b-1)MSAB=SSAB/(a-1)(b-1)MSAB/MSE隨機誤差SSEab(n-1)MSE=SSE/ab(n-1)總和SSabn-1MS=SS/(abn-1)其中:ss=Mk -yj2ab=bnan(yJI 土J ±a ba b n+ n:(ygy5y* yJ2:二(yjk yi2i 去 J 去i 土 j ± k ±=SST + SSB+ SSAB+ SSE(8.13)簡化之:SS =a b n' 'y2k-y:I ± j 生k ±丿 abn ;SSA =丄bna' y2/y:”/abn1:1SSB =1 C

21、 2y-y二/abn;Subtotal =1 a by:厂y;,/abnan j±n y j±SSAB=Subtotal-SSA-SSBSSE =SS -Subtotal(8.14)在進行二因子變異分析時, 一般是先檢定交互作用存在與 否,倘接受Ho:交互作用不存在,則二因子變異分析的架構 可簡化之,此時再繼續進行 A、B因子效果檢定假設才有意義。若拒絕Ho,則無論A、B因子效果檢定的結果為何,交 互作用都會保留在模式中,此已認定A、B因子會對依變量造成影響。二因子變異分析三階段檢定過程:(1)檢定交互作用是否存在:統計假設為Ho:交互作用不存在。Hi :交互作用存在。若H

22、o為真,即表示A、B因子未對依變數產生交叉影響。檢定統計式:F = MSAB/MSE(8.15)倘F - F:,(a-i)(b-i), ab(n-i)二二 Accept HoF > F a, (a-1)(b-1), ab(n-1)= Reject H 0(2) 檢定A因子是否影響依變量:假設已作出交互作用不存在,則分別檢定二因子對依變量的影響。統計假設為H。:片=冷=冷,j = 1, 2,; ,bH 1: lij宀,,aj不全相等。若Ho為真,即表示 A因子未對依變數產生影響。檢定統 計式:F = MSA/MSE(8.16)倘F ' F , (a-i), ab(n-1) = =

23、Accept HoF > F : , (a-1), ab(n-1) = = Reject H 0(3) 檢定B因子是否影響依變量:檢定B因子對依變量的影 響。統計假設為Ho:片1=片2 = Hb , i = 1, 2,aH1: i1 ,和2,,ib不全相等。若H。為真,即表示B因子未對依變數產生影響。檢定統 計式:F = MSB/MSE(8.17)電池設計實驗倘F S F : , (b-1), ab(n-1) = = Accept H0溫度CF)材料種類1570125F > F :, (b-1), ab(n-1) = = Reject H 011301553440207074180

24、8075825821501883612225701591261061155845313811074120961041681601501398260ANOV A for Battery Life Data變源SSDOFMSFP-值臨界值樣本10683.7222225341.861117.9113722690.001976083.35413119欄39118.72222219559.361128.967691951.9086E-073.35413119交互作用9613.77777842403.444443.55953540.018611162.72776645組內18230.7527675.212

25、963總和77646.9722235v A由ANOVA表示,Fog 4, 27 = 2.72 ,則材料種類與溫度之 間有顯著性,再者,Fog 2, 27 = 3.35,則材料種類與溫度之主 效果亦有顯著性。為解釋實驗的結果,構建各處理組合下平 均反應圖,由圖5-9所示,結論如下+ Material Type 亠 Material Type Material TypeTemp. (Degree F)材料種類 -溫度之反應圖由直線缺乏平行性質視出顯著的交互作用,不論材料種類,低溫會得到較長的壽命,如要求溫度變化時,其電池有效壽命折損較小,則材料種 類 3 的表現似最佳。高中低貨品陳架(二因子-位置

26、與高度)與銷售量、 -7* 刖面359560雙因子變異數分析:重複試驗4510055258070摘要高中低總和409050、 -7* 刖面3011070個數55515後面659030總和1754753059556510525平均35956163.75510035變異數62.512580723.1609040759540後面個數55515總和320480170970平均64963464.7變異數5542.542.5726.7總和個數101010總和495955475平均49.595.547.5變異數285.83374.7256.9ANOVA變源SSdfMSFP-值臨界值樣本(前後)7.517.5

27、0.110.744.25968欄(高度)14746.727373.331099E-133.40283交互作用392021960294E-073.40283組內16302467.92總和20304.229高中低、 -7* 刖面359561後面649634習題1. 以下有數個一因子變異數分析的例子,針對各個例子找出其因子,因子 水準以及因變量:(a) 某家汽車零件公司主要是製造三種汽車零件:輪胎、煞車、排氣管;每一種零件各設置一個銷售來負責銷售。公司高層人員想要研究這三種零件的銷售網每月的營業額是否相同。(因子:汽車零件;因子水準:輪胎、煞車、排氣管;因變量:每月的營 業額)(b) 稅捐稽徵處想要

28、研究在台北市三種職業(大學教授、電腦工程師、房地產仲介業者)年收入的狀況。研究人員從臺北市抽出一千人,以這 些樣本來推斷這三種職業的年收入是否相同。(因子:職業種類;因子水準:大學教授、電腦工程師、房地產仲介業者; 因變量:年收入)(c) 某研究是研究不同溫度下木材的抗壓能力,研究人員設定了三種溫 度:0C、25C、50C,他們想要知道在這三種溫度之下,木材的抗 壓能力是否會不同。(因子:溫度;因子水準:0°C、25C、50 C;因變量:木材的抗壓能力)2. 致遠管理學院工管系想要研究不同的教學方式對學習成果所造成的影響。研究人員隨機選出 15位大一新生同學,並將之分為三組。第一組

29、用教學錄影帶來教授學生, 第二組採用傳統的課堂教學方式,第三組僅授予講義,由學生自行研讀。一學期後,對這三組學生進行測驗,以下 是測驗的成績:樣本 教學方式 ,12345錄影教學8682947786課堂教學9079888796講義教學7870657463(a) 寫出ANOVA表。(b) 在顯著水準:=0.05下,不同的教學方式是否對學習成果會造成影 響?請寫出你的檢定程序。變異來源平方和SS丨自由度df |均方和MS F因子水準930246512.13誤左4601238.3臨界值總和1390143.89Reject Ho =.不同的教學方式是對學習成果會造成影響。3. 某電器公司將研發的新產品

30、(收音機)委託四家工廠製造,為了測試這四 家工廠製造收音機品質,研究人員分別由四家工廠的生產線上各抽出台 收音機,將收音機的音量開到最大,並記錄它們的使用期限,以下便是測試的結果:(單位為月)樣本 工廠7、.123456一廠5.55.05.25.34.84.8二廠4.73.94.34.54.14.3三廠6.15.75.05.35.26.3四廠4.55.14.34.14.55.1(a) 寫出ANOVA表。(b) 在顯著水準 =0.05 下,這四家工廠所製造的收音機品質是否一樣請寫出你的檢定程序。變異來源平方和SS自由度df均方和MSF因子水準5.8831.9612.98誤左3.02200.15臨

31、界值總和8.90233.10Reject Ho =二這四家工廠所製造的收音機品質不一樣。4. 一位食品研究人員想要研究蛋糕中乳酪的含量是否會影響蛋糕的體積;他調配了 10公克、20公克、30公克三種乳酪含量,將它們置入原料中 再烘烤成蛋糕,並測量蛋糕的體積。研究人員烘烤了21個蛋糕,每種乳酪含量各烘烤7個蛋糕,以下是所得的資料:樣本重量、123456710公克38739640140539839139320公克39039438139040240339130公克398401405380391394395(a) 寫出ANOVA表。(b) 在顯著水準 =0.05下,乳酪含量是否會影響到蛋糕體積 ?請寫

32、出你的檢定程序。變異來源平方和SS自由度df均方和MSF因子水準29.4214.70.28誤差959.71853.3臨界值總和989.1206.01Accept Ho=乳酪含量不會影響到蛋糕體積。5. 一家廚具公司代理了三家廠牌的電子鍋,這三種電子鍋的品質、 價格其實相差並不大,不過為了解顧客對廠牌的喜好狀況,該公司想要比較這三種電子鍋的銷售狀況。研究人員選了六家廚具販賣店,並調查在這六 家商店中三種電子鍋的銷售量,以下變是調查的結果:(單位為百元)。商店廠牌商店一商店二商店三商店四商店五商店六廠牌一216117692748178228303183廠牌二23791913111912081962

33、1689廠牌三14791024159896319132251這是一個隨機集區化的變異數分析,請回答以下問題:(a)在這個分析中,何者為因子(電子鍋的廠牌)?何者集區(販賣電子鍋的商家)?請加以解釋。(b)寫出ANOVA表。(c)在顯著水準=0.05下,這三種電子鍋的銷售量是否一樣 ?請寫出你的檢定程序。變異來源平方和SS自由度df均方和MSF因子水準25700562128502874.47集區24077485誤差175254210仃5254臨界值總和6730345177.56Reject Ho =這三種廠牌電子鍋的銷售量是不一樣6.以下是水果茶銷售的實際觀測資料:賣場j 顏色i、12345粉紅126.528.725.129.127.2橙色231.228.330.827.929.6淡紫327.925.128.524.226.5墨綠430.829.632.431.732.8這是一項集區隨機化的實驗設計,依顏色的不同,所有賣場(集區)的水果茶銷售量被分類為四組,由於每一種顏色的水果茶皆設置了五個賣場 在販售。因此,在每種顏色之下皆有五個實際銷售量。銷售量是以萬元作 為單元。(a) 請列出變異數分析表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论