假说检定简介--推理性统计学的目的_第1页
假说检定简介--推理性统计学的目的_第2页
假说检定简介--推理性统计学的目的_第3页
假说检定简介--推理性统计学的目的_第4页
假说检定简介--推理性统计学的目的_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、A4 - 假說檢定簡介假說檢定簡介(Introduction to Hypothesis Testing)q介紹統計學假設檢定的概念介紹統計學假設檢定的概念q定義虛無假設和對立假設定義虛無假設和對立假設q展示建構假設檢定的方法展示建構假設檢定的方法q爲給定問題選擇適當的假設檢定方法提供路徑圖爲給定問題選擇適當的假設檢定方法提供路徑圖 章節目的與用途章節目的與用途115分析階段分析階段: 可能取得的成果可能取得的成果HGFEDCBA87654321HGFEDCBA87654321BMG6Breakthrough Management GroupBlueprint for Breakthrough

2、SIZEFSCM NODWG NOREVA1SCALE1 : 1SHEET3 OF 5q專案回顧和第一次課程其餘成果專案回顧和第一次課程其餘成果 q確定變異來源確定變異來源: 探測性資料分析探測性資料分析 m應用工具應用工具: FMEA 和用和用 Excel操縱資料操縱資料 m圖表技巧圖表技巧 q確定變異來源確定變異來源: 統計分析統計分析 m信賴區間信賴區間m假設檢定假設檢定與樣本大小與樣本大小 m中心趨勢中心趨勢 q確定變異來源確定變異來源: 變異數分析變異數分析 q實驗設計實驗設計( DOE)規劃規劃 q完成階段總結完成階段總結 m結論結論, 問題和下階段任務問題和下階段任務 116利用

3、資料加深對製程的瞭解利用資料加深對製程的瞭解q在在6 Sigma 專案進行中常遇到的問題專案進行中常遇到的問題 :m改變該改變該 X 能帶來能帶來 Y的改變嗎的改變嗎? 即即 Y=f(X)的具體關係是什麽的具體關係是什麽?m我對的位置、散佈、形狀及一致性是否具有正確的瞭解我對的位置、散佈、形狀及一致性是否具有正確的瞭解?q利用下列條件可回答上述問題利用下列條件可回答上述問題:m基於對流程的瞭解所作的假設基於對流程的瞭解所作的假設:q設計目的設計目的q以往性能指以往性能指標標的的測測量量結結果果m即時資料即時資料 (測量階段收集到的測量階段收集到的)q有新資料時當前假設可能會改變有新資料時當前假

4、設可能會改變117前後混淆前後混淆 (Mixing the Past and Presentq資料本身的資料本身的“雜音雜音”會造成麻煩會造成麻煩m可能有不同的結果可能有不同的結果m資料可能提示發生了一些變化而實際上並未發生資料可能提示發生了一些變化而實際上並未發生m資料可能未提示發生了變化而實際上已發生了資料可能未提示發生了變化而實際上已發生了q在提示某些改變已發生時在提示某些改變已發生時, 除非即時資料很有說服力除非即時資料很有說服力, 否則否則原始假設原始假設依然成立依然成立 012345678910一個一個“公平公平”的硬幣正面向上的次數的硬幣正面向上的次數118用資料檢查我們的瞭解程

5、度用資料檢查我們的瞭解程度:實例實例q考慮如下情形考慮如下情形: 在量測階段搜集到以下資料在量測階段搜集到以下資料. 其中周期時間爲輸出變數其中周期時間爲輸出變數, 每日的每日的時間爲輸入變數時間爲輸入變數.q由以往經驗及製程負責人的印象中,周期時間可能有所不同對每一日而言由以往經驗及製程負責人的印象中,周期時間可能有所不同對每一日而言. 資資料顯示在下列圖表中料顯示在下列圖表中:050100150Cycle TimeCycle Time By Time of DayTime Of DayEarly AMEarly PMLate AMLate PM可以由此證明周期時間與每日時可以由此證明周期時

6、間與每日時間有關連嗎間有關連嗎?這份資料是否來自每日時間影響這份資料是否來自每日時間影響不大的製程不大的製程?有多少證據才能作結論有多少證據才能作結論?周期時間與每日時間的關係時間晚上晚上上午上午 下午下午早晨早晨周期時間119一個結合前後的策略一個結合前後的策略q清楚瞭解製程能力的預定條件清楚瞭解製程能力的預定條件m製程平均周期製程平均周期 = 90 分鐘分鐘m製程輸出變數服從常態分佈製程輸出變數服從常態分佈m周期間與每日時間無關周期間與每日時間無關q考慮預設條件成立時考慮預設條件成立時“即時即時”資料的分佈像什麽樣資料的分佈像什麽樣m十個周期的平均時間應在十個周期的平均時間應在84-96分

7、分m頻率分佈曲線應是對稱的頻率分佈曲線應是對稱的m各不同時間的平均周期應大約是各不同時間的平均周期應大約是90 分鐘分鐘q搜集資料並計算相應統計資料搜集資料並計算相應統計資料. 如如“即時即時”資料與預期不符資料與預期不符, 改變預定條件改變預定條件 例如例如:q假設製程平均周期應是假設製程平均周期應是90 分鐘分鐘.q十個周期的平均時間應在十個周期的平均時間應在84-96分分q一套十個周期時間的一套十個周期時間的“即時即時”樣本平均值是樣本平均值是.q 94.3 分維持假設不變分維持假設不變q 97.6 分結論是周期時間增加了分結論是周期時間增加了120什麼是假設檢定什麼是假設檢定?q假設檢

8、定只是把實際情況與假設相比較假設檢定只是把實際情況與假設相比較, 並試圖知道並試圖知道, “情況變了情況變了嗎嗎?” 或或q假設檢定驗證實際資料是否與模型相符假設檢定驗證實際資料是否與模型相符 或或q假設檢定比較統計資料和假設陳述是否一致假設檢定比較統計資料和假設陳述是否一致121假設檢定要旨假設檢定要旨q由資料計算出一個相關指標由資料計算出一個相關指標(或統計數位或統計數位)用於把一個特定的假設用於把一個特定的假設(虛無假設虛無假設)與某個對立假設相比與某個對立假設相比.q把該指標與一個參考分佈函數比較把該指標與一個參考分佈函數比較. 後者顯示如果虛無假設成立後者顯示如果虛無假設成立時該指標

9、會服從何種分佈時該指標會服從何種分佈.q計算如虛無假設成立時出現不小於所觀測到的區別的機率計算如虛無假設成立時出現不小於所觀測到的區別的機率.m該機率稱爲顯著該機率稱爲顯著.m如該機率很小如該機率很小, 虛無假設不成立虛無假設不成立. 我們因而斷言觀察到一個統我們因而斷言觀察到一個統計學上的顯著區別計學上的顯著區別.122q樣本統計數樣本統計數m樣本平均數樣本平均數 m標準標準差的估差的估計數計數 s回顧回顧: 母體與樣本母體與樣本q母體統計數母體統計數m平平均均數數 m mm標準標準差差 _ _x x母體母體 希望從中希望從中推斷某些特性的推斷某些特性的總的集合總的集合 樣本樣本 從其中實從

10、其中實際搜集資料的集際搜集資料的集合合123母體值與樣本統計數母體值與樣本統計數母體參數母體參數 樣本參數樣本參數 平均數平均數m m標準差標準差 s比例比例(百分比百分比)PpX上帝所知道的上帝所知道的我我們測們測量到的量到的124推論性統計學的目的推論性統計學的目的q目的目的:m由樣本測量結果獲取關於由樣本測量結果獲取關於母體母體的結論的結論(推論結果推論結果)q關於母體的事實關於母體的事實m母體有固定的參數母體有固定的參數,且只有上帝才知道且只有上帝才知道m統計學是關於由樣本資料猜測上帝所知道的參數的科學統計學是關於由樣本資料猜測上帝所知道的參數的科學 q我們在搜集資料前的初始猜測稱爲假

11、設我們在搜集資料前的初始猜測稱爲假設125假假設設 (Hypotheses)q假設假設 :m假設是關於假設是關於母體參數母體參數的敘述的敘述, 而不是關於樣本的敘述而不是關於樣本的敘述.q虛無假設虛無假設:(The Null Hypothesis)m簡稱為簡稱為 H0m通常通常 H0 敘述的敘述的是是 無效果無效果 或或 無差別無差別m我們基於統計證據拒絕或不能拒絕我們基於統計證據拒絕或不能拒絕H0 q對立假設:對立假設:(The Alternative Hypothesis)m簡稱為簡稱為 Ha m關於母體參數的關於母體參數的,在在H0被拒被拒絕時可以成立的敘述絕時可以成立的敘述126關於處

12、理訂單的假設關於處理訂單的假設q由於需求增加且公司要保持人手不變由於需求增加且公司要保持人手不變, 需要減少處理訂單的時間需要減少處理訂單的時間. 爲減少處理訂單周期時間爲減少處理訂單周期時間, 對處理流程和表格進行了改進對處理流程和表格進行了改進. 在改在改進以前的樣本平均處理時間是進以前的樣本平均處理時間是125 分鐘分鐘,改進後則變成改進後則變成 118 分鐘分鐘.qH0 的的一般陳述一般陳述是什是什麼麼? m新舊製程的平均處理時間新舊製程的平均處理時間沒有區別沒有區別qH0 的的統計術語是什麽統計術語是什麽?mm m新新 = m m舊舊qHa的的一般陳一般陳述是什述是什麼麼? ? m新

13、製程的平均處理時間比新製程的平均處理時間比舊製程快舊製程快 qHa的的統計學術語是什麽統計學術語是什麽?mm m新新 m m舊舊127另一個假設的實例另一個假設的實例q關於一種試驗性抗精神病藥物的性能的檢定關於一種試驗性抗精神病藥物的性能的檢定: 老鼠服用新藥的平老鼠服用新藥的平均防休克效果和標準藥物一樣嗎均防休克效果和標準藥物一樣嗎? qH0的的一般陳一般陳述是什述是什麼麼? m試驗性藥物和標準藥物的試驗性藥物和標準藥物的效果沒有區別效果沒有區別qH0 的的統計術語是什麽統計術語是什麽?mm m試驗試驗 = m m標準標準qHa的的一般陳一般陳述是什述是什麼麼?m老鼠服用試驗性藥物後會老鼠服

14、用試驗性藥物後會有不同效果有不同效果qHa的的統計術語是什麽統計術語是什麽?mm m試驗試驗 m m標準標準128再一個關於假設的實例再一個關於假設的實例q與標準設計與標準設計(元件元件2)相比新設計的內毒素凝脂加熱元件相比新設計的內毒素凝脂加熱元件(元件元件1)的的溫度變異程度怎樣溫度變異程度怎樣? qH0 的的一般陳一般陳述是什述是什麼麼? m元件元件1和和2的溫度變異程度的溫度變異程度沒有區別沒有區別qH0 的的統計術語述是什麽統計術語述是什麽?m 2 21 = 2 22qHa的的一般陳一般陳述是什述是什麼麼?m元件元件1和和2的溫度變異程度的溫度變異程度有區別有區別qHa的的統計術語是

15、什麽統計術語是什麽?m 2 21 2 22129最後一個關於假設的實例最後一個關於假設的實例q在最近的一次總統選舉中在最近的一次總統選舉中, 42% 的選舉人投選民主黨候選人的選舉人投選民主黨候選人. 對對100 個報紙記者的調查發現個報紙記者的調查發現 71% 的人選民主黨的人選民主黨. 記者和一般公記者和一般公衆的政治傾向有區別嗎衆的政治傾向有區別嗎?qH0 的的一般陳一般陳述是什述是什麼麼? m公衆和記者選舉民主黨的公衆和記者選舉民主黨的比例一樣比例一樣qH0 的的統計術語是什麽統計術語是什麽?mP公衆公衆= P記者記者qHa的的一般陳一般陳述是什述是什麼麼?m記者中選舉民主黨的比例比記

16、者中選舉民主黨的比例比一般公衆高一般公衆高qHa的的統計術語是什麽統計術語是什麽?mP公衆公衆 P記者記者130法庭法則法庭法則 (Order in the Count)q假設檢定與美國法律系統很接假設檢定與美國法律系統很接近近,在判定一個人有罪前要先假在判定一個人有罪前要先假設無罪設無罪mH0:被告人無罪被告人無罪 (預定預定) mHa:被告人有罪被告人有罪 (必須證明必須證明 )?未犯罪有犯罪未犯罪判決正確判決正確罪犯獲無罪罪犯獲無罪判決判決有犯罪無辜者被判無辜者被判有罪有罪判決正確判決正確真實情況判決131假設檢定的誤差假設檢定的誤差q型型誤誤差差 (Type error) m虛無假設實

17、際成立時拒絕它虛無假設實際成立時拒絕它m也被稱爲生產者的誤差也被稱爲生產者的誤差m型型誤差的機率由誤差的機率由a (0 a 1)a (0 a 1) 表示表示q型型誤誤差差 (Type error) m虛無假設實際不成立時承認它虛無假設實際不成立時承認它m也被稱爲消費者的誤差也被稱爲消費者的誤差m型型誤差的機率由誤差的機率由b (0 b 1)b (0 b 1)表示表示H oH oH aH aH oH o決定正確決定正確 型型誤差誤差H aH a型誤差型誤差 決定正確決定正確實際情況實際情況所作結論所作結論132假設檢定流程圖假設檢定流程圖陳述虛無假設和對立假設陳述虛無假設和對立假設虛無假設虛無假

18、設 H0: 無區無區别别對立假設對立假設 Ha: 有有區區别别 ()設定信賴度設定信賴度(選定選定 a a)通常是通常是 95% (a a = 0.05)選擇適當檢定方法選擇適當檢定方法資料是什麽類型的資料是什麽類型的? 連續型的還是不連續型的連續型的還是不連續型的? 是平均數是平均數,標準差標準差, 還是個數還是個數? 資料有幾套資料有幾套?設定設定 b b 並計算樣本大小並計算樣本大小如樣本大小固定如樣本大小固定, 由固定的樣本大小計算由固定的樣本大小計算區別能力區別能力(power: 1- b b).搜集資料並用搜集資料並用 Minitab分析分析進行檢定進行檢定. 搜集資料搜集資料.

19、用用Minitab 分析分析.由由 a a 解釋解釋 p 值值.轉化爲實際問題並確認轉化爲實際問題並確認承承認認H0的意思是什的意思是什麼麼? ? 承承認認Ha的意思又的意思又是什是什麼麼? ? 最最後實施後實施前加以前加以確認確認133選擇適當檢定方法的標準選擇適當檢定方法的標準q資料類型資料類型 m連續型變數連續型變數m不連續型變數不連續型變數q給定輸入變數的資料類給定輸入變數的資料類型型m一一m二二m超超過過二二q分佈類型分佈類型m常態常態 m非常態非常態q檢定方法檢定方法m平平均均數數m中位中位數數m變異數變異數m個數個數m比例比例134實例實例 假設檢定設置假設檢定設置q過去幾年過去

20、幾年,一個農夫的肉牛宰殺前平均重量是一個農夫的肉牛宰殺前平均重量是 380 磅磅. 今年今年, 隨機隨機選取了選取了50隻肉牛隻肉牛, 並用新飼料餵食以期增加重量並用新飼料餵食以期增加重量. 陳述虛無假設和對立假設陳述虛無假設和對立假設 H0: 新的一新的一組肉牛的組肉牛的重量與標準組無區別重量與標準組無區別 m m新新 = m m標準標準 Ha: 這這 50個肉牛個肉牛在宰殺時的重量超過標準組在宰殺時的重量超過標準組m m新新 m m標準標準 設定信賴度設定信賴度(選定選定 a a)選擇適當檢驗方法選擇適當檢驗方法通常是 95% (a = 0.05)由由路徑圖路徑圖: 1 : 1 樣樣本本 t- t-檢定檢定 (1- (1-Sampl

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论