




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第八章 假設之檢定與信賴區間 陳順宇 教授胜利大學統計系 統 計 區 間 估 計 一 組 樣 本 二 組 樣 本 點 估 計 多 組 樣 本 檢 定 估 計 推 論 統 計 敘 述 統 計 (包 括 統 計 圖 表 , 統 計 量 ) 8.1 假設檢定之簡介假設檢定之簡介 某人聲稱他有超才干, 能猜中一銅板擲出的結果 是正面還是反面, 究竟他是吹牛或真有超才干,統計便是一種科學的驗證方法 我們試圖去置信某種說法,或是反駁它。 例如:有一說法是這樣的, 用手指月亮的人,隔天耳朵會被割傷, 另有一說法是, 早晨量身高會比晚上量的來的高, 這些說法能否正確,有待確認, 統計做驗證的例子 (1) 驗證
2、某生產線生產的洋芋片厚度 能否已偏離目標值? (第8章) (2) 驗證某種藥能否有效?(第8章) (3) 驗證甲教學法能否比乙教學法效果好? (第9章) (4) 驗證某地區男、女生的平均所得 能否有差異? (第9章) (5)驗證某公司品管人員提出的改善战略 能否有效? (即改善战略能否有降低不良率的效 果?)(第10章) (6)驗證兩條生產線(或兩家公司)某產品的 良率能否有差異? (第10章) (7) 驗證某骰子能否公正? (第11章) (8) 驗證某地區男、女生的教育程度 (分成國中以下、高中、大專以上) 能否有差異? (第11章) (9)驗證甲、乙、丙3種肥料對蕃茄產量的 影響能否有差異
3、? (即肥料能否為影響蕃茄產量要因) (第12章) (10)驗證爐溫與壓力對鋼硬度的影響 能否有交互作用?能否有主成效? (第12章)假設檢定假設檢定假設假設(Hypothesis)(Hypothesis)是一種說法,是一種說法, 或或是一種傳說,是一種傳說,它是對或是錯,需求經過驗證,它是對或是錯,需求經過驗證, 統計上稱驗證為檢定統計上稱驗證為檢定(Testing)(Testing)。 例如有一種說法, 抽菸的男人比不抽菸的男人容易患肺癌, 這樣的說法是真是假? 有待證明。表表8.1 8.1 抽菸與患肺癌人數表抽菸與患肺癌人數表 抽菸組 未抽菸組 人數 2000000 6000000 患肺
4、癌人數 24000 48000 抽菸組患肺癌比例顯然高於未抽菸組患肺癌比例 抽菸組 未抽菸組 患 肺 癌 人 數 24000 48000 未患肺癌人數 1976000 5952000 人 數 2000000 6000000 表表8.2 8.2 抽樣的抽菸與抽樣的抽菸與患肺癌人數統計表患肺癌人數統計表 抽抽菸菸組組 未未抽抽菸菸組組 抽樣人數 300 700 患肺癌人數 3 4 要断定抽菸者患肺癌比例比未抽菸者高的說法正確與否就有困難計算出抽菸組患肺癌樣本比例 01. 030031p 未抽菸組患肺癌樣本比例為 0057. 070042p 因為 (1)樣本不能代表母體。(2)再重抽一次樣本能够得到
5、不同的比例。 抽樣誤差存在,有判斷錯誤機會 由於有抽樣誤差存在, 因此就有判斷錯誤, 這種判錯又分成二種狀況,型型I錯誤錯誤 一種是說法不正確 (即抽不抽菸對患肺癌沒有影響), 但由於抽樣結果判它正確, 這種型態的錯誤稱為型I錯誤;型型II錯誤錯誤 另一種是說法正確 (即抽菸較易患肺癌), 但由抽樣的資料判它不正確, 這種型態的錯誤稱為型II錯誤。 統計學家的任务就是想辦法使 犯這二種錯誤的機會降至最低。 8.2 檢定觀念及名詞介紹檢定觀念及名詞介紹 統味公司生產飲料, 其說明書上聲稱其容量平均是250cc, 有位顧客打電話向消費者基金會埋怨說:此公司的飲料容量平均不到250cc, 消費者基金
6、會如何 利用統計方法解決此紛爭呢? 抽樣50筆資料 252.0 251.2 252.6 251.4 253.0 245.7 249.2 248.7 251.2 252.4 246.1 250.1 250.4 249.1 248.4 251.9 248.5 246.1 250.8 249.0 249.1 247.3 249.5 250.9 251.6 249.3 251.6 247.5 251.2 249.7 247.5 248.9 250.4 247.2 247.3 248.9 248.3 250.2 249.1 248.6 249.2 248.8 247.8 247.3 250.0 250.
7、1 250.3 249.7 248.6 249.4 250.5 251.0 249.5 249.4 250.1 249.8 248.8 246.9 247.6 251.2 251.5 244.6 251.1 250.5 252.2 248.3 253.4 249.6 251.3 247.7 249.6 248.2 246.9 249.7 245.9 254.2 249.5 247.0 248.2 249.0 250.8 249.7 248.3 249.1 250.6 248.9 252.4 249.5 252.5 247.5 251.3 247.3 251.0 253.7 249.3 252.
8、3 247.6 249.3 252.7 247.9 算出這瓶資料樣本平均數 及樣本標準差 能否因 就說此公司的說明書有問題呢? 58.249x8972. 1s58.249x比250小 銅板實驗 假設有一銅板,連擲十次, 結果出現正面6次、反面4次, 我們能否就要懷疑此銅板不公正呢? 這個實驗讓我們聯想到 理論與實驗的結果並不見得 是完全一致的,常會有一些偏向。1.虛無假設 H0: m=250 H0: p=0.5 2.對立假設 H1: m 250 單尾檢定 H1: p 0.5 雙尾檢定 3.型I錯誤及型II錯誤 型型I I錯誤錯誤(H0(H0是對的,但誤判是對的,但誤判H0H0是錯是錯) ) 型
9、型IIII錯誤錯誤( (即即H0H0是錯的,但被誤判是錯的,但被誤判H0H0為對為對) ) 型型I I錯誤錯誤 假設所擲銅板是公正的, 但某人連擲10次都出現正面, 因此依據判斷準則,就断定H0是錯的 型型IIII錯誤錯誤 假設我們拿到另一個銅板, 它出現正面的機會是0.3, 但擲10次卻出現5次正面、5次反面, 因此断定H0是真(即此銅板是公正銅板) 統計檢定與法官判罪 法官判 無罪 有罪 無罪 o I 嫌真 疑 犯正 有罪 II o 4.顯著水準 型型I I誤差誤差 : :犯型犯型I I錯誤的機率錯誤的機率 型型IIII誤差誤差 : :型型IIII錯誤的機率錯誤的機率 控制好型控制好型I
10、I誤差,誤差, 使其不超過某種水準使其不超過某種水準( (通常訂為通常訂為5%)5%), 此水準也稱為顯著水準此水準也稱為顯著水準 法官判罪我們再以法官判罪為例做說明,假使某國家認為法官犯型I錯誤 (即無罪的嫌疑犯卻被判成有罪), 這種誤判嚴重影響國民權益, 法官如犯了此種錯誤就要被免職, 而另一方面有罪卻被判無罪的話, 法官只被罰小錢了事。 那麼法官為了防止遭到免職處分, 他可以將一切疑犯判無罪, 這樣犯型I錯誤的機會等於0, 但相對的型II誤差就增多了。8.3 棄卻域棄卻域 (reject region beyond critical value) 判對立假設為真的樣本區域就稱為 棄卻域
11、即棄卻域就是最正确檢定 認為假设樣本資料所算出統計量落在這個範圍時,就要棄卻H0(即認為H0是錯的), 也就是棄卻域是棄卻H0的區域 當抽樣所得的樣本平均數太小時,會懷疑公司所言不實 棄卻域為 c 的型式 xcritical value=cIt is left tail, because RR is left (less than) c 由型I誤差的定義得: 型I誤差= P(判H0為錯誤| H0為真) (8.1) 因此 型I誤差= P(棄卻域| H0為真) = P(250|cX) = ncnXP/250/250 (8.2) 為了說明起見,假設每瓶飲料的母體標準差已知為=2,(此種假設在實務上不
12、太合理,但姑且信之,後面再討論未知的處理情形),則由(8.2)式得型 I 誤差為: 型 I 誤差= 100/2250100/2250cXP = 100/2250cZP (8.3) 型I誤差 05. 0 05. 0)1002250(cZP05. 0)1002250(cZP取等於 0.05 時 圖 8.1 常態分配左尾棄卻域之決定 z critical value=cIt is left tail (single tail), because RR is left (less than) c645. 1100225005. 0zc-Z0.05=-1.645 (查表)c =671.249100264
13、5. 1250 也就是棄卻域 671.249x1. 顯著水準對檢定結論的影響:如顯著水準改訂為 =0.01 時,結論又如何呢? 仿照上面算法得棄卻域的臨界點 c 為 100201. 0250zc 1002326. 22505348.249 因 100 筆資料所得58.249x不落在棄卻域內, 導致下0H 是不顯著的結論。所以0H顯著與否, 與所訂的顯著水準有密切關係 2. 顯著水準a愈小愈保護虛無假設 在顯著水準a=0.05時,判H0顯著, a=0.01時,判H0不顯著, 可以看出顯著水準訂的愈小時, H0愈能够不顯著,也就是a愈小愈保護H0。P 值 但由於電腦的發達,普通電腦統計套裝軟體都會
14、印出 P 值(Probability Value)。 P 值的定義是在什麼樣的顯著水準a, 算出棄卻域的臨界點c剛好是 樣本統計量,也就是剛好使H0顯著 ?剛好顯著 當=0.05 算出 c =249.67 下顯著的結論。 當=0.04 算出 c =249.65 下顯著的結論。 當=0.01算出 c =249.53 下不顯著結論 當= ? 算出 c =249.58 剛好顯著。 P值可以下式求得P值 )250|58.249(XP P值 =250|58.249XP 100/225058.249100/2250XP 1 . 2ZP 0179. 0 求棄卻域 cx 的臨界點 c,是給(=0.05)求 c
15、 滿足 05. 0)250|(cXP 而求P值,是給)58.249(c求機率=? 即求 ?)250|58.249(XP 算出值後,檢定的結論就可以用所訂的顯著水準與p值做比較。 當P值 時,H0是不顯著的 記住P值很小時就表示H0是顯著的 但究竟值要小到什麼程度 才表示是顯著呢? P值與顯著水準 a比較 (i)假设P值0.1,則下H0是不顯著的結論, (iii)假设0.01P值 0.05 所以是顯著,有證據說此袋中白球所佔比例不到 0.5 P值=)100(XP =)(1000kXPk =3005 . 01003009930013000300 9100074. 4 利用中央極限定理求近似值 P值
16、=)100(XP =5 . 05 . 03005 . 05 . 03001005 . 05 . 03005 . 0300XP =6603. 85 .49ZP = )7157. 5(ZP 0 例例8.2、 擲一銅板100次, 結果出現正面49次, 能否有證據說此銅板不公正? 檢定檢定5 . 0:5 . 0:10pHpH因此沒有足夠證據說此銅板不公正 P值 =)51()49(XPXP = )50(1XP = 150100 (0.5) 100 = 10.080 = 0.92 8.4 母體平均數的檢定母體平均數的檢定(母體標準差母體標準差 知時知時) 0100:HH0100:HH0100:HH1.大樣
17、本且s知的情形 2/|zz nxz/0在對立假設是雙尾,H1: m m02/|zz 對立假設是左尾H1: m m0 z m0 z z 表8.4 標準差知時有關平均數的檢定問題 型式 假設 檢定統計量 棄卻域 雙尾 0100:HH 2/|zz 左尾 0100:HH nxz/0 zz 右尾 0100:HH zz 背下來背下來例例8.4飲料問題飲料問題 對於上述飲料問題, 假设公司在廣告中宣稱平均容量是250cc, 但品管部門懷疑公司飲料容量 平均能够不是250cc, 假设搜集100筆資料得 品管部門的懷疑能否正確? x=250.3,而已知=2 檢定檢定250:250:10HH5 . 1100/22
18、503 .250z 所以是不顯著的, 即沒有證據說此公司飲料 平均容量不是250cc, 也就是行銷部門所懷疑 飲料容量平均不只250cc是證據缺乏 查表 z0.025 = 1.96,因 2zz 例例8.5、 要檢定某年全國每戶平均申報所得稅 能否高於75萬元? 搜集到81戶,得樣本平均數78萬元, 假设知全國標準差15萬元, (此由上一年全國申報所得稅算出, 並假設這兩年所得稅的標準差一样)。 試問能否有證據說全國每戶 平均申報所得稅高於75萬元? 檢定檢定75:75:10HH所以是顯著的,即有證據說全國平均申報所得稅高於75萬元 8 . 1811575780nxz 母體平均數的檢定母體平均數
19、的檢定(母體標準差母體標準差未知時未知時) nsxt/0表表8.5 8.5 標準差標準差未知時,未知時,有關平均數有關平均數的檢定問題的檢定問題 型式 假設 檢定統計量 棄卻域 雙尾 0100:HH nSXt/0 2/, 1|ntt 左尾 0100:HH 其中s為樣本標準差 , 1ntt 右尾 0100:HH , 1ntt 例例8.6、 再以飲料為例,假设母體標準差未知, 算出樣本標準差為 1.8972 試問能否有證據說飲料容量 平均缺乏 250cc ? 所以是顯著的,即有證據說飲料容量平均缺乏250cc nsxt02138. 2100/8972. 125058.249 查t 表自由度 99,
20、得 t99,0.05 =1.6604,因 t t99,0.05 例例8.7、(例例8.4續續) 要檢定某年全國每戶平均申報所得稅 能否高於75萬元? 但未知標準差是多少,搜集到81戶, 得樣本平均數=78,樣本標準差=16, 試問能否有證據說全國每戶 平均申報所得稅高於75萬元? 有證據說全國平均申報所得稅高於75萬元 6875. 1811675780nsxt查t表,得 t80,0.05 =1.6604,因 05. 0,806875. 1tt,所以0H是顯著的,即有證據有證據說全國平均申報所得稅高於75萬元。 例例8.8、 有報導說,台南市成年市民 在2000年平均身高為165公分, 小強懷疑此報導不實, 由台南市成年市民中抽樣50位, 資料如第一章表1.9, 平均身高=165.5公分,標準差=7.454公分 能否有證據說台南市成年市民 平均身高不是165公分? 雙尾檢定 165:165:10HH沒有證據說台南市成年市民平均身高不是165公分 4743. 050/454. 75 . 050/454. 71655 .165t因t4743. 0 2, 1n 雙尾棄卻域雙尾棄卻域 202) 1(sn 22, 1n 或 202) 1(sn 22/1 , 1n 例例8.18、(例例8.17續續) 檢定電池壽命的變異數能否等於4?此問題
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025公司法试题及答案解析
- 2025年高级化工仪表维修工理论知识试题库及答案
- 设备智能化升级考核试卷
- 亚热带水果种植与气候变化应对策略考核试卷
- 2025公需课新时代专业技术人员新理念素养提升试题及答案
- 印刷品印刷品包装材料环保性能要求考核试卷
- 时尚艺术融合的社区参与与公共艺术项目考核试卷
- 年产塑料制品36000件项目报告表
- 新闻刊登管理办法
- 建设监理管理办法
- 低碳经济视域下陕西省能源产业的转型与发展:挑战、机遇与策略研究
- 2025年小学数学教师招聘考试模拟试卷及答案
- 房地产企业土地增值税清算代理服务合同
- 智能化煤矿培训课件
- 中石化品牌管理制度
- 电梯砝码租凭合同范本
- 2025-2030中国1丁烯行业市场现状供需分析及投资评估规划分析研究报告
- 江西省宜春实验中学2025年物理八下期末教学质量检测试题含解析
- 国有融资担保公司笔试真题解析
- 中国黄酒行业市场发展现状及前景趋势与投资分析研究报告2025-2028版
- 养老院敬老院预算及成本管理制度
评论
0/150
提交评论