主题四机率分布_第1页
主题四机率分布_第2页
主题四机率分布_第3页
主题四机率分布_第4页
主题四机率分布_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、主题四机率分布 2021/4/24 主题四机率分布2 講授主題講授主題 l壹、淺說壹、淺說 l貳、間斷與連續變數的機率分佈貳、間斷與連續變數的機率分佈 l參、隨機機率分佈參、隨機機率分佈 l肆、以樣本分佈說明統計量的變化肆、以樣本分佈說明統計量的變化 l伍、樣本平均數的分佈伍、樣本平均數的分佈 l陸、母體、樣本資料與樣本分佈陸、母體、樣本資料與樣本分佈 l柒、本章小結柒、本章小結 2021/4/24 主题四机率分布3 本週重點本週重點 賭王與機率分佈賭王與機率分佈 年輕的統計理論與資深的機率論年輕的統計理論與資深的機率論 統計最基本的分佈統計最基本的分佈正態分佈正態分佈 抽樣的基本原理與推論應

2、用抽樣的基本原理與推論應用抽樣分佈抽樣分佈 2021/4/24 主题四机率分布4 壹、淺說壹、淺說 機率(機率(probability): 在隨機樣本或是隨機實驗中,在反覆抽樣或是實驗在隨機樣本或是隨機實驗中,在反覆抽樣或是實驗 的過程裡,特定事件的過程裡,特定事件/結果出現的比例結果出現的比例 擲骰子擲骰子 抽撲克牌抽撲克牌 2021/4/24 主题四机率分布5 介紹幾個基本概念介紹幾個基本概念 A.隨機實驗隨機實驗 (Random Experiment) B.基本結果(基本結果(Elementary Outcome) C.樣本空間(樣本空間(Sample Space) D.事件(事件(Ev

3、ent Set) 2021/4/24 主题四机率分布6 A.隨機實驗隨機實驗 (Random Experiment) 這是一種過程,你會知道有幾種特定的結果會出現,這是一種過程,你會知道有幾種特定的結果會出現, 不過,不能確定哪一個結果會出現,也無法精確不過,不能確定哪一個結果會出現,也無法精確 預測。預測。 隨機實驗可以重複進行,經過累積一定的觀察數量隨機實驗可以重複進行,經過累積一定的觀察數量 後,可以找出一些統計規則。後,可以找出一些統計規則。 例如,你擲一個骰子,你不確定會出現幾點,但是,例如,你擲一個骰子,你不確定會出現幾點,但是, 你知道其中一些基本原則。同理,可以推論到擲你知道其

4、中一些基本原則。同理,可以推論到擲 兩顆骰子或是抽一張撲克牌。兩顆骰子或是抽一張撲克牌。 2021/4/24 主题四机率分布7 B.基本結果(基本結果(Elementary Outcome) 隨機實驗可能出現的結果。隨機實驗可能出現的結果。 例如,例如, 擲一個骰子的基本結果是從擲一個骰子的基本結果是從1到到6。 抽一張樸克牌出現紅心的機會是四分之一抽一張樸克牌出現紅心的機會是四分之一 2021/4/24 主题四机率分布8 C.樣本空間(樣本空間(Sample Space) 列出隨機實驗中的所有可能結果。例如,擲一個列出隨機實驗中的所有可能結果。例如,擲一個 骰子的樣本空間是骰子的樣本空間是

5、S=1,2,3,4,5,6 通常用通常用S來表示之。來表示之。 2021/4/24 主题四机率分布9 D. 事件(事件(Event Set) 樣本空間的部分集合稱之為事件。樣本空間的部分集合稱之為事件。 事件可以只包括一個基本結果(簡單事件事件可以只包括一個基本結果(簡單事件simple event)或是兩個或兩個以上的基本結果)或是兩個或兩個以上的基本結果(混合事混合事 件件composite event)。 2021/4/24 主题四机率分布10 機率機率 2008年選舉結果年選舉結果 馬英九約得馬英九約得765.9萬票萬票/謝長廷約得謝長廷約得544.5萬票萬票 馬勝馬勝221萬票萬票

6、馬得票率佔有效票馬得票率佔有效票58.45/投票率投票率76.33 如果用出口名調,得到結果會如何?如果用出口名調,得到結果會如何? 2021/4/24 主题四机率分布11 主觀主觀(subjective)與客觀與客觀(objective)機率機率 選科系是依靠主觀還是客觀機率?選科系是依靠主觀還是客觀機率? 找工作是依靠主觀還是客觀機率?找工作是依靠主觀還是客觀機率? 妳可以實驗多少次?妳可以實驗多少次? 長期客觀的機率有其困難長期客觀的機率有其困難 主觀機率主觀機率 依據過去的資訊(事前機率),推測事後機率依據過去的資訊(事前機率),推測事後機率 貝氏統計貝氏統計Bayesian stat

7、istics 2021/4/24 主题四机率分布12 基本機率規則機率基本機率規則機率 P(A): A事件發生的機率事件發生的機率 lP(not A):非非A事件發生的機率事件發生的機率 (彼此互斥,窮盡全體)(彼此互斥,窮盡全體) l如果事件如果事件A與事件與事件B彼此獨立彼此獨立 P(A or B)= =P(A) + P(B) l如果事件如果事件A與事件與事件B為兩個可能結果為兩個可能結果 P(A and B)= =P(A) * P(B given A) l如果事件如果事件A與事件與事件B彼此獨立彼此獨立 P(A and B)= P(A) * P(B) )(AP )(BAP )(BAP 2

8、021/4/24 主题四机率分布13 婚姻與快樂婚姻與快樂 很快樂很快樂 H 還快樂與不快樂還快樂與不快樂 N 已婚已婚 M 210 350 560 未婚未婚 U 340 100 440 550 450 1,000 2021/4/24 主题四机率分布14 各種機率各種機率 P(未婚未婚) P(很快樂很快樂)+P(還快樂與不快樂還快樂與不快樂) P(已婚且很快樂已婚且很快樂)=P(已婚已婚)*P(已婚中很快樂已婚中很快樂) P(U)1-P(M) P(HN)= P(H)+P(N)如果兩個事件獨立如果兩個事件獨立 P(MH)= P(M)P(HM) 2021/4/24 主题四机率分布15 各種百分比各

9、種百分比 總百分比:總百分比:total %; join % 很快樂很快樂 H 還快樂與不還快樂與不 快樂快樂 N 直欄直欄 已婚已婚 M 21.0 35.0 56.0 未婚未婚 U 34.0 10.0 44.0 橫列橫列 55.0 45.0 100.0 )(HMP )(NMP )(HUP )(NUP 2021/4/24 主题四机率分布16 直欄百分比直欄百分比(column %) 很快樂很快樂 H 還快樂與不快樂還快樂與不快樂 N 直欄直欄% 已婚已婚 M 38.2 77.8 56.0 未婚未婚 U 61.8 22.2 44.0 (樣本數樣本數) (550) (450) 100.0 )|(H

10、MP )|(HUP )|(NMP )|(NUP 2021/4/24 主题四机率分布17 橫列百分比橫列百分比(row %) 很快樂很快樂 H 還快樂與不快樂還快樂與不快樂 N (樣本數)(樣本數) 已婚已婚 M 37.5 62.5 ( 560) 未婚未婚 U 77.3 22.7 ( 440) 橫列橫列% 55.0 45.0 (1,000) )|(MHP )|(MNP )|(UHP )|(UNP 2021/4/24 主题四机率分布18 各種概念各種概念 l交集:交集: P(AB) l聯集:聯集:P(AB) l條件機率:條件機率: P(AB) l獨立事件:對各種機率計算的影響獨立事件:對各種機率計

11、算的影響 2021/4/24 主题四机率分布19 貳、間斷與連續變數的機率分佈貳、間斷與連續變數的機率分佈 間斷變數與連續變數之區別間斷變數與連續變數之區別 2021/4/24 主题四机率分布20 一、間斷變數的機率分佈一、間斷變數的機率分佈 表表 4.1 家中理想子女數目的分佈家中理想子女數目的分佈 y P(y) 0 0.01 1 0.03 2 0.60 3 0.23 4 0.12 5 0.01 總總計計 1.00 2021/4/24 主题四机率分布21 間斷機率分佈間斷機率分佈 P(y=4)=? P(y4)=? P(y=3.5)=? 用直方圖表示用直方圖表示 2021/4/24 主题四机率

12、分布22 二、連續機率分佈圖二、連續機率分佈圖 2021/4/24 主题四机率分布23 二、連續機率分佈二、連續機率分佈 P(y10)=? P(30y60)=? 2021/4/24 主题四机率分布24 機率分佈的母數機率分佈的母數 l如果表如果表4.1是母體值,我們反覆抽樣的結果,會是母體值,我們反覆抽樣的結果,會 知道知道 家中理想子女數為家中理想子女數為1的機率是:的機率是:P(y=1)=? l對機率的兩個重要的描述母數(參數)為對機率的兩個重要的描述母數(參數)為 l平均數平均數 1.標準差標準差 2021/4/24 主题四机率分布25 間斷變數的平均數計算方式間斷變數的平均數計算方式

13、l此一數值又稱為期望值,以此一數值又稱為期望值,以E(y)表示表示 l變異數計算公式變異數計算公式 l計算理想子女數的平均數與標準差計算理想子女數的平均數與標準差 )()()( 2 yPyyV )(yPy 2021/4/24 主题四机率分布26 參、正態機率分佈參、正態機率分佈 2021/4/24 主题四机率分布27 參、正態分佈的幾個特性參、正態分佈的幾個特性 1.1.平均數、中位數與眾數是同值,而將正態曲線分成平均數、中位數與眾數是同值,而將正態曲線分成 對稱的兩個部分,各佔總分布的一半。對稱的兩個部分,各佔總分布的一半。 2.2.分布是對稱的,一旦將本分布從中間對折,兩邊會分布是對稱的,

14、一旦將本分布從中間對折,兩邊會 彼此重疊。彼此重疊。 3.3.分布的兩端分布的兩端( (尾巴尾巴) ),離平均數愈遠,會接近,離平均數愈遠,會接近X-X-軸,軸, 不過,不會接觸到不過,不會接觸到X-X-軸軸-總是會有發生的機率,總是會有發生的機率, 不過,機率很低就是了。不過,機率很低就是了。 2021/4/24 主题四机率分布28 參、正態分佈的幾個特性參、正態分佈的幾個特性 當觀察值為常態分佈時,在平均數當觀察值為常態分佈時,在平均數 l正負一個標準差的區間之內,涵蓋了正負一個標準差的區間之內,涵蓋了68%的所的所 有觀察值有觀察值 l正負兩個標準差的區間之內,包括了正負兩個標準差的區間

15、之內,包括了95%的所的所 有觀察值,有觀察值, l正負三個標準差的區間之內,包括了正負三個標準差的區間之內,包括了99.7%的的 所有觀察值。所有觀察值。 2021/4/24 主题四机率分布29 兩個正態分佈圖兩個正態分佈圖 2021/4/24 主题四机率分布30 標準化分數標準化分數Z-Score 2021/4/24 主题四机率分布31 運用正態分配表運用正態分配表 2021/4/24 主题四机率分布32 運用正態分配表運用正態分配表(區域區域B或或C的比例的比例) 2021/4/24 主题四机率分布33 運用正態分配表運用正態分配表(區域區域B或或C的比例的比例) 2021/4/24 主

16、题四机率分布34 運用常態分配表運用常態分配表P(-1Z1) 2021/4/24 主题四机率分布35 運用常態分配表運用常態分配表P(-2Z2) 2021/4/24 主题四机率分布36 運用常態分配表運用常態分配表P(-3Z3) 2021/4/24 主题四机率分布37 運用常態分配表找出各區的比例運用常態分配表找出各區的比例 2021/4/24 主题四机率分布38 找出以下區域的百分比找出以下區域的百分比 lP(-1.96Z1.96) lP (ZZ) 2021/4/24 主题四机率分布39 用用Z-scores找出機率或是特定值找出機率或是特定值 l特定值需要找出一定機率,先轉換成特定值需要找

17、出一定機率,先轉換成z-score再用再用 表找出該區域的機率表找出該區域的機率 l有特定機率、百分位或是比例希望找出特定值,有特定機率、百分位或是比例希望找出特定值, 先將機率轉換成先將機率轉換成z-score,再用,再用 y=+z 2021/4/24 主题四机率分布40 兩個練習兩個練習 l4.3.一個一個IQ考試的平均數為考試的平均數為100,標準差為,標準差為16 找出找出99百分位應該要考多少分百分位應該要考多少分 lAssume that verbal SAT scores approximate a normal distribution with a mean of 430 a

18、nd a standard deviation of 100. What proportion of students verbal SAT scores is either less than 350 or more than 500. 2021/4/24 主题四机率分布41 標準常態分佈標準常態分佈 所有常態分佈,都可以轉換成標準常態分數。他的所有常態分佈,都可以轉換成標準常態分數。他的 平均數是平均數是0,標準差是,標準差是1。 我們可以先知道標準分數,然後找出比這個分數高我們可以先知道標準分數,然後找出比這個分數高 /低者,佔所有分布的比例低者,佔所有分布的比例 另外一個是,我們知道一

19、定的比例後,要找出這個另外一個是,我們知道一定的比例後,要找出這個 標準化分數標準化分數 我們將標準常態分布的整個區域,定為我們將標準常態分布的整個區域,定為1或是或是100%, 一半就是一半就是0.5或是或是50% 2021/4/24 主题四机率分布42 標準正態分佈圖標準正態分佈圖 標標準準常常態態分分布布曲曲線線圖圖 -4-3-2-101234 2021/4/24 主题四机率分布43 肆、以抽樣分佈說明統計量的變化肆、以抽樣分佈說明統計量的變化 l以出口民調預測選舉結果以出口民調預測選舉結果 l模擬估計過程模擬估計過程 l抽樣分佈抽樣分佈(sampling distribution) 統

20、計量所可能獲得數值的機率分佈統計量所可能獲得數值的機率分佈 2021/4/24 主题四机率分布44 伍、樣本平均數的抽樣分佈伍、樣本平均數的抽樣分佈 l我們想知道每年家庭食品支出花費我們想知道每年家庭食品支出花費 2021/4/24 主题四机率分布45 食品支出的實例 2021/4/24 主题四机率分布46 食品支出的實例(食品支出的實例(N=25N=25) MEAN25 165000.0 160000.0 155000.0 150000.0 145000.0 140000.0 135000.0 130000.0 125000.0 120000.0 115000.0 110000.0 105000.0 MEAN25 次數 12 10 8 6 4 2 0 標準差 = 12501.24 平均數 = 130324.4 N = 100.00 2021/4/24 主题四机率分布47 食品支出的實例(食品支出的實例(N=100N=100) 2021/4/24 主题四机率分布48 樣本數對抽樣分佈與精確度的影響樣本數對抽樣分佈與精確度的影響 2021/4/24 主题四机率分布49 標準誤標準誤(standard error) l平均數抽樣分佈的標準差稱之平均數抽樣分佈的標準差稱之 n y / 2021

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论