![统计的整理统计量数课件_第1页](http://file4.renrendoc.com/view/d6e0a77c35bc82fdf3cd66b2562e5003/d6e0a77c35bc82fdf3cd66b2562e50031.gif)
![统计的整理统计量数课件_第2页](http://file4.renrendoc.com/view/d6e0a77c35bc82fdf3cd66b2562e5003/d6e0a77c35bc82fdf3cd66b2562e50032.gif)
![统计的整理统计量数课件_第3页](http://file4.renrendoc.com/view/d6e0a77c35bc82fdf3cd66b2562e5003/d6e0a77c35bc82fdf3cd66b2562e50033.gif)
![统计的整理统计量数课件_第4页](http://file4.renrendoc.com/view/d6e0a77c35bc82fdf3cd66b2562e5003/d6e0a77c35bc82fdf3cd66b2562e50034.gif)
![统计的整理统计量数课件_第5页](http://file4.renrendoc.com/view/d6e0a77c35bc82fdf3cd66b2562e5003/d6e0a77c35bc82fdf3cd66b2562e50035.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第四章 統計資料的整理:統計量數學 習 目 標介紹常用的統計量數來表達資料的特性。學習集中趨勢的統計量數。學習位置的統計量數。學習分散程度的統計量數。學習如何建立全方位的統計圖盒鬚圖。學習形狀的統計量數有偏度與峰度。學習如何計算分組資料。認識謝比雪夫不等式與經驗法則。學習Z分數的應用。洞悉平均數、變異數及標準差的重要性質。本 章 架 構4.1 集中趨勢統計量數4.2 位置統計量數4.3 分散程度統計量數4.4 全方位的統計圖盒鬚圖4.5 形狀統計量數4.6 分組資料的統計量數4.7 謝比雪夫不等式與經驗法則4.8 z分數的應用4.9 樣本平均數、樣本變異數及樣本標準差的重要性質4.1 集中趨勢
2、統計量數4.1.1 平均數(mean)4.1.2 中位數(median)4.1.3 眾數(mode)4.1.4 集中趨勢統計量數的比較4.1 集中趨勢統計量數(續)所謂集中趨勢統計量數是以一個數值來描述樣本資料中,那一個分數或數值是最具代表性,或集中在那個中心位置。最常見的集中量數有三種,即眾數(Mode)、中位數(Median)、和算術平均數(Mean),到底用那一個集中量數和資料衡量尺度以及研究之目的有關。4.1.1 平均數平均數(mean) 為所有數值總和除以所有數值的個數,當資料是屬量資料時適用。 母體平均數()樣本平均數( )台積電股價報價2003年7月14日台積電股價基本面訊息資料
3、來源:中時理財網台灣電力公司近五年經營績效資料來源:台灣電力公司網站例4.1 平均數若全班12位學生的體重分別為38、46、43、51、54、50、40、48、39、42、54、35公斤,試求其母體平均數?若以上資料為抽自全班60位同學的樣本觀察值,則其樣本平均數為何?解:例4.2 平均數已知樣本資料2,3,5,10,15,若其中有所誤植,15應為85才正確,問平均數有何變化? 解: 根據誤植的資料,則樣本平均數為(2+3+5+10+15)/15=7;若將15改為85,則樣本平均值變為21,為原值的三倍。由上例可以知道平均數對於極端值(如上例中之85)的敏感度很強,這是採用平均數作為集中趨勢統
4、計量數應特別留意之處。為此,我們介紹中位數來克服這樣的疑慮。平均數性質Xi = n ; Xi = N(Xi - )離差值 ( Xi - ) = 0min (Xi - A )2 (Xi - )2 最小易受離群值(outlier)影響,可用修正平均數改善。變數變換:Y = a X+ b = a + b修正平均數調查大學生每周上網時數,今隨機抽取n16學生其資料如下: 4, 5, 6, 8, 9, 10, 12, 14, 15, 15, 15, 16, 17, 18, 20, 26求平均數求5修正平均數Sol: (1) = 13.125 (2)修正平均數 = 12.86註:求修正平均數前需先將原資料
5、排序4.1.2 中位數中位數(median) 將資料由小到大(或由大到小)順序排列後,位於中心的數值稱之, 通常以 表示,當資料是屬量資料時適用。 計算方法 將資料由小到大排序寫成x(1), x(2), , x(n) 例4.3 續例4.1求12位學生的體重之中位數?解: 全班12位學生的體重分別為38、46、43、51、54、50、40、48、39、42、54、35公斤。 將12位學生的體重由小到大排序如下:35,38,39,40,42,43,46,48,50,51,54,54,因為n=12為偶數,故中位數為排序第六和第七位數值的平均,即例4.4 續例4.2已知樣本資料2,3,5,10,15,
6、若其中有所誤植,15應為85才正確,請討論中位數的變化情形。 解: 若是誤植資料,其中位數為5,但經訂正使用85取代15,則中位數依然為5,由此可知,中位數完全不受影響。由上例可知,中位數可能只用資料的一個或兩個數值,故對極端值不敏感。但其數學運算卻不易操作,比如說,我們無法直接將兩組資料的個別中位數作運算而求得合併兩組資料後的中位數,因此中位數不常用來作統計推論。4.1.3 眾數眾數: 指資料中出現次數最多的數或分組名稱。當數據或名稱各只出現一次時,眾數便不存在,但因次數可能相同,故眾數可能不唯一。 屬質資料的集中趨勢統計量數,用眾數(mode)表示最為適當。 例4.5 眾數擲一公正的骰子1
7、0次,其點數分別為3、6、2、6、1、4、6、5、3、5,求其眾數?解: 點數的出現次數分別為點數1:1次、點數2:1次、點數3:2次、點數4:1次、點數5:2次、點數6:3次,故M0=6。例 4.6 某科技大學管理學院院長欲瞭解所屬各碩士班的報名情形,得知資料如下:財金系250人,企管系308人,資管系169人,保險系145人,會計系178人,休閒系134人,問那一碩士班最為熱門? 解: 各碩士班乃屬質資料,故以眾數代表最為合適,即表示眾數為企管系,報名人數最多,是為某一年度最熱門的碩士班。4.1.4 集中趨勢統計量數的比較當資料是對稱分配時,則平均數、中位數及眾數三者皆相等。當數據是屬量資
8、料時,則適用平均數或中位數。若為屬質資料時,則應以眾數為最佳選擇。以極端值而言,平均數受其影響最為明顯,相較之下,中位數與眾數則對極端值不敏感。平均數易於作數學運算,但中位數與眾數則不易達成某些簡單的數學運算目的。平均數易於數學計算之特性 例如兩組樣本資料的個數與平均數分別為n1和n2及 和 ,則將兩組資料合併後的樣本平均數為 平均數具有如此的功能,但中位數和眾數則無法同理得知,也就是說,兩組資料合併後的中位數和眾數都無法以一關係式來直接代表。 4.2 位置統計量數4.2.1 百分位數(percentile)4.2.2 四分位數(quartile)4.2.1 百分位數百分位數(percenti
9、le) 通常以第k個百分數稱之,並寫成Pk,代表資料中在此分數下有多少百分比之樣本是在此分數之下。設樣本數為n,則 4.2.1 百分位數求百分位數 Pk 之步骤:(1) 將原始資料排序(2) 求位址 i : i = n/100 k(3) (i) i Z (整數), i 進位如 i 3.2 Pk = X(4) (ii) i Z (整數) 如 i 5 Pk = (X(5) + X(6) )/2兒童的身高所謂的矮小是相對的。一個排在第3百分位數的兒童,比排在第50百分位數的矮,但這個第50百分位數的兒童,也比第97百分位數的兒童矮。 在臨床上,排在第三百分位數以下的兒童才算是所謂的矮。人的高度分佈是
10、平均的,所以大約有3%的兒童,其身高低於第三百分位數,這是正常的。如果他們的高度遠低於第三百分位數,他們便可能是患病。 例4.7 續例4.1全班12位學生的體重分別為38,46,43,51,54,50,40,48,39,42,54,35公斤,求P20。解: 因為 不是整數,所以取第三小的數,即 。 4.2.2 四分位數四分位數(quartile) : 是將N分成四等份,因此第一個四分位之分數是指有25%的樣本數目(N)的分數低於此分數。 P25,稱為第一個四分位數或下四分位數Q1。P50,稱為第二個四分位數Q2,就是中位數,所以P50= Q2 = Me。P75,稱為第三個四分位數或上四分位數Q
11、3。註:十分位數是將N分成四等份: D1, D2, , D10 Di = Pk,k = 0.1100 i 例4.8 續例4.1全班12位學生的體重分別為38,46,43,51,54,50,40,48,39,42,54,35公斤,求Q1、Q2、Q3。解:平均數、中位數及眾數三者之關係單峰右偏 : Mo Me 單峰左偏 : Me 3 Xi為偏離值 (當資料呈鐘形分布)例4.14 基金報酬率是否有偏離值?假設某一年有12檔基金的報酬率(%)如下:15、12、35、14、16、14、17、20、18、17、15、14請繪製盒鬚圖,並判斷是否有偏離值?解: 首先,我們計算出x(1)=12,Q1=14,M
12、e=15.5,Q3 =17.5,x(12)= 35。然後根據這五個統計量數繪製如圖4.3之盒鬚圖。(此圖係以SPSS統計軟體繪製,Excel軟體無此功能。)例4.14 基金報酬率是否有偏離值?(續)由圖4.3可知,存在一個偏離值,即報酬率35%的那一檔基金。圖4.3 12檔基金報酬率之盒鬚圖RETURN40302010124.5 形狀統計量數4.5.1 偏度(skewness)4.5.2 峰度(kurtosis)4.5 形狀統計量數(續)形狀統計量數(measure of shape)是用以表示資料是否對稱於中心點及寬闊或高聳的程度,主要的統計量數有偏度和峰度兩種。4.5.1 偏度偏度(ske
13、wness) 用來說明一組資料是否對稱於中心位置,通常以1表示。樣本偏度 (1) 1 0,單峰右偏 (2) 1 0,高狹峰 (2) 2 1圖4.8 謝比雪夫不等式之圖示4.7.1 謝比雪夫不等式(續) 例4.18 謝比雪夫不等式就例3.6之五十筆樣本資料,試問有多少比例的觀察值落於樣本平均數左右兩個樣本標準差的區間內?解: 根據謝比雪夫不等式的結論,則至少有75%的資料落於該區間內。本例中,我們可以實際瞭解真正的情形。首先計算 , ,所以 因為 k=2,故 ,實際計數後得知有 的資料落於該區間內。 4.7.2 經驗法則經驗法則(empirical rule): 當資料呈現對稱分配或鐘形分配時,
14、則約有68%的資料落在平均數左右一個標準差的區間內。約有95%的資料落在平均數左右二個標準差的區間內。約有99.7%的資料落在平均數左右三個標準差的區間內。數學式: P( | X | k ) 68% , k = 1 95%, k = 2 99.7%, k = 3 經驗法則的應用根據經驗法則吾人可預測共同基金的報酬率分布情況:平均報酬率加上兩個標準差大約是最佳狀況時的報酬率;平均報酬率剪去兩個標準差大約是最差狀況時的報酬率。換言之,四個標準差大約是最好與最壞時的差距。例4.19 續例4.18試依經驗法則驗證相關的結論。解:在 的區間有33個數據,占33/50=66%。在 的區間有49個數據,占4
15、9/50=98%。在 的區間有50個數據,占50/50=100%。以上三個比例和經驗法則的結論都非常接近,因為資料具有近似對稱分配的性質。謝比雪夫不等式與經驗法則例:自某大學四年級N = 1080學生,測驗智力測驗,得其IQ分數之平均數()= 120,標準差()= 8。假設資料呈鐘形分布時,試回答下列問題。 (1) 試利用謝比雪夫定理求出分數108 132區間至 少有多少人? (2) 試利用經驗法則求區間a , b內約有1026個學 生? (3) 設依此成績學校給予IQ分數前27名學生獎金做 為鼓勵,試問最低分數為多少?4.8 z分數的應用z分數(z score) 代表任一觀測值(x)與平均數
16、間的距離有幾個標準差的意義。 母體的z分數樣本的z分數註 : z分數沒有單位z分數的性質zi = 0 (zi - ) = 0變異數 : Sz2 = 1,z2 = 1母體:Zi2 = N 樣本:Zi2 = n 1註:若資料呈鐘形分布經轉換成Z分數時,當|Zi| 3,則Xi為離群值。例4.20 統計學成績進步抑或退步?小明在班上的統計學期中考成績65分,全班的平均是62分,標準差5分;另其期末考成績為76分,班上的平均是80分,標準差3分,試問小明的成績在班上名次是進步或退步呢?另外,小明期中考成績以相同班上名次則期末考須考幾分?(假設期中考、期末考成績均呈鐘形分布)解:(1) 若以數學的基本觀念
17、而言,76分絕對高於62分,但若 換算兩次考試的z分數,期中考的z分數為0.6,正數表示高於全班平均;至於期末考則為 -1.33,表示在全班平均以下,所以小明的成績就全班而言是退步了。 (2) 利用期中考、期末考成績的z分數相等。z分數的應用隨機抽出n5個樣本並轉換成Z分分數,其分別為 Z1 = 1.4, Z2 = -0.8, Z3 = -1.2, Z4 = 1.6 (1) 試問Z5 之值為何? (2) 若 = 30,S = 3,試問x5 之值為何?解:(1) Zi = 0 Z5 = -1 (2) Z5 = ( X5 - )/s X5 = 274.9 樣本平均數、樣本變異數及樣本標準差的重要性質平移:將資料同加一個常數項的方式。 令 zi = xi c
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年无菌包装用包装材料项目规划申请报告模范
- 2025年健康护理产品购销合同书样本
- 2025年新股权分配策划协议
- 2025年环境有害生物防治合同
- 2025年健身房个人教练聘请合同范本
- 2025年子女抚养费用分担策划协议
- 2025年共同研发知识产权合同
- 2025年合作双方产品协议范本
- 2025年全年图书选购合作协议书样本
- 2025年公园景观照明设备定期维护服务申请协议
- 2025版大学食堂冷链食材配送服务合同模板3篇
- 《中医体重管理临床指南》
- 广西壮族自治区公路发展中心2025年面向社会公开招聘657名工作人员高频重点提升(共500题)附带答案详解
- 《中国的宗教》课件
- 2025年山东鲁商集团有限公司招聘笔试参考题库含答案解析
- 大型活动中的风险管理与安全保障
- 课题申报书:个体衰老差异视角下社区交往空间特征识别与优化
- 江苏省招标中心有限公司招聘笔试冲刺题2025
- 2024年防盗门销售合同范本
- 综采工作面过空巷安全技术措施
- 云南省丽江市2025届高三上学期复习统一检测试题 物理 含解析
评论
0/150
提交评论