【大学】 叙述统计量_第1页
【大学】 叙述统计量_第2页
【大学】 叙述统计量_第3页
【大学】 叙述统计量_第4页
【大学】 叙述统计量_第5页
已阅读5页,还剩103页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章敘述統計量编辑ppt概論統計量包括五種類型中央趨勢之衡量統計量分散度之衡量統計量相對位置之衡量統計量形狀之衡量統計量兩變數線性相關之衡量統計量编辑ppt3.1中央趨勢之衡量統計量中央趨勢之衡量統計量(measureofcentraltendency)主要是衡量資料的中心位置,故又稱為中心之衡量(measureofcenter)

一般較常用的中央趨勢之衡量統計量有平均數(mean)、中位數(median)、眾數(mode)等编辑ppt3.1.1平均數平均數是最常用的一種中央趨勢之衡量統計量,它最大的功用即在能以一個簡單的數代表母體或樣本的數值適合用數學運算方法,計算簡單且易於了解計算一組統計資料的平均數時,該組資料內的所有數值皆被列入計算,所以較具有代表性且敏感度高平均數的唯一缺點是容易受到極端值(extremevalue)的影響,而減弱平均數的代表性编辑ppt3.1.1平均數(續)平均數以求算方式可分為三種,即算術平均數(arithmeticmean)幾何平均數(geometricmean)調和平均數(harmonicmean)但後兩種平均數較不常見,應用範圍也不廣编辑ppt3.1.1平均數(續)平均數的意義以全部觀測值的總和除以觀測值個數而得编辑ppt3.1.1平均數(續)平均數的計算統計資料未分組時由於仍然完整,因此在求算統計量時不會有任何問題,但資料經過分組後,即會失去某些資訊求算已分組資料的統計量時,一般都是依循下列兩個基本假設1.集中分配:假設各組觀測值都相等於組中點2.均勻分配:假設各組觀測值都是均勻分佈在組內编辑ppt3.1.1平均數(續)编辑ppt3.1.1平均數(續)编辑ppt3.1.1平均數(續)编辑ppt3.1.1平均數(續)【例3.3】承例2.3,某一班級50名學生的統計學期中考成績的次數分配如下所示,試求其平均成績。编辑ppt3.1.1平均數(續)编辑ppt3.1.1平均數(續)编辑ppt3.1.1平均數(續)编辑ppt3.1.1平均數(續)平均數的特性编辑ppt3.1.1平均數(續)*Keytosolve编辑ppt3.1.1平均數(續)编辑ppt3.1.2中位數编辑ppt3.1.2中位數编辑ppt3.1.2中位數(續)编辑ppt3.1.2中位數(續)编辑ppt3.1.2中位數(續)中位數的特性在資料無嚴重的重複情形下,中位數將資料分為兩等分各觀測值xi與中位數Me之差的絕對值總和,比和其他任意數之差的絕對值總和都來得小,即,T為任一常數

编辑ppt3.1.2中位數(續)编辑ppt3.1.3眾數编辑ppt3.1.3眾數(續)编辑ppt3.1.3眾數(續)求已分組資料之眾數的方法,一般最常見的有以下三種金氏(W.I.King)插補法克如伯(E.Czuber)比率法皮爾生(K.Pearson)法编辑ppt3.1.3眾數(續)编辑ppt3.1.3眾數(續)编辑ppt3.1.3眾數(續)编辑ppt3.1.3眾數(續)编辑ppt3.1.3眾數(續)编辑ppt3.1.4各中央趨勢之衡量統計量之比較適用性比較编辑ppt3.1.4各中央趨勢之衡量統計量之比較(續)優缺點比較编辑ppt3.1.4各中央趨勢之衡量統計量之比較(續)编辑ppt3.2分散度之衡量統計量分散度之衡量統計量可衡量資料之離散程度分散度之衡量統計量可以用於尋找變異的原因和性質常見的分散度之衡量統計量有:全距、四分位差、平均絕對差、變異數及標準差、變異係數等编辑ppt3.2.1全距定義3.2.1全距

資料中的最大值與最小值之差即為全距(range),通常以R來表示。定義3.2.2未分組資料的全距

R

=最大值—

最小值定義3.2.3已分組資料的全距

R=最高組上限—

最低組下限

编辑ppt3.2.1全距(續)编辑ppt3.2.1全距(續)编辑ppt3.2.1全距(續)全距的性質計算簡單,意義明顯具有順序統計量的概念易受極端值影響缺乏敏感度编辑ppt3.2.2四分位差四分位差是指將資料去掉兩端最大及最小值各25%的觀察值,只剩中間50%部分的資料,之後再求這50%資料的全距编辑ppt3.2.3平均絕對離差計算各觀察值與平均數的距離總和,然後在取其算術平均數,而不討論離均差之正負號,此即為平均絕對離差(meanabsolutedeviation),通常以MAD表示编辑ppt3.2.3平均絕對離差(續)编辑ppt3.2.3平均絕對離差(續)编辑ppt3.2.3平均絕對離差(續)编辑ppt3.2.3平均絕對離差(續)平均絕對離差的特性其值越大,則資料的分散情況也越大;反之,則越小平均絕對離差的優點觀念簡單,易於了解敏感度較高,代表性較佳平均絕對離差的缺點當資料數多時,較不易計算易受極端值的影響编辑ppt3.2.4變異數與標準差變異數(variance)的概念,是將各個資料與其平均數之間的離差平方後再加總除以總項數後即為變異數编辑ppt3.2.4變異數與標準差(續)编辑ppt3.2.4變異數與標準差(續)未分組資料的標準差编辑ppt3.2.4變異數與標準差(續)编辑ppt3.2.4變異數與標準差(續)编辑ppt3.2.4變異數與標準差(續)编辑ppt3.2.4變異數與標準差(續)已分組資料的標準差编辑ppt3.2.4變異數與標準差(續)编辑ppt3.2.4變異數與標準差(續)编辑ppt3.2.4變異數與標準差(續)變異數與標準差的特性其理論的結果在往後的機率理論佔有相當重要的地位分散度之衡量統計量中優點最多的變異數與標準差的重要的性質值恆大於或等於零,其值越大代表資料分散程度越大;反之則分散程度越小只能用來比較兩組或兩組以上平均數相近且具有相同單位之資料間分散程度的大小编辑ppt3.2.4變異數與標準差(續)變異數與標準差的優缺點優點:靈敏度較高將中央趨勢之衡量統計量(平均數)列入計算、且適合用代數演算。適合用樣本變異數s2對未知的母體變異數2進行估計,而且s2是2的不偏估計

缺點:易受極端值的影響

编辑ppt3.2.5變異係數所謂的相對分散度之衡量統計量就是絕對分散度之衡量統計量與某一中央趨勢之衡量統計量或其它適當數量之比一般最常用的相對分散度之衡量統計量是變異係數(coefficientofvariance),通常以CV表示,變異係數乃標準差與平均數比值的百分數编辑ppt3.2.5變異係數(續)编辑ppt3.2.5變異係數(續)编辑ppt3.2.5變異係數(續)编辑ppt3.2.5變異係數(續)變異係數的特性變異係數為一種無單位的係數變異係數具有下列兩種使用時機:當單位不同的兩組或兩組以上的資料欲比較分散程度時當單位相同但數值相差懸殊的資料欲比較分散程度時编辑ppt3.3位置之衡量統計量位置之衡量統計量(measuresoflocation)是用來測量某觀測值在全部樣本資料中排序後的累積相對百分比,或是給某相對百分比求對應的量是多少。编辑ppt3.3.1百分位數编辑ppt3.3.1百分位數(續)编辑ppt3.3.1百分位數(續)编辑ppt3.3.1百分位數(續)编辑ppt3.3.1百分位數(續)编辑ppt3.3.1百分位數(續)编辑ppt3.3.1百分位數(續)编辑ppt3.3.2四分位數编辑ppt3.3.2四分位數(續)编辑ppt3.3.2四分位數(續)编辑ppt3.3.2四分位數(續)编辑ppt3.3.2四分位數(續)编辑ppt3.3.3Z值编辑ppt3.3.3Z值(續)编辑ppt3.4形狀之衡量統計量形狀之衡量統計量(measuresofshape)是用來描述一組資料的分配形狀,如是否對稱,或資料分佈形狀的峰度有多高等等問題一般最常用的即為偏態係數及峰態係數。编辑ppt3.4.1偏態係數所謂偏態(skewness)係指一組單峰分配資料分配不對稱的程度偏態係數(coefficientofskewness)為表示單峰分配偏態的一種係數,故其亦為一種統計表徵數编辑ppt3.4.1偏態係數(續)

偏態係數的範圍大致在正負三之間,偏態係數的絕對值越大表示偏斜程度越大

Sk=0為對稱(symmetric);Sk>0為右偏(skewedright),或稱正偏;Sk<0為左偏(skewedleft),或稱負偏编辑ppt3.4.1偏態係數(續)编辑ppt3.4.2峰度係數峰度(kurtosis)是指次數分配高峰高聳的程度常態分配的高峰叫做常態峰(Mesokurtic),當CK(峰態係數)=3次數分配中較常態峰高而狹者叫做高狹峰(Leptokurtic)

,當CK>3較常態峰低而闊者叫做低闊峰(Platkurtic),當CK<3

编辑ppt3.4.2峰度係數(續)编辑ppt3.5謝比雪夫不等式與經驗法則编辑ppt3.5謝比雪夫不等式與經驗法則(續)编辑ppt3.5謝比雪夫不等式與經驗法則(續)编辑ppt3.5謝比雪夫不等式與經驗法則(續)编辑ppt3.5謝比雪夫不等式與經驗法則(續)编辑ppt3.5謝比雪夫不等式與經驗法則(續)编辑ppt3.6探索性資料分析探索性資料分析(exploratorydataanalysis;EDA)強調以簡單的繪圖方式彙總來描述一組樣本資料探索性資料分析主要包括兩種最常用的圖形,即枝葉圖(stem-and-leafdiagrams)和箱形圖(boxandwhiskerplots)

编辑ppt3.6.1枝葉圖编辑ppt3.6.1枝葉圖(續)编辑ppt3.6.1枝葉圖(續)编辑ppt3.6.2箱形圖箱形圖(box-and-whiskerplot)又叫做箱鬚圖係將某些中央趨勢之衡量統計量與分散度之衡量統計量利用圖形表現出來的一種圖示法圖中含顯示出資料的最大值L(largest)、最小值S(smallest)、第一四分位數(Q1)、中位數(Me)、第三四分位數(Q3)、四分位距(IQR)等编辑ppt3.6.2箱形圖(續)编辑pptQ1=46Me=62Q3=75S=22L=963.6.2箱形圖(續)编辑ppt3.7兩變數線性相關之衡量統計量

3.7.1共變異數编辑ppt3.7.1共變異數(續)编辑ppt3.7.1共變異數(續

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论