![量化研究与统计分析-描述统计的原理与应用_第1页](http://file2.renrendoc.com/fileroot_temp3/2021-11/20/e3b56d5b-2d15-4727-8399-b2d3bac50fb5/e3b56d5b-2d15-4727-8399-b2d3bac50fb51.gif)
![量化研究与统计分析-描述统计的原理与应用_第2页](http://file2.renrendoc.com/fileroot_temp3/2021-11/20/e3b56d5b-2d15-4727-8399-b2d3bac50fb5/e3b56d5b-2d15-4727-8399-b2d3bac50fb52.gif)
![量化研究与统计分析-描述统计的原理与应用_第3页](http://file2.renrendoc.com/fileroot_temp3/2021-11/20/e3b56d5b-2d15-4727-8399-b2d3bac50fb5/e3b56d5b-2d15-4727-8399-b2d3bac50fb53.gif)
![量化研究与统计分析-描述统计的原理与应用_第4页](http://file2.renrendoc.com/fileroot_temp3/2021-11/20/e3b56d5b-2d15-4727-8399-b2d3bac50fb5/e3b56d5b-2d15-4727-8399-b2d3bac50fb54.gif)
![量化研究与统计分析-描述统计的原理与应用_第5页](http://file2.renrendoc.com/fileroot_temp3/2021-11/20/e3b56d5b-2d15-4727-8399-b2d3bac50fb5/e3b56d5b-2d15-4727-8399-b2d3bac50fb55.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、量化研究與統計分析第八章描述統計的原理與應用Data Graphing第八章描述統計5/31課程目標介紹描述統計的原理瞭解集中量數的特性與各量數 瞭解變異量數的特性與各量數 瞭解相對量數的特性與各量數 瞭解標準分數的特性與各量數 熟習描述統計的SPSS運作統計學的重要性統計學(statistics)是一門應用數 量方法來收集、整理、分析和解釋 貪料,並由研究樣本的性質推論未知母群體性質'期待在不確定的情況下作決策的科學方法。統計學的分類依內容性質分1 描述(敘述)統計學(descriptive statistics )2.推論統計學(inferential statistics )驗設
2、計(design of experiments )請於1分鐘內算出本題答案*禁止使用計算機*1 = 52 = 253 = 1254 = 6255 = ?數學答案:3125 邏輯答案:? ?實驗設計透過實驗操弄自變項、觀察依變項產生的 變化,以瞭解兩者之因果關係。量化研究與統計分析描述統計描述統計的定義-一套用以整理、描述、解釋資料的系統方法與 統計技術-數據從初始狀態(raw data)成為可被理解的統 計量數(statistic)的一套操作程序-透過統計量數來描述大量資料,並作為彼此溝 通的共同符號語言集中量數集中量數(measures of central location )-用以描述一
3、組數據或一個分配集中點的統計量 數-一個能夠描述數據的共同落點的指標。-常用的集中量數有平均數、中位數及眾數第一節第八章描述統計7/31量化研究與統計分析次數分配次數分配可說是資料分析的基本工具,因為 要瞭解資料所表達的意義,首先就必須瞭解 貪料的結構。次數分配程序正是顯不貪料結 構的一種工具,它計昇出貪料的次數、百分 比*累計百分比和一些基本統計量,並可顯 示其次數分配圖次數分配表(名義變項)疾病名稱次數百分比()砂眼3024蛀牙7560近視2016合計125100次數分配表(次序變項)等第次數百分比()甲1020乙2448丙1224T48合計50100第八章描述統計11/31量化研究與統計
4、分析次數分配圖E941total4CXJtotal=3買Dnr4乩&化 SLdL I L l I L l L t t2i2:222222 0000DD0.1.2.34.亠&亿ad0.I.工3-.4.3.6.7.&ODOODDDDDOOOOODUDODDOOOODDDDOOOOODDDOD>OO0OD4500 4460 40 0 4Z0D loD qooo 3WDO 3400 J7.OO 3&DO 3500 3400 ioo ioo 5LDD SQOD iftDDtotal第八章描述統計#/31量化研究與統計分析平均數平均數(mean ;以M表示)-取某一變
5、項的所有數值的總和除以觀察值個數 所得到的值-因為是將數據直接以數學算式來計算平均值, 又稱為算術平均數(arithmetic mean ) °母體資料得出的平均數需以希臘字表示7T第一節第八章描述統計15/31樣本母群魅量化研究與統計分析第一節第八章描述統計19/31中位數p位數(median ;或以Mdn表示)-又稱為中數百分等級為50的百分位數(P50) 或第二四分位數(Q2; second quartile )。將某一個變項的數據依大至小或由小至大排列取位居最中間或能夠均勻對分全體觀察值的分數 -在中位數之上與之下,各有50%的觀察值。50、55、60、60、60、65、66
6、、70、9050、55、60、60、60 65、66、70 90 95kY>62.5中位數(median ;以Md表示)在中位數之上與之下,各有50%的觀察值。又稱 為中數、第2四分位數(Q2; second quartile )、 第50百分位數(P50)。將某一個變項的數據依大至小或由小至大排列, 取位居最中間、或能夠均勻對分全體觀察值的分 數 N為奇數:M*弋竺)2 N為偶數:眾數眾數(mode ;或以Mo表示)組分數中,出現次數最多的一個分數-一組數據中最典型(typical)的數值或次數分配最高點所對應的分數-是各集中量數當中,最容易辨認的量數-一個分配有兩個分數具有相同的最高
7、次數,此 時即出現了雙眾數,稱為雙峰分配(bimodaldistribution )50、55、60 60 60、65、66、70 90量化研究與統計分析集中量數的特性與優缺點比較測量層次集中量數眾數中位數平均數名義等蹈擇-<儔占不受缰, 計算方。對數值變匕不敏感,較 不受癣制WW,計算 方法尚稱餾更測量最爲猜密,考慮、 至1個樣本,具有 代表连。占測量過於粗糙,無法 有樣本無樣 況。品制 響。三種集中量數與分配形狀的關係(a)(b)第一節第八章描述統計21/31量化研究與統計分析變異量數變異量數(measures of variation )或離散 量數-用來描述觀察值在某一個變項上的
8、分數分散情 形的統計量-描述統計中,集中量數必須搭配變異量數,才 能反應一組數據的分佈特徵-常用的變異量數包括全距、四分差、變異數及 標準差全距全距(range )-一組分數中最大值(Xmax)與最小值(Xmin)之差-是一群分數變異情形最粗略的指標 -全距容易計算,適用性高,可以應用在名義變項與順序變項,來求出變項當中類別的多寡。-缺點是不精確也不穩定,無法反應一個分配的每個數值的狀態。四分差 四分差 (semi-interquartile range; QR)-是一組數據當中的第三四分位數(區隔高分端 的前25%的分數,簡稱03)與第一四分位數 (區隔低分端的後25%的分數,簡稱0/)距
9、離的一半-中間百分之五十的樣本分數差距的二分之一(QQ)2第二節第八章描述統計23/31量化研究與統計分析離均差與平方和離均差-一組數據中,各分數與平均數的距離,通常以小寫的X 來表示-當離均差為正值時,表示分數落在平均數的右方-離均差為負值時,表示分數落在平均數的左方-平均數是每一個分數加總後的平均值,為一組分數的 重心位置deviation score= x =(X - p)-功用:用以顯示數值在群體中的位置離均差平方和(sum of squares; SS )in-ss的概念可以類比為面積的概念,表示分數與平均數 變異的面積和°第二節第八章描述統計23/31離均差與平方和離均差
10、平方和(sum of squares; SS )-SS的概念可以類比為面積的概念,表示分數與 平均數變異的面積和£八呼旳一1變異數與標準差變異數(variance)-平均化的離均差平方和標準差-變異數的開方,以o表示。標準差或變異數越大者5表示該分配的變異情形較大(較分散)°第二節25/31變異數的不偏估計數標準差與變異數的不偏估計數的主要差別在於分母項為M /而非原來的N N-1稱為自由度(degree of freedom ; df),表示一組分數 當中,可以自由變動的分數的個數。在離均差的計算上,自由度為樣本數減1,表示在N個觀察 值中,只有NJ個數字可以自由運用於離
11、均差的計算。量化研究與統計分析變異量數的特性與優缺點比較淑層次離散量數四分差名義銅上淬優點不受®W HW砺吩數 景缰,計算方法簡便, 族於所創勺泯交不極偉異邮測量最爲猜密,考慮 至酬康本,具有 代表1生。缺點測量過於粗糙,無法反 昨有樣兄。無两好斤有樣本 偉Ml充兄。白醵缰。偏態(Skewness)描述一個變項的對稱性(symmetry)的量數稱為偏態係數不對稱的資料稱為偏態資料,依其方向可分為負偏(negatively skewed )(或左偏、即左側具有偏離值) 正偏(positively skewed )(或右偏,即右側具有偏離值) 與對稱(symmetrical)三種情形土也
12、板與天花板效應地板效應(floor effect)-指數據多數集中在偏低的一端,但在高分端則有極端 值,分數不容易突破低分端,但會往高分端延伸,彷 彿有一個地板(或真的存在一個低分限制條件)阻擋 了數據往低分移動。-由於地板阻隔作用,地板效應常伴隨正偏態現象。天花板效應(ceiling effect)-則與負偏態有關,是指數據多數集中在偏高的一端, 但在低分端則有極端值,分數不容易突破高分端,彷 彿有一個天花板(或真的存在一個高分限制條件)阻 擋了數據往高分移動。峰度(Kurtosis)-是指一個次數分配集中部份的陡哨程度。-兩個分配都是對稱的單峰鐘型曲線時,並不一定具有一樣的平 坦或陡峭形態
13、(嘩度)。-一個對稱的鐘型分配,變項的數值會集中於眾數所在位置,如 果集中於眾數附近的分數多,分散於兩側的分數少,將形成高 狹峰(leptokurtic)的分配-當集中於眾數附近的分數較少,兩側分數多,則形成低闊峰(platykurtic ) °-在常態分配時的理想峰度稱為常態峰(mesokurtic) °第三節第八章描述統計31/31量化研究與統計分析數據的解讀相對量數-絕對意義:由數值大小反應-相對意義:需從相對比較,甚至於進行變項數據的標 準化,才能對於數據的意義進行正確解讀。相對量數或相對地位量數(measures of relativeposition )-描述個
14、別觀察值在團體中所在相對位置的統計量-將某特定觀察值在樣本中所處的位置,以其他分數進行參照,計算出觀察值在該變項上分數的團體地位(位置)-常用的相對量數包括百分等級,百分位數,標準分數百分等級與百分位數百分等級(percentile rank; PR)-係指觀察值在變項上的分數在體中所在的等級第四節第八章描述統計35/31-在一百個人中,該分數可以排在第幾個等級。-例如PR = 50代表某一個分數在團體中可以勝過50%的人,他的分 數也恰好是中位數。百分位數(percentile point; Pp)-係指在樣本中位居某一個等級的觀察值之分數-若想在一百個人的樣本中贏過多少百分之多少的人,則他
15、的分數 必須得到多少分-例如中位數為60分時,表示有50%的人比60分還低,此時我們可 以說第50百分位數為60分以P50=60表示之。兩者的數學關係-百分等級是將原始分數轉化為等級(百分比)-百分位數則是由某一等級來推算原始分數百分等級與百分位數的計算樣本數少時-將資料依序排列,算出累積百分比,即可對應出每一 分數的百分等級-亦可從百分等級推算出各特定百分位數樣本數大時-百分等級的計算必須以分組貪料的方式來整理貪料-百分等級的換算,必須以公式來計算之1O7V量化研究與統計分析標準分數標準分數(standard scores )-利用線性轉換的原理,將一組數據轉換成不具有實質 的單位與集中性的
16、標準化分數。-不同的標準分數,其共通點是利用一個線性方程式 y=bx+a進行集中點的平移與重新單位化,使得不同量 尺與不同變項的測量數據具有相同的單位與相同的集 中點,因此得以相互比較。常用的標準分數-Z分數 -T分數(T二 10Z+50)SAT考試(Scholastic Assessment Test) (SAT=100Z+500)-比西測驗IQ分數(平均數為100,標準差為16的標準分 數)(IQ二16Z+100),魏氏智力測驗為15Z+100Z分數定義-指原始分數減去其平均數,再除以標準差後所得到的新分數-表示該原始分數是落在平均數以上或以下幾個標準差的位置上as以母體資料為基礎時以樣本
17、資料為基礎時 Z分數的特性-任何一組數據經過z公式轉換後,均具有平均數為o,標準差為1 的特性-Z分數可以作分配內與跨分配的比較。-z分數僅是將原始分數進行線性轉換,並未改變各分數的相對關 係與距離,因此z分數轉換並不會改變分配的形狀。常態分配常態分配(normal distribution )-指一個隨機變項的觀察值,呈現對稱的鐘形曲線分配由德國數學家Gauss ( Karl F. Gauss ; 1777-1855 )所提出,因此又 稱為高斯分配(Gaussian distribution ) °圖3.1常態曲線與累積扌幾率圖常態分配的特性常態曲線並沒有兩端點極限值-當尸卩時,函
18、數值/匕丿達到最高點-當X趨近無限大時函數值/W則趨近為0機率分配-常態曲線內的機率變化呈現數學規則-分配內絕大多數的機率(99.7%)落於正負3個標準差之內-一般來說,常態化的分配全距約為6個標準差反曲點(inflection points )-距離平均數負一個標準差位置上,切線斜率由漸增轉為漸 減-在距離平均數正一個標準差位置上,切線斜率由漸減轉為 漸增標準化常態分配與其應用標準化常態分配(standard normal distribution )-某一變項的觀察值呈現常態分配,經轉換後的z分數所 形成的分配稱之-常態分配的變數X已經不是原始分數,而是Z分數-Z分數是距離平均數幾個標準差的量數,不同的Z值, 即代表距離平均值多少個標準差,透過機率對照表, 可以很快的查出Z值與機率間的關係在常態分配中-68.26%的觀察值落
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 交通事故和解合同范本
- 产品采购合同范本
- 中小企业合同法务服务发展规划定
- 个人商用房抵押贷款合同模板
- 产品销售独家代理合同模板
- 个人向单位租车合同及条款
- 个人向个人创业借款合同范本
- 临时工劳动合同范本(合同仅限劳务派遣使用)
- 个人住宅抵押借款合同简例范本
- 兼职人员劳务合同协议
- 2025江苏南京市金陵饭店股份限公司招聘高频重点提升(共500题)附带答案详解
- 公共政策分析 课件汇 陈振明 第0-9章 导论、绪论:政策科学的“研究纲领”- 政策监控
- 2025年牛津译林版英语七年级下册全册单元重点知识点与语法汇编
- 《小学作文指导》课件
- 小学六年级数学方程应用题100道及答案解析
- 2025新译林版英语七年级下单词表
- 海洋工程设备保温保冷方案
- 文艺演出排练指导服务合同
- 人教版(2024新版)一年级上册数学第一单元《数学游戏》单元整体教学设计
- 中山大学孙逸仙纪念医院医用耗材试用登记表【模板】
- 卫生部关于发布《综合医院组织编制原则试行草案》的通知((78)卫医字第1689号)
评论
0/150
提交评论