教育统计学-课件_第1页
教育统计学-课件_第2页
教育统计学-课件_第3页
教育统计学-课件_第4页
教育统计学-课件_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

教育统计学從中心位置(centrallocation)到變異(variation)統計學家通過“分布”這個鏡頭研究變異(Wild,2006,p.11)變異是統計思想的核心要素變異在過程中無處不在。個體是可變的,對同樣個體所進行的重複測量也是可變的。在自然界和人類事物中,嚴格確定論的範圍十分有限。拼圖片問題三張大小一樣且印有不同圖案的紙片均被剪成兩小張,充分混合以打亂次序,然後閉上眼睛隨便抽出兩張拼在一起,問能夠拼成一張原圖的可能性。恰好能夠拼成一張原圖的頻率隨實驗次數增多而趨於穩定池塘裏有多少魚?捉--放--捉的方法:捉來c條魚,作標記,放回,充分混合後,再捉r條,其中t條已作標記,記池塘裏有魚N條,則大家有疑问的,可以询问和交流可以互相讨论下,但要小声点變異在不同情境下有著不同的具體的含義在概率情境中,變異主要體現在兩個方面,一個是理論概率和實際頻率之間的差異,另一個是重複試驗所得結果之間的差異在統計中,變異主要存在於不同樣本帶來的不同數據或結果中。包括樣本與總體間的差異;單個樣本中個體間的差異;來自同一個總體的幾個樣本之間的差異,等等。變異variation度量數據離散程度(離開中心的程度)的指標主要有極差(全距)百分位差(百分位數P90與P10之間的距離)四分差(P75與P25之間距離的一半)平均差方差(變異數)、標准差變異系數問題1上海每日最高氣溫統計表(單位:℃)

2月21日2月22日2月23日2月24日2月25日2月26日2月27日2月28日2001年1213 142268 9 12 2002年13 13 129111612 10 據此這兩年同期8天氣溫孰高孰低?氣溫變化哪個更大?說說你對兩組氣溫數據觀察之後的感覺思考:什麼樣的指標可以反映一組數據變化範圍的大小?極差=最大值-最小值平均氣溫都是12℃從極差到平均差問題2平均數、極差都相等,但是感覺還是小明的成績比較集中、穩定,小兵的成績則比較散。那麼什麼樣的指標能反映這種“散”的感覺?離開平均數的遠近程度?各數據與平均值的差再累加?試一試,不行?再想新的指標,試一試,比一比平均差從平均差到方差絕對值計算不方便,能否再改進?得到離均差平方和問題3若有7次測試,小明缺席2次,你的指標還合理嗎?n=5時,定義標准差求方差:先平均,再求差,然後平方,最後再平均引向標准差------數量單位用計算器計算標准差閱讀:早穿皮襖午穿紗從極差到平均差到方差到標准差公式怎麼來的?為什麼要求差?為什麼要平方?為什麼要相加?為什麼要除以n?為什麼要開方?如果只有一個數據,還有變異嗎?為什麼計算器上有Sn-1與Sn之分呢?2004河南省中考題在某旅遊景區上山的一條小路上,有一些斷斷續續的臺階,如下圖所示是其中的甲、乙臺階路的示意圖。請你用所學過的統計知識(平均數、中位數、方差、標准差等)回答下列問題:(1)兩段臺階路有哪些相同點和不同點?(2)哪段臺階路走起來更舒服?為什麼?(3)為方便遊客行走,需要重新整修上山的小路,對於這兩段臺階路臺階數不變的情況下,請你提出合理的整修建議。兩組數據的平均數不相等呢?這時通過比較方差來判別差異大小的方法還管用嗎?要比較初一學生之間身高差異大還是初三學生之間身高差異大要比較身高差異大還是體重差異大(測量單位都不同了)從標准差到相對差異系數兩組數據:5,6,7,8,9和105,106,107,108,109,它們是兩種產品加工後的尺寸,第一組要求加工後產品的尺寸是7cm,第二組則要求是107cm。憑直覺(或者在同一個坐標系中表示它們),生產第二組產品的工藝好於第一組,因為第二組產品的尺寸比第一組產品的尺寸穩定。但是這兩組數據的方差一樣大引入一個新指標――標准差除以平均數後得到的比值,就與我們的感覺一致了,這個新指標統計上叫做相對差異系數(標准差變異系數)CV,它更能體現變異的相對性。從中位數到四分位數將全部數據按序由小到大排列後,稱下四分位數為第一四分位數Q1(位於N/4處),中位數為第二四分位數Q2,上四分位數為第三四分位數Q3(位於3N/4處)中位數輔以四分位數對數據的中心位置才比較清楚四分差四分差,它表示的是一段距離,去掉了數列中四分之一最小的部分和四分之一最大的部分四分位距,是。例4-3歸類時,完全仿照歸類時中位數的求法,代公式4-18和4-19使用四分差的利弊因為中間半數數據的穩定性較好,所以分位數差在避免極端值對變異指標的幹擾方面比極差有較大改善在出現無窮大時,無法計算標准差,但可以計算四分差但它依然只用到兩個值,沒有利用每一個數據,穩定性還是不理想。各種變異量數的選用極差——四分差——平均差——標准差是一個越來越精細的過程,包含原始數據的信息也越來越多,因此穩定性越來越好,標准差最為常用平均差作的是絕對值運算,標准差做的是平方運算,當有較多極端值時,平均差更合理四分差更不受絕對值的影響,關心中間的50%數據,以中位數為集中量數時,常輔以四分差當樣本容量很大時,如超過500,標准差約為全距的1/6.在小樣本中,這個比率要小一些(1)將一組數據中的每一個都增加a,這組數據的標准差將怎樣變化?(2)將一組數據中的每一個都平方,這組數據的標准差將怎樣變化?(3)將一組數據中的每一個都乘以a,這組數據的標准差將怎樣變化?標准差的性質不變不變、變大、變小都有可能。平方之後數據本身變化較多a倍相對地位量數因為概括提煉總體中心位置、離散程度的統計量拋棄了許多總體信息,所以宏觀把握總體最直接的辦法還是看分布相對地位量數是用來描述某個數據與某一參照點比較,它在團體中所處的相對地位百分等級、百分位數標准分數(z分數、T分數等等)百分等級PR和百分位數Pp原始百分制分數0100百分等級分為100個等級最低分最高分PR=5050%·NP50表5-1,公式5-1請解釋:原始分數百分等級78994325231歸類時l是第p百分位數所在組真正的下限N是數據總數F是第p百分位數所在組以下的累積頻數fp是第p百分位數所在組的頻數h是組距Pp(原始分數)與PR可以互求累積百分比曲線是對應的形象化求PR有相同分數表5-3,PR是對的結果取整數,得該分數人數之半+小於該分數的人數在總人數中的百分比沒有相同分數取f=1,例5-3原始分數標准分數為什麼要將

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论