教育统计学课件离散趋势的度量_第1页
教育统计学课件离散趋势的度量_第2页
教育统计学课件离散趋势的度量_第3页
教育统计学课件离散趋势的度量_第4页
教育统计学课件离散趋势的度量_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

教育统计学课件离散趋势的度量第1页,共34页,2023年,2月20日,星期五本章要点:1.平均差、方差、标准差与差异系数;2.全距、四分位差和百分位差;第2页,共34页,2023年,2月20日,星期五什么是差异量数(Variance)?VarianceisDescriptivestatisticsthatusetosummarizeandreportthedegreetowhichscoresvaryfromoneanotherinadata.差异量数是用来总结和报告数据集中的数据彼此间的差异程度的统计量数。差异量数描述数据间彼此差异的程度,也叫离中趋势,差异量数包括平均差、方差、标准差、全距、四分位差、百分位差等。这些量数反映了数据的离散程度,即数据的变异性。第3页,共34页,2023年,2月20日,星期五平均差平均差是指次数分布中所有原始数据与平均数绝对离差的平均值。平均差用A.D.表示。其计算方法是:①未分组数据(原始数据)计算法

②数据分组后(次数分布表)计算法第4页,共34页,2023年,2月20日,星期五某电脑公司销售量数据平均差计算表按销售量分组组中值(xc)次数(fi)140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合计—120—2040第5页,共34页,2023年,2月20日,星期五解:含义:每一天的销售量平均数相比,平均相差17台第6页,共34页,2023年,2月20日,星期五平均差的优缺点平均差意义明确,计算容易,反应灵敏,较好地代表了数据分布的离散程度。但它计算要用绝对值,不利于进一步做统计分析,应用受到了限制,属于一种低效差异量数。第7页,共34页,2023年,2月20日,星期五方差与标准差(VarianceandStandardDeviations)Varianceisameasureofdispersioncalculatedbydividingthesumofthesquareddeviationscoresbythenumberofobservations.StandardDeviationisthesquarerootofthevariance.方差是一种离散程度的量数,通过将离均差的平方和除以数据的个数计算而来。标准差是方差的平方根。方差是指离均差(即每个数据与该组平均数之差)平方的算术平均数。用表示。标准差用表示。第8页,共34页,2023年,2月20日,星期五方差的计算方法①未分组数据(原始数据)计算法

②数据分组后(次数分布表)计算法第9页,共34页,2023年,2月20日,星期五标准差的计算方法①未分组数据(原始数据)计算法

②数据分组后(次数分布表)计算法第10页,共34页,2023年,2月20日,星期五标准差的合成方差、标准具有可加性,在已知几个小组的方差或标准差的情况下,可以计算出几个小组联合在一起的总的方差或标准差。;为总平均数;为各组平均数;第11页,共34页,2023年,2月20日,星期五分组数据的标准差计算某电脑公司销售量数据标准差计算表按销售量分组组中值(Xc)次数(fi)140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合计—120—55400第12页,共34页,2023年,2月20日,星期五标准差含义:每一天的销售量与平均数相比,平均相差21.49台。第13页,共34页,2023年,2月20日,星期五标准差的性质①每一个观察值都加一个相同常数C之后,计算得到的标准差等于原标准差。②每一个观察值都乘以一个相同常数C,则所得的标准差等于原标准差乘以这个常数。③每一个观察值都乘以一个相同常数C(C≠0),再加一个常数d,所得的标准差等于原标准差乘以这个常数。第14页,共34页,2023年,2月20日,星期五方差与标准差的特点①方差与标准差是表示一组数据离散程度的最好的指标。它们是描述统计与统计推断分析中最常用的差异量数。②标准差基本具备一个良好的差异量数应具备的条件:反应灵敏;严密确定;容易计算;适合代数运算;受抽样变动的影响小;简单明了。标准差与其他各种差异量数相比,具有数学上的优越性,特别是当已知一组数据的平均数与标准差后,就可以知道落在平均数上下各一个标准差、两个标准差,或三个标准差范围之内的数据所占的百分比。第15页,共34页,2023年,2月20日,星期五差异系数(VarianceandStandardDeviations)差异系数是指标准差与其算术平均数的百分比,用CV表示。又名变异系数,其计算公式如下:第16页,共34页,2023年,2月20日,星期五差异系数的应用①同一团体不同观测值离散程度的比较(即不同单位资料差异程度的比较);②对于水平相差较大,但进行的是一种观测的各种团体,进行观测值离散程度的比较(即单位相同而平均数相差较大的两组资料差异程度的比较)。第17页,共34页,2023年,2月20日,星期五某管理局所属8家企业的产品销售数据企业编号产品销售额(万元)x1销售利润(万元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度;第18页,共34页,2023年,2月20日,星期五解:结论:计算结果表明,cv1<cv2,说明产品销售额的离散程度小于销售利润的离散程度;Cv1=536.25309.19=0.577cv2=32.521523.09=0.710第19页,共34页,2023年,2月20日,星期五某管理局所属8家企业的产品销售数据企业编号产品销售额(万元)x1销售利润(万元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度;第20页,共34页,2023年,2月20日,星期五解:第21页,共34页,2023年,2月20日,星期五解:第22页,共34页,2023年,2月20日,星期五解:第23页,共34页,2023年,2月20日,星期五解:结论:计算结果表明,cv1<cv2,说明产品销售额的离散程度小于销售利润的离散程度;第24页,共34页,2023年,2月20日,星期五全距全距是一组数据中最大值与最小值之差。全距用R表示。其计算方法为:原始数据的全距是最大值与最小值之差。次数分布表的全距一般是最大一组与最小一组的组中值之差,或者是最大一组上限与最小一组下限之差。第25页,共34页,2023年,2月20日,星期五全距的特点与应用全距概念清楚,意义明确,计算简单,是最简单的离散程度测度值;但它仅由最大值与最小值而求得,易受两极端数值影响。不考虑中间数值的差异,反应不灵敏,未考虑数据的分布,因此,它只是一种低效的差异量数。它的用处一般只用于研究的预备阶段,用它检查数据的大概散布范围,以便确定如何进行统计分组。7891078910第26页,共34页,2023年,2月20日,星期五百分位数百分位数是位于依一定顺序排列的一组数据中某一百分位置的数值。百分位数一般用表示。:百分位数的计算公式为:第m百分位数;百分位数所在组的组下限百分位数所在组的组上限百分位数所在组的次数;小于L的累积次数;大于U的累积次数;第27页,共34页,2023年,2月20日,星期五百分等级百分等级是指表示某一分数在整个分数分布中所处的百分位置。百分等级用表示。:百分等级的计算公式为:小于L的累积次数;某特定原始变量所在组的组下限某特定原始变量所在组所在组的次数第28页,共34页,2023年,2月20日,星期五百分位差百分位差是指两个百分位数之差,常用的百分位距有两种:一为第90与第10百分位数之差;一为第93与第7百分位数之差;百分位差的意义与应用百分位差与全距相比,可以避免两端极值的影响,但仍然不能很好地反映中间数据的散布情况,因此只作为主要差异量的补助量数,在实践中很少使用。第29页,共34页,2023年,2月20日,星期五四分位数排序后处于25%和75%位置上的值第25百分位数,其位置:第75百分位数,其位置:Q1Q2Q325%25%25%25%第30页,共34页,2023年,2月20日,星期五9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789第31页,共34页,2023年,2月20日,星期五10个家庭的人均月收入数据排序:

660

75078085096010801250150016302000位置:1234

5678910第32页,共34页,2023年,2月20日,星期五四分位差四分位差是指在一个次数分布中,中间50%的次数的全距的一半。也称为内距或四分间距。四分位差用Q表示。其计算公式为:四分位差的意义与应用反映了中间50%数据的离散程度,不受极端值的影响。不能很好地反映中间数据的散布情况。第33页,共34页,2023年,2月20日,星期五优良

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论