第三章集中量数_第1页
第三章集中量数_第2页
第三章集中量数_第3页
第三章集中量数_第4页
第三章集中量数_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章集中量数如何能够快速的了解一组数据?集中量数与差异量数集中量数表现的是数据的集中趋势,指数据分布中大量数据向某方向集中的程度差异量数表现的是数据的离中趋势,指数据分布中数据彼此分离的程度通过集中量数与差异量数可以描述或反映一组数据的全貌及其各种统计特征集中量数算数平均数中数众数加权平均数几何平均数调和平均数

(二)数据值大,利用估计平均数来简化计算条件:如果数据数目及每个观测数据值都很大时,利用估计平均数来简化计算。具体方法是先设定一个估计平均数,用符号AM表示,从每一个数据中减去AM,计算出平均数后再加上估计平均数

三、特点(一)离均差的和等于0,即在一组数据中每个变量与平均数做差后,再求其总和等于0(二)在一组数据中,每一个数据都加上一个常数C,所得的平均数为原来的平均数加常数C(三)在一组数据中,每一个数都乘以一个常数C,所得的平均数为原来的平均数乘以常数C(四)离均差的平方和最小四、意义在大多数情况下,真值的渐近与最佳估计值五、优缺点(一)优点1、反应灵敏,观测数据中任何一个数值或大或小的变化,在计算平均数时都能反映出来。2、计算严密,有确定的公式,只要是同一组观测数据,计算的平均数都相同3、计算简单,应用简单的四则运算4、简单明了,容易理解5、适合于进一步用代数方法演算。在求解其他统计特征值,如离均差、方差、标准差的计算时,都要应用平均数6、较少受抽样变动的影响(观测样本的大小或个体的变化,对计算平均数影响很小)(二)缺点1易受极端数据的影响举例:一个重点班的50名水平相当的学生,在通过一项教育测验时,绝大多数学生得分较高,但个别人由于身体不适或情绪不良得到很低的分数,这时若用平均数代表全班学生的知识水平,则肯定偏低。处理方式:修剪平均数——从一组数据中去除一定百分比(5%)的最大值和最小值数据后,再计算算数平均数(见下页例子)在中央电视台举办的一次全国业余通俗歌手大赛中,假定11位裁判对某位歌手的评分按顺序排列为:9.9,9.3,9.3,9.3,9.2,8.9,8.8,8.8,8.5,8.4,7.4例子:评委打分常用的计算最后得分的方式:去掉一个最高分,再去掉一个最低分,然后计算剩余9个评分的算术平均数。2、若出现模糊不清的数据时,无法计算平均数,这时一般采用中数作为该组数据的代表值3、数据不同质时也不宜使用算数平均数(数据同质:使用同一个观测手段,采用同样的观测标准,能反映某一问题的同一方面特质的数据)六、计算和应用平均数的原则(一)同质性原则同质数据:使用同一观测手段,采用相同的观测标准,能反映某一问题的统一方面特质的数据。高考各科分数相加,计算平均分不能代表该生的水平(二)平均数与个体数值相结合的原则平均数作为整个总体的综合特征,它能够用一个抽象的代表数值反映客观事物的一般水平。但一个总体是由若干个千差万别的个别事物构成的,若要全面而正确的认识这些客观事物,要结合个体数值予以参考(三)平均数与标准差、方差相结合原则平均数反映的是总体数据的集中趋势,但平均数对于总体数据一般水平的代表性如何,要看各个数值之间差异的大小。数据差异大,平均数的代表性就小,差异小,平均数的代表性就大。第二节中数(median)一、定义中数又称中位数,中值,符号为Md或Mdn,指的是按顺序排列在一起的一组数据中居于中间位置的数,即在这组数据中,有一半的数据比它大,有一半的数据比它小。

2、一组数据中有重复数值时(1)重复数值没有位于数列中间,不管数据总数是奇数还是偶数,求中数的方法与无重复数据时的求法一样举例:5,6,6,12,10,15,17(2)重复数值位于数列中间数据的个数为奇数时,中数所在位置为(N+1)/2A、由于该位置的数值为重复数目,所以将其视为占据了一个分数单位的全距,然后被重复几次就划分为几份,求出中间位置数值所占的具体区间后,取区间的组中值即为该组数据的中数举例:11,11,11,11,13,13,13,13,17,17,17B、数据个数为偶数时,N/2与(N+1)/2位置的数据相加除以2即为(N/2位置的组中值加上N+1/2位置的组中值)/2其实正好是N/2位置数据的组上限或者(N+1)/2位置数据的组下限举例:11,11,11,11,13,13,13,17,17,18

举例遗留问题:分组数据中N为偶数,如果N为奇数呢?其它教材上也没考虑这个问题?三、优缺点(一)优点1计算简单,容易理解2概念简单明白(二)缺点1中数的计算不是每个数据都加入,所以其大小没有考虑全体数据2反应不够灵敏,极端值的变化对中数不产生影响3受抽样影响大,不如平均数稳定4计算时需要对数据先排列大小5中数乘以总数与数据的总和不相等6中数不能做进一步代数运算四、中数的应用(一)当一组观测结果中出现极端数目时(二)当次数分布的两端数据或个别数据不清楚时,只能取中数作为集中趋势的代表值(三)当需要快速估计一组数据的代表值时第三节众数(mode)一、定义众数又称为范数,密集数,常用符号M0表示,指在次数分布中出现次数最多的那个数的数值二、计算方法(一)直接观察法1、未分组数据通过观察找出出现次数最多的那个数据2、分组数据通过观察找出次数最多的那个分组区间的组中值为众数注意:分组数据的众数受分组的影响。因为同一组数据,由于分组时组距大小不同,次数在各区间的分布会有所变动,因此众数有可能不同

2、金氏插补法

三、众数的优缺点(一)优点简单明了,容易理解(二)缺点1、受分组影响,不稳定2、受样本变动影响3、计算时不需每一个数据都加入,因而较少受极端数据的影响4、反应不够灵敏5、用观察法得来的数据,不是经过严格计算得来的,用公式所得众数也只是一个估计值6、不能作进一步代数运算7、N乘以众数,与数据总和不相等四、众数的应用(一)当需要快速而粗略地寻求一组数据的代表值时(二)当一组数据出现不同质的情况时(三)当数据中有两极端的数目时,除了用中数外,也可用众数(四)当粗略估计次数分布的形态时,有时用平均数与众数之差,作为表示次数分布是否偏态的指标(五)当一组数据中同时有两个数值的次数都比较多时,也多用众数来表示数据分布形态四、平均数、众数与中数之间的关系(一)在正态分布中,三者相等(二)在偏态分布中,平均数永远位于尾端。中数位于把分布下的面积分成两等份的点值上,它在一边的数据个数等于在它另一边的数据个数,因此在描述偏态分布时,应报告平均数与中数,一般偏态情况下,Md离平均数较近,而离众数较远(三)正偏态分布中M>Md>Mo

负偏态分布中M<Md<Mo(四)只有平均数与各数据之差的总和为0,也只有各个变量与平均数之差的平方和最小老刘办了个厂子,请了自己的弟弟和其他6个亲戚做管理人员。还有5个领工和10工人。为了扩大生产,老刘去人才市场去找新工人。小胡来应聘,老刘说:“我们这里待遇不错,每月平均工资为4500元。”小胡觉得不错,就去老刘的厂子里做工人。几天之后,小胡就跑去质问老刘:“这里没有一个工人的工资是高于1500元,平均工资怎么会有4500元?”而事实上老刘确实没有算错,这到底是怎么回事呢?例子:骗人的平均数老刘(厂长)工资:36000弟弟(副厂长)工资:150006个亲戚(管理人员)工资:37505个领工:300010个工人:1500

年级一二三四90.5919294n236318215200求下列四个年级的总平均成绩

然后再求lgMg的反对数

1、某校连续四年的毕业人数为980、1100、1200、1300人,问毕业生平均增长率是多少?若该校毕业生一直按此增长率变化,问再过五年后的毕业人数是多少?2、某校1950年的教育经费是10万元,1982年的教育经费是121万元,问该校教育经费年增长率是多少?若一直按此增长率增加,请问1990年该校的教育经费是多少?第六节调和平均数(harmomicmean)一、定义与公式调和平均数用MH表示,又称倒数平均数二、应用求单位时间的平均速度1/Xi表示单位工作量所需要的时间N表示不同的被试人数,或同一人不同的工作批次数1、在一个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论