教育统计学课件3 集中趋势的度量_第1页
教育统计学课件3 集中趋势的度量_第2页
教育统计学课件3 集中趋势的度量_第3页
教育统计学课件3 集中趋势的度量_第4页
教育统计学课件3 集中趋势的度量_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

心理与教育统计学 第二章 集中趋势的度量 n本章要点: n1. 众数; n2. 中数; n3. 算术平均数; n4. 其它集中量数(加权平均数、几何平均数等 ) n什么是集中量数(Measures of Central Tendency)? nDescriptive statistics that summarize data by describing the most typical or representative value in the data set, including mode, median and mean. n通过描述数据集中最典型最有代表性的值的方式来总结数 据的统计量数。 描述数据集中趋势的统计量数称为集中量数,集中量数 包括众数、中数和算术平均数等。这些量数反映数据向 某个方向集中的趋势。 n什么是众数(Mode)? nA measure of central tendency that represents the most frequently occurring score in a data set. n集中量数的一种,数据集最常出现的(出现次数 最多)的分数。 众数又称范数,是指次数分布中出现次数最多的那个 数的数值。众数的符号: n什么是众数(Mode)? nA measure of central tendency that represents the most frequently occurring score in a data set. 众数有理论众数和粗略众数两种定义方法。 粗略众数是指一组数据(或次数分布)中次数出现最 多的那个数的数值。 理论众数是指与次数分布曲线最高点相对应的横坐标 上的一点。 n众数的计算方法 n用观察法直接寻找粗略众数 n在一组原始数据中,次数出现最多的那个数值就是众数; 在次数分布表中,次数最多一组的组中值就是粗略众数。 72000 54000 26400 24000 19200 19200 19200 18000 16800 16800 16800 14400 14400 14400 14400 众数:最常出现的那个值。 Mode= n众数的计算方法 n用经验公式求理论众数的近似值 n 皮尔逊经验法(适合正态分布) n 金氏插补法(适合偏态分布) 为含众数这一区间的精确下限; 为组距; 为高于众数所在组一个组距那一分组区间的次数; 为低于众数所在组一个组距那一分组区间的次数; 分数段频数 52.562.54 62.572.510 72.582.513 82.592.511 92.5102.52 合计 40 表2-1 某班一次数学测验成绩的频数分布表 注: 本数据纯属虚构,如有雷同,定是巧合 53,53,61,61,63,65,67,67,69,69,69,70,70,71,74, 75,75,76,77 ,78,79,80,81,81,81,81,82,84,85,86 ,87,87,87,88,89,90,91,91,94,95 n 众数的优缺点 n众数虽然简明易懂,较少受两极端数值的影响,但它 并不具备一个良好集中量数的基本条件。 n如极不准确、稳定,反应不灵敏,不适合代数运算, 受抽样的影响较大等。 n在一般情况下,众数应用也不广泛,但在一些特殊情 况下也常有应用。 n 众数适用的情况 n当需要快速而粗略地寻求一组数据的代表值时; n当一组数据出现不同质的情况时; n当次数分布中有两极端的数目时; n当粗略估计次数分布的形态时。 学校要召开运动会,决定从高一年级8个班中抽 调40名男生组成一个整齐的彩旗方阵队,如果从高一(1) 班的体检表中任意抽出10份男生表格,得到10个男同学的 身高(单位:米)如下: 1.63 1.60 1.68 1.66 1.66 1.63 1.75 1.66 1.58 1.65 请根据这10个身高值提供的信息确定参加方队学生的最佳 身高值应取多少?并说明理由。 思考题 : 参加方队学生的最佳身高值应取1.66。这是因为从这 10个身高值可以看出,1.66出现的次数最多,是这组数的 众数,既然这10个男生中有3个身高为1.66米,而一个班 远不止10个男生,那么8个班的男生中应该能选出40名这 种身高的人。 答: n什么是中数(Median)? nA measure of central tendency that represents the midpoint of the distribution of scores. One-half the scores fall above and one-half below this point. n也是集中量数的一种,代表数据分布的中点。这个点以下 和以上均有一半的数据。 中数又称中位数,是指位于一组数据数列中间位置的 那个数。它的符号记为 。 n什么是中数(Median)? nA measure of central tendency that represents the midpoint of the distribution of scores. One-half the scores fall above and one-half below this point. n也是集中量数的一种,代表数据分布的中点。这个点以下 和以上均有一半的数据。 中数可以是某个原始数据,也可以是一个计算值 。它 应该是将一组按大小顺序排列的数据平均分为大小相 等两部分的那个数。 n中数的计算方法 n数据中无重复数值的情况 n指一组数据中没有相同的数,这时取处于序列中间位置的 那个数为中数。 n如果数据个数为奇数,则中数为 位置的那个数; n如果数据个数为偶数,则中数为居于中间位置两个数的平 均数,即第 与第 位置的两个数据的平均数。 n中数的计算方法 n数据中有重复数值的情况 n 指一组数据中有相同数值的数据,这时计算中数的方法 基本与无重复数值的单列数据相同。但根据重复数值数 据在该组数据中所处的位置又细分为以下两种情况: n 当重复数值没有位于数列中间时,求中数的方法与无 重复数据时求中数的方法相同。 n 当重复数目位于数列中间时,需要假设位于中间的几 个重复数目为连续数目,取序列中上下各 那一点上的 数值为中数。 72000 54000 26400 24000 19200 19200 19200 18000 中数:数据分布中的中间值 。 16800 16800 16800 14400 14400 14400 14400 Median= 众数:最常出现的那个值。 Mode= n中数的计算方法 n分组数据 n将原始数据整理成次数分布表后,求中数的原理同重复 数目求中数是一样的,也是取序列中将N平分为两半的那 一点的值作为中数。 n n 或 n式中 为中数所在分组区间的精确下限, 为中数所在分 组区间的精确上限, 为该组以下各组的累加次数, 为 该组以上各组的累加次数, 为该组的次数。 分数段频数 52.562.54 62.572.510 72.582.513 82.592.511 92.5102.52 合计 40 表2-1 某班一次数学测验成绩的频数分布表 注: 本数据纯属虚构,如有雷同,定是巧合 53,53,61,61,63,65,67,67,69,69,69,70,70,71,74, 75,75,76,77 ,78,79,80,81,81,81,81,82,84,85,86 ,87,87,87,88,89,90,91,91,94,95 n 中数的优缺点 n中数虽然也具备一个良好集中量数所应具备的一些条 件,如计算简单,严密确定,简明易懂; n但与算术平均数相比是相形见绌的,如反应不够灵敏 ,受抽样的影响较大,不适合代数运算等。 n因此,在一般情况下,中数不被普遍应用,但在一些 特殊情况下,它的应用受到重视。 n 中数适用的情况 n当一组观测结果中出现极端数目时; n当次数分布的两端数据或个别数据不清楚时; n当需要快速估计一组数据的代表值时。 由于这19名大学生的月消费中存在极端数据,算术平均 数不能很好地反映他们的平均月消费,应求中数: 答:这些大学生的平均月消费是239元。 一项研究调查了19名大学生,他们的月消费 (单位:人民币元)如下: 220,227,230,231,232,232,235,236, 237,239,240,245,246,249,253,258, 260,510,600 现欲了解他们的平均月消费? 思考题 : 解 : n什么是算术平均数(Mean)? nA measure of central tendency that is the sum of all the values in the data set divided by N. n也是集中量数的一种,用所有数据之和除以N就 得到算术平均数。 算术平均数是所有观察值的总和除以总频数所得之商 。 统计学中常常区分样本平均数( )和总体平均数( )。 n算术平均数的计算方法 n原始数据的计算方法 72000 54000 26400 24000 算术平均数:所有观测值 的总和除以观测 数值的个数所 得的商数。 19200 19200 19200 18000 Mean= 中数:数据分布中的中间值 。 16800 16800 16800 14400 14400 14400 14400 Median= 众数:最常出现的那个值。 Mode= n算术平均数的计算方法 n分组数据的计算方法 表示对次数分布表计算的算术平均数; 表示各组的组中值; 表示各组对应的次数; 表示总次数。 分数段频数 52.562.54 62.572.510 72.582.513 82.592.511 92.5102.52 合计 40 表2-1 某班一次数学测验成绩的频数分布表 注: 本数据纯属虚构,如有雷同,定是巧合 53,53,61,61,63,65,67,67,69,69,69,70,70,71,74, 75,75,76,77 ,78,79,80,81,81,81,81,82,84,85,86 ,87,87,87,88,89,90,91,91,94,95 n 算数平均数的性质 n在一组数据中每个变量与平均数之差的总和等于0 ,即: n在一组数据中,每一个数都加上一常数C,则所得 的平均数为原来的平均数加常数C,即: n在一组数据中,每一个数都乘以一常数C,则所得 的平均数为原来的平均数乘以常数C,即: n 算数平均数的性质 n一列数据中每个数乘以一个常数C,再加上一常数d ,其平均数等于原平均数乘以常数C再加上常数d。 n 一组数据中每个数与任意常数c的差的平方和,不 小于该组数据中每个数与平均数的差的平方和。 n算术平均数的优缺点 n优点:算术平均数是一个良好的集中量数,具有反应灵敏 、计算严密、简明易解、计算简单、适合进一步演算和较小 受抽样变化的影响等。 n缺点:算术平均数易受极端数据的影响,这是因为平均数 反应灵敏,每个数据的或大或小的变化都会影响到最终结果 ;出现模糊不清的数据时,无法计算平均数。 n注意:不同质的数据不能计算平均数(同质数据是指使用同 一观测手段,采用相同的观测标准,能反映某一问题同一方 面特质的数据),因为不同质的数据观测手段、测量标准不 一致。 n算术平均数、众数和中数的关系 n当次数分布呈正态时: n当次数分布呈正偏态时: n 且 n当次数分布呈负偏态时: n 且 负偏分布负偏分布 均值均值 中位数中位数 众数众数 对称分布对称分布 均值均值 = = 中位数中位数 = = 众数众数 正偏分布正偏分布 众数众数 中位数中位数均值均值 比较的 项目 平均数(M)中数(Md)众数(Mo) 意义 与其两侧数据距离之 和相等数据的重心 其两侧数据 个数相等 出现次数最多的数, 典型 适用数 据类型 等距、等比顺序 等距 等比 性质 顺序 等距 等比 计算 特性需所有的数据只需中间数据计算迅速 进一步运算可以不可以不可以 受抽样 的影响 较少较大 较大 受分组 的影响 不大较大最大 极端数 的影响 最严重 最少一般 适用场合 一般情况都 用平均数 有极端数据时当 两端数据或个别数据 不清楚时快速估计 代表值时 有极端数据时数 据不同质找典型快 速估计代表值时估 计分布形态时 n加权平均数 n加权平均数是不同比重数据(或平均数)的平均 数,用 表示。 n当测量所得的数据,其单位权重并不相等时,要 用加权平均数来求平均数。计算方法为: 例3某年级5个班的语文考试成绩如下,求该年级语 文平均成绩。 解: n几何平均数 n几何平均数是N个数值连乘积的N次方根,用 表示。其计算方法为: n几何平均数 n几何平均数是N个数值连乘积的N次方根,用 表示。 n在两种情况下适合使用几何平局数: n 当一组数据中有少数数据偏大或偏小,数据的分布呈 偏态时,要用几何平均数作为集中趋势的代表 n 当一组数据几乎是按一定的比例关系变化时,要用几 何平均数计算平均比率。 例如:2、6、18这三个数的几何平均数为 _? 注:如果数据的个数较多,求 几何平均数时就需开高次方, 通常需借助计算器来完成。 1. 请找出下面几组数据中的众数、中数和算术平均数: A: 10, 8, 6, 0, 8, 3, 2, 5, 8, 0; B: 1, 3, 3, 5, 5, 5, 7, 7, 9; C: 119, 5, 4, 4, 4, 3, 1, 0; 2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论