教育统计学课件集中趋势的度量_第1页
教育统计学课件集中趋势的度量_第2页
教育统计学课件集中趋势的度量_第3页
教育统计学课件集中趋势的度量_第4页
教育统计学课件集中趋势的度量_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

教育统计学课件集中趋势的度量第一页,共四十页,编辑于2023年,星期六本章要点:1.众数;2.中数;3.算术平均数;4.其它集中量数(加权平均数、几何平均数等)第二页,共四十页,编辑于2023年,星期六什么是集中量数(MeasuresofCentralTendency)?Descriptivestatisticsthatsummarizedatabydescribingthemosttypicalorrepresentativevalueinthedataset,includingmode,medianandmean.通过描述数据集中最典型最有代表性的值的方式来总结数据的统计量数。描述数据集中趋势的统计量数称为集中量数,集中量数包括众数、中数和算术平均数等。这些量数反映数据向某个方向集中的趋势。第三页,共四十页,编辑于2023年,星期六什么是众数(Mode)?Ameasureofcentraltendencythatrepresentsthemostfrequentlyoccurringscoreinadataset.集中量数的一种,数据集最常出现的(出现次数最多)的分数。众数又称范数,是指次数分布中出现次数最多的那个数的数值。众数的符号:第四页,共四十页,编辑于2023年,星期六什么是众数(Mode)?Ameasureofcentraltendencythatrepresentsthemostfrequentlyoccurringscoreinadataset.众数有理论众数和粗略众数两种定义方法。粗略众数是指一组数据(或次数分布)中次数出现最多的那个数的数值。理论众数是指与次数分布曲线最高点相对应的横坐标上的一点。第五页,共四十页,编辑于2023年,星期六众数的计算方法用观察法直接寻找粗略众数在一组原始数据中,次数出现最多的那个数值就是众数;在次数分布表中,次数最多一组的组中值就是粗略众数。第六页,共四十页,编辑于2023年,星期六720005400026400240001920019200192001800016800168001680014400144001440014400众数:最常出现的那个值。Mode=第七页,共四十页,编辑于2023年,星期六众数的计算方法用经验公式求理论众数的近似值

①皮尔逊经验法(适合正态分布)②金氏插补法(适合偏态分布)

为含众数这一区间的精确下限;为组距;为高于众数所在组一个组距那一分组区间的次数;为低于众数所在组一个组距那一分组区间的次数;第八页,共四十页,编辑于2023年,星期六分数段频数52.5~62.5462.5~72.51072.5~82.51382.5~92.51192.5~102.52合计40表2-1某班一次数学测验成绩的频数分布表注:本数据纯属虚构,如有雷同,定是巧合53,53,61,61,63,65,67,67,69,69,69,70,70,71,74,75,75,76,77,78,79,80,81,81,81,81,82,84,85,86,87,87,87,88,89,90,91,91,94,95第九页,共四十页,编辑于2023年,星期六

众数的优缺点众数虽然简明易懂,较少受两极端数值的影响,但它并不具备一个良好集中量数的基本条件。如极不准确、稳定,反应不灵敏,不适合代数运算,受抽样的影响较大等。在一般情况下,众数应用也不广泛,但在一些特殊情况下也常有应用。第十页,共四十页,编辑于2023年,星期六众数适用的情况当需要快速而粗略地寻求一组数据的代表值时;当一组数据出现不同质的情况时;当次数分布中有两极端的数目时;当粗略估计次数分布的形态时。第十一页,共四十页,编辑于2023年,星期六

学校要召开运动会,决定从高一年级8个班中抽调40名男生组成一个整齐的彩旗方阵队,如果从高一(1)班的体检表中任意抽出10份男生表格,得到10个男同学的身高(单位:米)如下:

1.631.601.681.661.661.631.751.661.581.65请根据这10个身高值提供的信息确定参加方队学生的最佳身高值应取多少?并说明理由。思考题:第十二页,共四十页,编辑于2023年,星期六

参加方队学生的最佳身高值应取1.66。这是因为从这10个身高值可以看出,1.66出现的次数最多,是这组数的众数,既然这10个男生中有3个身高为1.66米,而一个班远不止10个男生,那么8个班的男生中应该能选出40名这种身高的人。答:第十三页,共四十页,编辑于2023年,星期六什么是中数(Median)?Ameasureofcentraltendencythatrepresentsthemidpointofthedistributionofscores.One-halfthescoresfallaboveandone-halfbelowthispoint.也是集中量数的一种,代表数据分布的中点。这个点以下和以上均有一半的数据。中数又称中位数,是指位于一组数据数列中间位置的那个数。它的符号记为。第十四页,共四十页,编辑于2023年,星期六什么是中数(Median)?Ameasureofcentraltendencythatrepresentsthemidpointofthedistributionofscores.One-halfthescoresfallaboveandone-halfbelowthispoint.也是集中量数的一种,代表数据分布的中点。这个点以下和以上均有一半的数据。中数可以是某个原始数据,也可以是一个计算值。它应该是将一组按大小顺序排列的数据平均分为大小相等两部分的那个数。第十五页,共四十页,编辑于2023年,星期六中数的计算方法数据中无重复数值的情况指一组数据中没有相同的数,这时取处于序列中间位置的那个数为中数。如果数据个数为奇数,则中数为位置的那个数;如果数据个数为偶数,则中数为居于中间位置两个数的平均数,即第与第位置的两个数据的平均数。第十六页,共四十页,编辑于2023年,星期六中数的计算方法数据中有重复数值的情况指一组数据中有相同数值的数据,这时计算中数的方法基本与无重复数值的单列数据相同。但根据重复数值数据在该组数据中所处的位置又细分为以下两种情况:①当重复数值没有位于数列中间时,求中数的方法与无重复数据时求中数的方法相同。②当重复数目位于数列中间时,需要假设位于中间的几个重复数目为连续数目,取序列中上下各

那一点上的数值为中数。第十七页,共四十页,编辑于2023年,星期六7200054000264002400019200192001920018000中数:数据分布中的中间值。16800168001680014400144001440014400Median=众数:最常出现的那个值。Mode=第十八页,共四十页,编辑于2023年,星期六中数的计算方法分组数据将原始数据整理成次数分布表后,求中数的原理同重复数目求中数是一样的,也是取序列中将N平分为两半的那一点的值作为中数。

或式中

为中数所在分组区间的精确下限,

为中数所在分组区间的精确上限,

为该组以下各组的累加次数,

为该组以上各组的累加次数,

为该组的次数。第十九页,共四十页,编辑于2023年,星期六分数段频数52.5~62.5462.5~72.51072.5~82.51382.5~92.51192.5~102.52合计40表2-1某班一次数学测验成绩的频数分布表注:本数据纯属虚构,如有雷同,定是巧合53,53,61,61,63,65,67,67,69,69,69,70,70,71,74,75,75,76,77,78,79,80,81,81,81,81,82,84,85,86,87,87,87,88,89,90,91,91,94,95第二十页,共四十页,编辑于2023年,星期六

中数的优缺点中数虽然也具备一个良好集中量数所应具备的一些条件,如计算简单,严密确定,简明易懂;但与算术平均数相比是相形见绌的,如反应不够灵敏,受抽样的影响较大,不适合代数运算等。因此,在一般情况下,中数不被普遍应用,但在一些特殊情况下,它的应用受到重视。第二十一页,共四十页,编辑于2023年,星期六

中数适用的情况当一组观测结果中出现极端数目时;当次数分布的两端数据或个别数据不清楚时;当需要快速估计一组数据的代表值时。第二十二页,共四十页,编辑于2023年,星期六

由于这19名大学生的月消费中存在极端数据,算术平均数不能很好地反映他们的平均月消费,应求中数:

答:这些大学生的平均月消费是239元。

一项研究调查了19名大学生,他们的月消费(单位:人民币元)如下:

220,227,230,231,232,232,235,236,

237,239,240,245,246,249,253,258,

260,510,600现欲了解他们的平均月消费?思考题:解:第二十三页,共四十页,编辑于2023年,星期六什么是算术平均数(Mean)?AmeasureofcentraltendencythatisthesumofallthevaluesinthedatasetdividedbyN.也是集中量数的一种,用所有数据之和除以N就得到算术平均数。算术平均数是所有观察值的总和除以总频数所得之商。统计学中常常区分样本平均数()和总体平均数()。第二十四页,共四十页,编辑于2023年,星期六算术平均数的计算方法原始数据的计算方法第二十五页,共四十页,编辑于2023年,星期六72000540002640024000算术平均数:所有观测值的总和除以观测数值的个数所得的商数。19200192001920018000Mean=中数:数据分布中的中间值。16800168001680014400144001440014400Median=众数:最常出现的那个值。Mode=第二十六页,共四十页,编辑于2023年,星期六算术平均数的计算方法分组数据的计算方法

表示对次数分布表计算的算术平均数;表示各组的组中值;表示各组对应的次数;表示总次数。第二十七页,共四十页,编辑于2023年,星期六分数段频数52.5~62.5462.5~72.51072.5~82.51382.5~92.51192.5~102.52合计40表2-1某班一次数学测验成绩的频数分布表注:本数据纯属虚构,如有雷同,定是巧合53,53,61,61,63,65,67,67,69,69,69,70,70,71,74,75,75,76,77,78,79,80,81,81,81,81,82,84,85,86,87,87,87,88,89,90,91,91,94,95第二十八页,共四十页,编辑于2023年,星期六

算数平均数的性质①在一组数据中每个变量与平均数之差的总和等于0,即:②在一组数据中,每一个数都加上一常数C,则所得的平均数为原来的平均数加常数C,即:③在一组数据中,每一个数都乘以一常数C,则所得的平均数为原来的平均数乘以常数C,即:第二十九页,共四十页,编辑于2023年,星期六

算数平均数的性质④一列数据中每个数乘以一个常数C,再加上一常数d,其平均数等于原平均数乘以常数C再加上常数d。⑤一组数据中每个数与任意常数c的差的平方和,不小于该组数据中每个数与平均数的差的平方和。第三十页,共四十页,编辑于2023年,星期六第三十一页,共四十页,编辑于2023年,星期六算术平均数的优缺点①优点:算术平均数是一个良好的集中量数,具有反应灵敏、计算严密、简明易解、计算简单、适合进一步演算和较小受抽样变化的影响等。②缺点:算术平均数易受极端数据的影响,这是因为平均数反应灵敏,每个数据的或大或小的变化都会影响到最终结果;出现模糊不清的数据时,无法计算平均数。注意:不同质的数据不能计算平均数(同质数据是指使用同一观测手段,采用相同的观测标准,能反映某一问题同一方面特质的数据),因为不同质的数据观测手段、测量标准不一致。第三十二页,共四十页,编辑于2023年,星期六算术平均数、众数和中数的关系①当次数分布呈正态时:②当次数分布呈正偏态时:且③当次数分布呈负偏态时:且第三十三页,共四十页,编辑于2023年,星期六负偏分布均值

中位数

众数对称分布

均值=中位数=

众数正偏分布众数

中位数均值第三十四页,共四十页,编辑于2023年,星期六比较的项目平均数(M)中数(Md)众数(Mo)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论