人教A版(2019)高中数学必修第二册9.2.3总体集中趋势的估计【课件】_第1页
人教A版(2019)高中数学必修第二册9.2.3总体集中趋势的估计【课件】_第2页
人教A版(2019)高中数学必修第二册9.2.3总体集中趋势的估计【课件】_第3页
人教A版(2019)高中数学必修第二册9.2.3总体集中趋势的估计【课件】_第4页
人教A版(2019)高中数学必修第二册9.2.3总体集中趋势的估计【课件】_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

9.2.3

总体集中趋势的估计主讲人:刘仙舟学 科:数学(人教A版)学 校:北京市第八十中学年 级:高一下学期高中数学【学习目标】结合实例,会求样本数据的平均数、中位数、众数,了解它们的区别与联系.理解它们的含义.

并能用样本集中趋势去估计总体的集中趋势.掌握由样本频率分布表和频率分布直方图去估计总体分布的众数、中位数和平均数的方法.【重点难点】掌握由样本频率分布表和频率分布直方图去估计总体分布的众数、中位数和平均数的方法.高中数学【知识回顾】n为x

=1(x1+x2+

⋯+xn).一.众数、中位数和平均数的概念:在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.众 数:一组数据中出现次数最多的数称为这组数据的众数.中位数:将一组数据按从小到大排序,把处在最中间位置的一个数(或者是最中间两个数的平均数)叫做这组数据的中位数.平均数:如果一组数据是x1,

x2⋯xn,则这组数据的平均数刻画“中心位置”高中数学实例 9.2.1节中100户居民用户的月均用水量的调查数据.假设通过简单随机抽样,获得了100户居民用户的月均用水量数据(单位:t):高中数学【例题】例4

利用9.2.1节中100户居民用户的月均用水量的调查数据,计算样本数据的平均数和中位数,并据此估计全市居民用户月均用水量的平均数和中位数.解:根据9.2.1节中100户居民用户月均用水量的数据,由样本平均数的定义可得100即100户居民的月均用水量的平均数为8.79t.y

=y1+y2+⋯+y100=

8.79,高中数学将样本数据按从小到大排序,

得第50个数和第51个数分别为6.8,

6.8,由中位数的定义可得:6.8+6.8=

6.8.2即100户居民的月均用水量的中位数是6.8t.数据是抽自全市居民户的简单随机样本,所以我们可以据此估计全市居民用户的月均用水量约为8.79t,

其中位数约为6.8t.高中数学小明用统计软件计算了100户居民用水量的平均数和中位思考数,但在录入数据时,不小心把一个数据7.7录成了77,请计算录入数据的平均数和中位数,并与真实的样本平均数和中位数作比较,哪个量的值变化更大?你能解释其中的原因吗?通过简单计算可以发现,平均数由原来的8.79t变为9.483t,中位数没有变化,还是6.8t.我们可以多改变几个数据的值来观察平均数和中位数的变化,如果我们将数据中的2.0变为200,我们再来计算一下平均数和中位数.通过计算,我们发现平均数改变比较大,为16.71t.但中位数改变不大,为7.1t.高中数学由此发现,因为样本平均数与每一个样本数据有关,样本中的任何一个数据的改变都会引起平均数的改变;但中位数只利用了样本数据中间位置的一个或两个值,并未利用其他数据,所以不是任何一个样本数据的改变都会引起中位数的改变,因此,与中位数相比较,平均数反映出样本数据中的更多信息,

对样本中的极端值更加敏感.高中数学单峰对称在右边“拖尾”在左边“拖尾”和中位数相比,平均数总是在”长尾巴”那边.高中数学例5

某学校要定制高一年级的校服,学生根据厂家提供的参考身高选择校服规格,据统计,高一年级女生需要不同规格校服的频数如表9.2-5所示.如果用一个量来代表该校高一年级女生所需要的规格,那么在中位数,平均数和众数中哪个量比较合适?试讨论用表9.2-5中数据估计全国高一年级女生校服规格的合理性.高中数学分析:

虽然校服规格是用数字表示的,但它们事实上是几种不同的类别,对于这样的分类数据,用众数作为这组数据的代表比较合适.解:观察条形图可以发现,选择校服规格为“165”的女生的频数最高,所以众数165作为该校高一年级女生校服的规格比较合适.由于全国各地的高一年级女生的身高存在一定的差异,所以用一个学校的数据估计全国高一年级女生的校服规格不合理.高中数学众数只利用了出现次数最多的那个值的信息,众数只能告诉我们,它比其他值出现的次数多,但并未告诉我们它比别的数值多的程度.因此,众数只能传递数据中的信息的很少一部分,对极端值也不敏感.

且一组数据中的众数可能不止一个.【小结】一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.高中数学【小结】众数、中位数、平均数都是对数据中心位置的描述,可以作为总体相应特征的估计.

众数,易计算,但只能表达样本数据中的很少一部分信息,不一定唯一;中位数仅利用了数据中排在中间数据的信息,与数据的排列位置有关;平均数受样本中的每一个数据的影响,绝对值越大的数据,对平均数的影响也越大.三者相比,平均数代表了数据更多的信息,描述了数据的平均水平,是一组数据的“重心”.高中数学【小结】平均数与每一个样本数据都有关,受个别极端数据(比其它数据大很多或小很多的数据)的影响较大,因此若在数据中存在少量极端数据,平均数对总体估计的可靠性较差,这时往往用众数或中位数去估计总体.有时也采用剔除最大值与最小值后所得的平均数去估计总体.高中数学中位数是多少吗?为什么平均数比估计出的中位数高很多?练习1:在一次人才招聘会上,有一家公司的招聘员告诉你,“我们公司的收入水平很高”,“去年,在50名员工中,最高年收入达到了200万,员工年收入的平均数是10万”,而你的预期是获得9万元年薪.你是否能够判断年薪为9万元的员工在这家公司算高收入者?如果招聘员继续告诉你,“员工年收入的变化范围是从3万到200万”,这个信息是否足以使你作出自己是否受聘的决定?为什么?如果招聘员继续给你提供了如下信息,员工收入的第一四分位数为4.5万,第三四分位数为9.5万,你又该如何使用这条信息来作出是否受聘的决定?根据(3)中招聘员提供的信息,你能估计出这家公司员工收入的暂停播放高中数学解:(1)能,现在已经知道至少有一个人的收入为200万,那么其他49位员工的收入之和为:

10×

50−200

=

300,

所以每人平均只有6.12万元.

因为平均收入和最高收入相差太多,说明200万元是一个极端值.

9万元的年收入在49人的均值之上,属于单位的高收入者.不能.因为已知有一个极端值,其对均值的影响很大,中位数不受极端值的影响。还要看中位数的大小.

但由“员工年收入的变化范围是从3万到200万”.不能估计中位数的大小.能.由第一四分位数和第三四分位数知,有75%的员工工资在9.5万元以下,其中25%的员工工资在4.5万元以下,在该公司获得9万元的年薪是有难度的.由第一四分位数和第三四分位数,可以估计中位数在7万元左右.

因为有年收入200万这个极端值得影响,使得年平均收入比中位数高许多.暂停播放高中数学如果样本平均数大于样本中位数,说明数据中存在小结:许多较大的极端值,反之,说明数据中存在许多较小的极端值.样本平均数的大小与每一个样本数据有关,任何一个数据的改变都会引起平均数的改变,但中位数只利用了样本数据中间位置的一个或两个值,并未利用其他数据,所以不是任何一个样本数据的改变都会引起中位数的改变.使用者常根据自己的利益去选取使用中位数和平均数来描述数据的中心位置,从而产生一些误导作用.高中数学探究样本的平均数、中位数和众数可以分别作为总体的平均数、中位数和众数的估计.

但在某些情况下,我们无法获知原始的样本数据.

例如我们在报纸,网络上获得的往往是已经整理好的统计表和统计图,这时该如何估计样本的平均数、中位数和众数?你能以图9.2-1中频率分布直方图提供的信息为例,给出估计方法吗?在频率分布直方图中,我们无法知道每个组内的数据是如何分布的.

此时,

通常假设他们在组内均匀分布,这样就可以获得样本的平均数、中位数和众数的近似估计,进而估计总体的平均数、中位数和众数.高中数学所以,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.nx

=

1

(x +

x +

⋯+x )1 2 n中点tnn1 1 2 2 n n∴x

=1(t

n +t

n +

⋯+t ∙

n ),1∴

x

=

t ∙n1+

t ∙n22 nn n n+

⋯+t ∙nn

,∴x

=t1∙e1+t2∙e2+⋯+tn∙

en.一、估计平均数: 设xn=tn∙

nn,频数小矩形面积底边中点横坐标【新知讲解】设:nn

=enn频率高中数学∴x

=t1∙e1+t2∙e2

+⋯+t9∙e9.一、估计平均数:∴x

=0.077×3×

(1.2+

4.2 4.2+

7.22 2)

+

0.107×

(

)+⋯+0.007×3×

(25.2+

28.22)=

8.96.8.96这个结果与根据原始数据计算的样本平均数8.79相差不大.高中数学二、估计中位数:在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.0.077×3

=

0.231, (0.077+0.107)×3=

0.552.因此,

中位数落在区间[4.2,7.2)内,

设中位数为x,0.077×3+0.107×(x−4.2)=

0.5,∴x≈

6.71,x这个结果与根据原始数据求得中位数6.8相差不大.高中数学三、估计众数:在频率分布直方图9.2

1中月均用水量在区间[4.2,7.2)内的居民最多,可以将这个区间的中点5.7作为众数的估计值.即:4.2+7.2=

5.7.2在这个实际问题中,众数“5.7”让我们知道月均用水量在区间[4.2,7.2)内的居民用户最多.这个信息具有实际意义.5.7高中数学【巩固练习】某校从参加高一年级数学测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.求这次测试数学成绩的众数、中位数和平均数.暂停播放高中数学(3)由图可知这次数学成绩的平均数为:x

=0.005×10×

(40+

502)+0.015×10×

(50+

602)+⋯+0.005×10×

(90+

1002)=

72.70+

802=

75.x0.050.150.20.30.1解:(1)由图可知众数为:(2)由图可知,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,∵

0.3

+

0.4>0.5,因此中位数位于第四个矩形内,设中位数为x,则得:(x

−70)

∙0.03

=

0.1,所以

x

73.3.∴中位数约为73.3.∴平均数约为72.高中数学【小结】利用频率分布直方图或频率分布表求出的众数、中位数和平均数均为近似值,往往与实际数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论