【课件】新课标人教A版数学必修3:2.2.2用样本数字特征估计总体数字特征课件_第1页
【课件】新课标人教A版数学必修3:2.2.2用样本数字特征估计总体数字特征课件_第2页
【课件】新课标人教A版数学必修3:2.2.2用样本数字特征估计总体数字特征课件_第3页
【课件】新课标人教A版数学必修3:2.2.2用样本数字特征估计总体数字特征课件_第4页
【课件】新课标人教A版数学必修3:2.2.2用样本数字特征估计总体数字特征课件_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、(一)众数、中位数、平均数一一 众数、中位数、平均数的概念众数、中位数、平均数的概念中位数中位数:将一组数据按大小依次排列,把处在:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数平均数)叫做这组数据的中位数. 众数众数:在一组数据中,出现次数最多的数据叫:在一组数据中,出现次数最多的数据叫做这组数据的众数做这组数据的众数 平均数平均数: 一组数据的算术平均数一组数据的算术平均数,即即 )(121nxxxnX 问题问题1:众数、中位数、平均数这三个数众数、中位数、平均数这三个数一般都会来自于同一个总体或

2、样本,它们一般都会来自于同一个总体或样本,它们能表明总体或样本的什么性质?能表明总体或样本的什么性质?平均数平均数:反映所有数据的平均水平反映所有数据的平均水平 众数众数:反映的往往是局部较集中的数据信息反映的往往是局部较集中的数据信息 中位数中位数:是位置型数,反映处于中间部位的是位置型数,反映处于中间部位的 数据信息数据信息 1、求下列各组数据的、求下列各组数据的众数和中位数众数和中位数(1)1 ,2,3,3,3,5,5,8,8,8,9,9众数是:3和8(2)1 ,2,3,3,3,5,5,8,8,9众数是:3中位数是:5中位数是:4 2、在一次中学生田径运动会上,参加男子跳高的、在一次中学

3、生田径运动会上,参加男子跳高的17名名运动员的成绩如下表所示:运动员的成绩如下表所示:成绩成绩(米米)150160165170175180185190人数人数23234111分别求这些运动员成绩的众数,中位数与平均数分别求这些运动员成绩的众数,中位数与平均数 。解:在解:在17个数据中,个数据中,1.75出现了出现了4次,出现的次数最多,次,出现的次数最多,即这组数据的众数是即这组数据的众数是1.75上面表里的上面表里的17个数据可看成是按从小到大的顺序排个数据可看成是按从小到大的顺序排列的,其中第列的,其中第9个数据个数据1.70是最中间的一个数据,即这组是最中间的一个数据,即这组数据的中位

4、数是数据的中位数是1.70;答:答:17名运动员成绩的众数、中位数、平均数依次是名运动员成绩的众数、中位数、平均数依次是1.75(米)、(米)、1.70(米)、(米)、1.69(米)。(米)。 这组数据的平均数是这组数据的平均数是1(1.50 2 1.60 3 . 1.90 1)1.6917x 米 二、众数、中位数、平均数与频率众数、中位数、平均数与频率分布直方图的关系分布直方图的关系频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t) 众数在样本数据的频率分布直方图中,众数在样本数据的频率分布直方图中,就是最高矩形的中点

5、的横坐标。就是最高矩形的中点的横坐标。如何在频率分布直方图中估计众数如何在频率分布直方图中估计众数可将众数看作直方图中面积最大长方形的可将众数看作直方图中面积最大长方形的“中心中心”0.52.521.5143.534.5频率频率组距组距0.040.080.150.220.250.140.060.040.02前四个小矩形的前四个小矩形的面积和面积和=0.49后四个小矩形的后四个小矩形的面积和面积和=0.262.02如何在频率分布直方图中估计中位数如何在频率分布直方图中估计中位数分组分组0, 0.5)0.5, 1)1, 1.5)1.5, 2)2, 2.5)2.5, 3)3, 3.5)3.5, 4)

6、4, 4.5合计合计频率频率0.040.080.150.220.250.140.060.040.02149. 022. 015. 008. 004. 002. 0 x02. 202. 02在样本中中位数的左右各有在样本中中位数的左右各有50%的样本数,的样本数,条形面积各为条形面积各为0.5,所以反映在直方图中位数所以反映在直方图中位数左右的面积相等左右的面积相等.,中位数中位数)可将中位数看作整个直方图面积的可将中位数看作整个直方图面积的“中心中心”思考讨论以下问题:思考讨论以下问题:1、2.02这个中位数的估计值,与样本的中这个中位数的估计值,与样本的中位数值位数值2.0不一样,你能解释其

7、中原因吗?不一样,你能解释其中原因吗?答:答:2.02这个中位数的估计值这个中位数的估计值,与样本的中与样本的中位数值位数值2.0不一样,这是因为样本数据的不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的频率分布直方图,只是直观地表明分布的形状,但是形状,但是从直方图本身得不出原始的数从直方图本身得不出原始的数据内容,直方图已经损失一些样本信息。据内容,直方图已经损失一些样本信息。所以由频率分布直方图得到的中位数估计所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致值往往与样本的实际中位数值不一致.如何在频率分布直方图中估计平均数如何在频率分布直方图中估计平均数

8、)()()(1001)(1001100991254110021xxxxxxxxxx1009912541100210081004xxx25 . 4402. 0215 . 008. 025 . 0004. 0=2.02平均数的估计值等于频率分平均数的估计值等于频率分布直方图中每个小矩形的面布直方图中每个小矩形的面积乘以小矩形底边中点的横积乘以小矩形底边中点的横坐标之和。坐标之和。 可将平均数看作整个直方图面积的可将平均数看作整个直方图面积的“重心重心” 思考讨论以下问题:思考讨论以下问题:2、样本中位数不受少数极端值的影响,这样本中位数不受少数极端值的影响,这在某些情况下是一个优点,但它对极端值在

9、某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点。你能举例说的不敏感有时也会成为缺点。你能举例说明吗?明吗?答:优点:对极端数据不敏感的方法能够答:优点:对极端数据不敏感的方法能够有效地预防错误数据的影响。有效地预防错误数据的影响。对极端值不敏感有利的例子对极端值不敏感有利的例子:例如当样本数据质例如当样本数据质量比较差,即存在一些错误数据(如数据录入错量比较差,即存在一些错误数据(如数据录入错误、测量错误等)时,用抗极端数据强的中位数误、测量错误等)时,用抗极端数据强的中位数表示数据的中心值更准确。表示数据的中心值更准确。 缺点:(缺点:(1)出现错误的数据也不知道;)出现错误的数

10、据也不知道;(2)对极端值不敏感有弊的例子:对极端值不敏感有弊的例子:某人具某人具有初级计算机专业技术水平,想找一份收有初级计算机专业技术水平,想找一份收入好的工作。这时如果采用各个公司计算入好的工作。这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:作的参考指标就会冒这样的风险:很可能所选择公司的初级计算机专业技术水平很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数人员的收入很低,其原因是中位数对极小的数据不敏感。据不敏感。这里更好的方法是同时用平均工资这里更好的方法是同时用平均工资和

11、中位数作为参考指标,选择平均工资较高且和中位数作为参考指标,选择平均工资较高且中位数较大的公司就业中位数较大的公司就业. 例例1、下表是七位评委给某参赛选手的打分,总分为、下表是七位评委给某参赛选手的打分,总分为10分,分,你认为如何计算这位选手的最后得分才较为合理?你认为如何计算这位选手的最后得分才较为合理?评委 1号2号3号4号5号6号7号打分 9.69.39.39.69.99.39.4提问:提问:1、电视里评委是怎样给选手打分的?、电视里评委是怎样给选手打分的? 2、为什么这么做?直接取中位数和众数的值不好么?、为什么这么做?直接取中位数和众数的值不好么?三、 众数、中位数、平均数的简单

12、应用众数、中位数、平均数的简单应用特征数特征数 众数众数中位数中位数平均数平均数去掉一个最高分和去掉一个最高分和最低分后的平均分最低分后的平均分去掉两个最高分去掉两个最高分和最低分后的平和最低分后的平均分均分特征值特征值 9394949942944例例2 某工厂人员及工资构成如下:某工厂人员及工资构成如下:人员人员经理经理管理人员管理人员高级技工高级技工工人工人学徒学徒合计合计周工资周工资2200 250220200100人数人数16510123合计合计2200 1500110020001006900(1)指出这个问题中周工资的众数、中位数、平均数)指出这个问题中周工资的众数、中位数、平均数(

13、2)这个问题中,工资的平均数能客观地反映该厂的工资水)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?平吗?为什么? 分析分析:众数为:众数为200,中位数为,中位数为220,平均数为,平均数为300。 因平均数为因平均数为300,由表格中所列出的数据可见,只有,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。均数不能客观真实地反映该工厂的工资水平。三种数字特征的优缺点三种数字特征的优缺点特征数特征数优优 点点缺缺 点点众数众数体现了样本数据的最大体现了样本数据的

14、最大集中点集中点无法客观反映总体无法客观反映总体特征特征中位数中位数不受少数极端值的影响不受少数极端值的影响不受少数极端值的不受少数极端值的影响有时也是缺点影响有时也是缺点平均数平均数与每一个数据有关,更与每一个数据有关,更能反映全体的信息能反映全体的信息.受少数极端值的影受少数极端值的影响较大,使其在估响较大,使其在估计总体时的可靠性计总体时的可靠性降低降低.(二) 周受萍周受萍情境情境; ;甲.乙两名射击队员,在进行的十次射击中成绩分别是:甲: 10; 9; 8; 10; 8; 8; 10; 10; 9.5; 7.5乙: 9; 9; 8,5; 9; 9; 9.5; 9.5; 8.5; 8.

15、5; 9.5试问二人谁发挥的水平较稳定?分析:甲的平均成绩是9环.乙的平均成绩也是9环.一一.实例引入实例引入极差:极差: 一组数据的最大值与最小值的差一组数据的最大值与最小值的差极差越大,数据越分散,越不稳极差越大,数据越分散,越不稳定定极差越小,数据越集中,越稳定极差越小,数据越集中,越稳定极差体现了数据的极差体现了数据的离散程度离散程度离散程度离散程度 为了对两人射击水平的稳定程度为了对两人射击水平的稳定程度,这里我们引这里我们引入了一个新的概念入了一个新的概念,方差和标准差方差和标准差.设一组样本数据设一组样本数据 ,其平均数,其平均数为为 ,则,则x称称s2为这个样本的为这个样本的方

16、差方差,称为这个样本的称为这个样本的标准差标准差,分别称为样本方差、样本标准差,分别称为样本方差、样本标准差它的算术平方根它的算术平方根222121()()() nsxxxxxxn2222121()()() nsxxxxxxnx1,x2,xnp75 v样本中各数据与样本平均数的差的平方样本中各数据与样本平均数的差的平方和的平均数叫做和的平均数叫做样本方差;样本方差;样本方差的样本方差的算术平方根叫做算术平方根叫做样本标准差样本标准差。样本方差。样本方差和样本标准差都是衡量一个样本和样本标准差都是衡量一个样本波动大波动大小小的量,样本方差或样本标准差越大,的量,样本方差或样本标准差越大,样本数据

17、的波动就越大。样本数据的波动就越大。 例例 :计算数据:计算数据89,93,88,91,94,90,88,87的的方差和标准差。(标准差结果精确到方差和标准差。(标准差结果精确到0.1) 解:解: 190( 1 32 14023)908x . 所以这组数据的方差为所以这组数据的方差为5.5,标准差为,标准差为2.3 . 练习:若甲、乙两队比赛情况如下练习:若甲、乙两队比赛情况如下,下列说法哪些下列说法哪些 说法是不正确的:说法是不正确的:甲甲乙乙平均失球数平均失球数平均失球个数的标准差平均失球个数的标准差1. 52. 11. 10. 41、平均来说,甲的技术比乙的技术好;、平均来说,甲的技术比

18、乙的技术好;2、乙比甲技术更稳定;、乙比甲技术更稳定;3、甲队有时表现差,有时表现好;、甲队有时表现差,有时表现好;4、乙队很少不失球。、乙队很少不失球。课本课本p76 例例1:画出下列四组样本数据的直画出下列四组样本数据的直方图,说明它们的异同点方图,说明它们的异同点.(1)(2)(3)(4)课本课本p77-78 例例2:甲乙两人同时生产内径为甲乙两人同时生产内径为25.40mm的一种零件的一种零件.为了对两人的生产质量进行评比,从他们为了对两人的生产质量进行评比,从他们生产的零件中各抽出生产的零件中各抽出20件,量得其内径尺寸如下(单件,量得其内径尺寸如下(单位:位:mm )甲甲乙乙从生产

19、的零件内径的尺寸来看,谁生产的质量较高?从生产的零件内径的尺寸来看,谁生产的质量较高?X甲甲25.401X乙乙25.406s甲甲0.037S乙乙0.068生产过程中的质量控制图生产过程中的质量控制图正态分布:一些总体的分布密度曲线是由它的平均正态分布:一些总体的分布密度曲线是由它的平均数数 与标准差与标准差 完全确定的,我们把这样的分布完全确定的,我们把这样的分布记作记作 ,称为平均数为,称为平均数为 ,方差为,方差为 的的正态分布正态分布.课本课本P79 阅读与思考阅读与思考生产过程中的质量控制图生产过程中的质量控制图1.用样本的数字特征估计总体的数字特征分两类:用样本的数字特征估计总体的数

20、字特征分两类:a.用样本平均数估计总体平均数。用样本平均数估计总体平均数。b.用样本标准差估计总体标准差。样本容量越大,用样本标准差估计总体标准差。样本容量越大,估计就越精确。估计就越精确。2.平均数对数据有平均数对数据有“取齐取齐”的作用,代表一组数据的作用,代表一组数据的平均水平。的平均水平。3.标准差描述一组数据围绕平均数波动的大小,反标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度。映了一组数据变化的幅度。 小结小结1 1、在一次歌手大奖赛上,七位评委为歌手打出的分、在一次歌手大奖赛上,七位评委为歌手打出的分数如下:数如下:9.49.4,8.48.4,9.49.4,9.99.9,9.69.6,9.49.4,9.79.7,去,去掉一个最高分和一个最低分后,所剩数据的平均值和掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为方差分别为_; 2 2、已知数据、已知数据 的方差为的方差为2 2,则求数据,则求数据 的方差。的方差。12

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论