用样本估计总体(课件)-高一数学课堂(苏教版2019)_第1页
用样本估计总体(课件)-高一数学课堂(苏教版2019)_第2页
用样本估计总体(课件)-高一数学课堂(苏教版2019)_第3页
用样本估计总体(课件)-高一数学课堂(苏教版2019)_第4页
用样本估计总体(课件)-高一数学课堂(苏教版2019)_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学习目标1.掌握求样本数据的众数、中位数、平均数。2.理解用样本的数字特征、直方图估计总体的集中趋势。3.理解方差、标准差的含义,会计算方差和标准差。4.掌握求分层随机抽样总样本的平均数及方差的方法。5.通过实例,理解百分位数的含义。探究新知思考:那么,如何合理选择样本数据的“代表值”?初中阶段我们已经学习了用样本平均数作为“代表值”估计总体水平。探究新知核心知识点:一用样本估计总体的集中趋势参数一般地,我们把总体中所有数据的算术平均数称为总体的均值,它通常可以代表总体的水平。在进行统计分析时,我们经常用样本平均数估计总体均值。思考:平均数为什么能够代表整个样本?我们以由实验数据估计其理想近似值为例加以说明:处理实验数据的原则是使近似值与实验数据越接近越好。探究新知核心知识点:一用样本估计总体的集中趋势参数

探究新知核心知识点:一用样本估计总体的集中趋势参数一般地,若取值为x1,x2,…,xn的频率分别为p1,p2,…,pn,则其平均数为x1p1+x2p2+…+xnpn。

探究新知核心知识点:一用样本估计总体的集中趋势参数某超市上个月出售的牙膏(品牌、销售量)的相关数据如表所示。探究新知核心知识点:一用样本估计总体的集中趋势参数对于这组数据,超市更关心怎样的信息?。在这里,5种品牌的牙膏的平均销售量对经营决策已经没有实际意义了。探究新知核心知识点:一用样本估计总体的集中趋势参数一般地,我们将一组数据中出现次数最多的那个数据叫作该组数据的众数。众数是一种刻画数据集中趋势的度量值。下面是某篮球队11名队员一个赛季的得分数据:1089242473433250715183112用怎样的一个数来代表该篮球队的得分"水平"呢?因为有343这个“极端”值,用平均数不恰当。根据众数的定义及特点知,也不适宜采用众数,因为这里11个数据互不相同,并没有哪个数据可以作为众数。如果将这11个数据按从小到大的顺序重新排列,得3242475051718392108112343探究新知核心知识点:一用样本估计总体的集中趋势参数其中正中间的一个数值为71,其两边各有5个数。我们将71称为这组数据的中位数。中位数也是一种刻画数据集中趋势的度量值。一般地,将一组数据按照从小到大的顺序排成一列,如果数据的个数为奇数,那么排在正中间的数据就是这组数据的中位数;如果数据的个数为偶数,那么,排在正中间的两个数据的平均数即为这组数据的中位数。重点探究

成绩(单位:m)1.501.601.651.701.751.801.851.90人数23234111重点探究

重点探究1.平均数、众数、中位数的计算方法平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算。2.众数、中位数、平均数的意义(1)样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大。(2)当一组数据中有不少数据重复出现时,其众数往往更能反映问题,当一组数据中个别数据较大时,可用中位数描述其集中趋势。探究新知核心知识点:二用样本估计总体的离散程度参数有甲、乙两种钢筋,现从中各抽取一个样本检查它们的抗拉强度(单位:kg/mm²),通过计算发现,两个样本的平均数均为125kg/mm²。思考:哪种钢筋的质量较好?探究新知核心知识点:二用样本估计总体的离散程度参数将甲、乙两个样本数据分别标在数轴上,如图所示。我们把一组数据的最大值与最小值的差称为极差。从图中可以看出,乙样本的最小值100低于甲样本的最小值110,乙样本的最大值145高于甲样本的最大值135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定。探究新知核心知识点:二用样本估计总体的离散程度参数这说明甲比乙稳定。运用极差对两组数据进行比较,操作简单方便,但当两组数据的离散程度差异不大时,就不容易得出结论。从图中可看出,乙的极差较大,数据点较分散;甲的极差小,数据点较集中。探究新知核心知识点:二用样本估计总体的离散程度参数结合上节有关离差的讨论,每一抗拉强度与平均抗拉强度的离差的平方和越小,稳定性就越高。由于两组数据的容量可能不同,因此应将上述平方和除以数据的个数,我们把由此所得的值称为这组数据的方差。可以考虑每一抗拉强度与平均抗拉强度的离差。因为方差与原始数据的单位不同,且平方后可能夸大了离差的程度,所以我们将方差的算术平方根称为这组数据的标准差。探究新知核心知识点:二用样本估计总体的离散程度参数

根据上述方差的计算公式可以算得甲、乙两个样本的方差分别为50和165,故可以认为甲种钢筋的质量好于乙种钢筋。极差、方差、标准差都是刻画数据离散程度的度量值。探究新知核心知识点:二用样本估计总体的离散程度参数

重点探究例2:某班20位女同学平均分为甲、乙两组,她们的劳动技术课考试成绩如下(单位:分):甲组60,90,85,75,65,70,80,90,95,80;乙组85,95,75,70,85,80,85,65,90,85.(1)试分别计算两组数据的极差、方差和标准差;(2)哪一组的成绩较稳定?

重点探究

重点探究在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度.在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,数据越集中、越稳定。重点探究例3:某校从参加高一年级期末考试的学生中抽出60名,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后画出如图所示的频率分布直方图.观察图中的信息,回答下列问题:(1)估计这次考试的物理成绩的众数m与中位数n(结果保留一位小数);(2)估计这次考试的物理成绩的及格率(60分及以上为及格)和平均分

重点探究利用频率分布直方图求众数、中位数以及平均数的方法(1)众数即为出现次数最多的数,所以它的频率最大,在最高的小矩形中.中位数即为从小到大中间的数(或中间两数的平均数).平均数为每个小矩形中点的横坐标与小矩形面积乘积之和。(2)用频率分布直方图求得的众数、中位数不一定是样本中的具体数。探究新知核心知识点:三百分位数对于下面的问题:2016年某省对四年级学生进行了学业水平测试。甲、乙两市参加测试的学生数分别为3600人和2800人。从以往测试的情况看,甲、乙两市四年级英语学科的成绩总体状况基本相当。思考:甲市第1200名与乙市第1160名相比,哪个更好一些?探究新知核心知识点:三百分位数在甲市参加测试的3600名学生中,成绩低于第1200名的共有2400人,即共有67%的学生的成绩低于这个学生的成绩;而在乙市参加测试的2800名学生中,成绩低于第1160名的共有1640人,即共有59%的学生的成绩低于这个学生的成绩.因为两市四年级英语学科的成绩总体状况基本相当,所以甲市第1200名学生的成绩要好于乙市第1160名学生的成绩。探究新知核心知识点:三百分位数一般地,一组数据的k百分位数是这样一个值pk,它使得这组数据中至少有k%的数据小于或等于pk,且至少有(100-k)%的数据大于或等于pk。如果将样本数据从小到大排列成一行,那么k百分位数pk所处位置如图所示。…………k%

探究新知核心知识点:三百分位数

显然,中位数即为50百分位数,我们也把中位数、25百分位数和75百分位数称为四分位数。重点探究例4:从某公司生产的产品中,任意抽取12件,得到它们的质量(单位:kg)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0,分别求出这组数据的25%,75%,95%分位数。

重点探究

重点探究计算一组n个数据的第p百分位

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论