人教版高中数学必修3第二章统计-《222用样本的数字特征估计总体数字特征》课件3_第1页
人教版高中数学必修3第二章统计-《222用样本的数字特征估计总体数字特征》课件3_第2页
人教版高中数学必修3第二章统计-《222用样本的数字特征估计总体数字特征》课件3_第3页
人教版高中数学必修3第二章统计-《222用样本的数字特征估计总体数字特征》课件3_第4页
人教版高中数学必修3第二章统计-《222用样本的数字特征估计总体数字特征》课件3_第5页
已阅读5页,还剩77页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2.2.2

用样本的数字特征估计总体的数字特征(1)2.2.2用样本的数字特征估计总体的数字特征(1)1如果要求我们根据上面的数据,估计、比较甲,乙两名运动员哪一位发挥得比较稳定,就得有相应的数据作为比较依据,即通过样本数据对总体的数字特征进行研究,用样本的数字特征估计总体的数字特征.甲运动员得分:12,15,20,25,31,31, 36,36,37,39,44,49.乙运动员得分:8,13,14,16,23,26,

28,38,39,51,31,29.如果要求我们根据上面的数据,估计、比较甲,乙两名运动员哪一2一众数、中位数、平均数的概念1、众数:在一组数据中,出现次数最多的数据叫做这一组数据的众数。2、中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或两个数据的平均数)叫做这组数据的中位数。3、平均数:一组数据的算术平均数,即

x=(x1+x2+……+xn)/n一众数、中位数、平均数的概念1、众数:在一组数据中,出现3例1、某工厂人员及工资构成如下:人员经理管理人员高级技工工人学徒合计周工资2200250220200100人数16510123合计22001500110020001006900(1)指出这个问题中周工资的众数、中位数、平均数(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?分析:众数为200,中位数为220,平均数为300。因平均数为300,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。例1、某工厂人员及工资构成如下:人员经理管理人员高级技工工人4练习:在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示:成绩(单位:米)1.501.601.651.701.751.801.851.90人数23234111分别求这些运动员成绩的众数,中位数与平均数练习:在一次中学生田径运动会上,参加男子跳高的17名运动5解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;

这组数据的平均数是

答:17名运动员成绩的众数、中位数、平均数依次是1.75(米)、1.70(米)、1.69(米).解:在17个数据中,1.75出现了4次,出现的次数最多,即6思考:如何从频率分布直方图中估计众数、中位数、平均数?频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)思考:如何从频率分布直方图中估计众数、中位数、平均数?频率07例如,在上一节调查的100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图中月均用水量的众数是频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)2.25t.(一)、频率分布直方图中众数的获得1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。例如,在上一节调查的100位居民的月均用水量的问题中,从这些81、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。众数通常用来表示分类变量的中心值,容易计算,并不受极端数据的影响。如果我将4.3不小心写成了43,对众数有影响吗?1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横9(二)、频率分布直方图中中位数的获得

中位数是样本数据所占频率的等分线,即在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。(二)、频率分布直方图中中位数的获得中位数是样本数据所10频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)2、中位数是样本数据所占频率的等分线,即在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。说明:中位数不受几个极端值(即排序靠前或靠后的数据)的影响。频率0.10.20.30.40.5O0.511你高中毕业后招聘会上一家单位打出月工资3000元。你高中毕业后招聘会上一家单位打出月工资3000元。12频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)(三)、频率分布直方图中平均数的获得3、平均数:一组数据的算术平均数,即

x=(x1+x2+……+xn)/n直方图中没有原始数据该怎么处理?频率0.10.20.30.40.5O0.513从居民月均用水量样本数据可知,该样本的众数是2.3,中位数是2.0,平均数是1.971,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗?众数2.25t.中位数是2.02.平均数是2.02.

频率分布直方图损失了一些样本数据,得到的是一个估计值,且所得估值与数据分组有关,由频率分布直方图得到的众数、中位数、平均数估计值往往与样本的实际中位数值不一致..注:在只有样本频率分布直方图的情况下,我们可以按上述方法估计众数、中位数和平均数,并由此估计总体特征.从居民月均用水量样本数据可知,该样本的众数是2.3,中位数是14三三种数字特征的优缺点:1、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征.如上例中众数是2.25t,它告诉我们,月均用水量为2.25t的居民数比月均用水量为其它数值的居民数多,但它并没有告诉我们多多少.2、中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。如上例中假设有某一用户月均用水量为10t,那么它所占频率为0.01,几乎不影响中位数,但显然这一极端值是不能忽视的。3、由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因如此,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。三三种数字特征的优缺点:1、众数体现了样本数据的最大15练习1应该采用平均数来表示每一个国家项目的平均金额,因为它能反映所有项目的信息。但平均数会受到极端数据2200万元的影响,所以大多数项目投资金额都和平均数相差比较大。练习1应该采用平均数来表示每一个国家项目的平均金额,因为它能16练习2、在某校初中学生的一次体检中,随机抽取50名女学生的体重(单位:千克),分组及各组的频数如下〔30,35﹚,1;〔35,40﹚,4;〔40,45﹚,10;〔45,50﹚,22;〔50,55),11;〔55,60〕

,2试估计该校女生平均体重、中位数及众数。解:平均体重X=32.5×I/50+37.5×4/50+42.5×10/50+47.5×22/50+52.5×11/50+57.5×2/50=46.9中位数为45+5×10/22=47.3(或50-5×12/22=47.3)众数为(45+50)/2=47.5答:该校女生的平均体重为46.9千克,中位数为47.3,众数为47.5练习2、在某校初中学生的一次体检中,随机抽取50名女学生的体17小结:一、众数、中位数、平均数的概念1、众数:在一组数据中,出现次数最多的数据叫做这一组数据的众数。2、中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或两个数据的平均数)叫做这组数据的中位数。3、平均数:一组数据的算术平均数,即

x=(x1+x2+……+xn)/n小结:一、众数、中位数、平均数的概念1、众数:在一组数据中,182、中位数是样本数据所占频率的等分线,即在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。3、平均数是频率分布直方图的“重心”.是直方图的平衡点.n个样本数据的平均数由公式:X=每个小矩形的面积乘以对应底边中点的横坐标之和二、众数、中位数、平均数与频率分布直方图的关系:2、中位数是样本数据所占频率的等分线,即在样本中,有50%的192.2.2

用样本的数字特征估计总体的数字特征(2)2.2.2用样本的数字特征估计总体的数字特征(2)20如:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲:78795491074乙:9578768677如果你是教练,你应当如何对这次射击作出评价?如果看两人本次射击的平均成绩,由于思考:两人射击的平均成绩是一样的.那么两个人的水平就没有什么差异吗?若有差异你能说明其水平差异在那里吗?如:有两位射击运动员在一次射击测试中各射靶10次,每次命中的21甲、乙两人射击的平均成绩相等,观察两人成绩的频率分布条形图,你能说明其水平差异在那里吗?环数频率0.40.30.20.145678910O(甲)环数频率0.40.30.20.145678910O(乙)甲的成绩比较分散,乙的成绩相对集中,比较稳定.一组数据的最大值与最小值的差称为极差;极差越大,数据越分散,极差越小,数据越集中.甲的环数极差=10-4=6乙的环数极差=9-5=4.因此我们可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略.甲、乙两人射击的平均成绩相等,观察两人成绩的频率分布条形图,22

1、标准差是样本数据到平均数的一种平均距离。一般用s表示。它用来描述样本数据的离散程度。在实际应用中,标准差常被理解为稳定性。考察样本数据的分散程度的大小,最常用的统计量是标准差.由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差.1、标准差是样本数据到平均数的一种平均距离。一般用s表示。23

1、标准差是样本数据到平均数的一种平均距离。一般用s表示。它用来描述样本数据的离散程度。在实际应用中,标准差常被理解为稳定性。思考:1、标准差的取值范围是什么?2、当标准差为0时,样本数据都是相等的。思考:2、标准差为0的样本数据有什么特点?1、标准差的值必是大于等于0的;1、标准差是样本数据到平均数的一种平均距离。一般用s表示。24思考3:对于一个容量为2的样本:x1,x2(x1<x2),则,在数轴上,这两个统计数据有什么几何意义?由此说明标准差的大小对数据的离散程度有何影响?a3、标准差越大,数据的离散程度越大,数据较分散;标准差越小,数据的离散程度越小,数据较集中在平均数周围.用计算器可算出甲,乙两人的的成绩的标准差由可以知道,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.思考3:对于一个容量为2的样本:x1,x2(x1<x2),则2545678910上面两组数据的离散程度与标准差之间的关系可用图直观地表示出来.45678910上面两组数据的离散程度与标准差之间的关系可用26例题1:画出下列四组样本数据的条形图,说明它们的异同点.(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8;解:四组样本数据的条形图是:O频率1.00.80.60.40.212345678

(1)O频率1.00.80.60.40.212345678

(2)例题1:画出下列四组样本数据的条形图,说明它们的异同点.(127O频率1.00.80.60.40.212345678

(1)O频率1.00.80.60.40.212345678

(2)频率1.00.80.60.40.212345678

O(3)频率1.00.80.60.40.212345678

O(4)O频率1.012345678(1)O频28标准差还可以用于对样本数据的另外一种解释.例如对于城市居民月均用水量样本数据,其平均数,标准差s=0.868.在这100个数据中,落在区间(-s,+s)=[1.105,2.841]外的有28个;落在区间(-2s,+2s)=[0.237,3.709]外的只有4个;落在区间(-3s,+3s)=[-0.631,4.577]外的有0个.一般地,对于一个正态总体,数据落在区间(-s,+s)、(-2s,+2s)、(-3s,+3s)内的百分比分别为68.3%、95.4%、99.7%,这个原理在产品质量控制中有着广泛的应用(参考教材P79“阅读与思考”).标准差还可以用于对样本数据的另外一种解释.例如对于城市居民月292.方差

1、标准差:在刻画样本数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般采用标准差从数学角度考虑,有时也可以用标准差的平方——方差来替代标准差作为测量数据分散程度的工具。现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的,如何求总体的标准差和平均数?-------通常采用样本的平均数和标准差去估计总体的平均数与标准差,只要样本的代表性好,这样做就是合理的.2.方差1、标准差:在刻画样本数据的分散程度上,方差与标准30例2、甲乙两人同时生产内径为25.40mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm)甲:25.46,25.32,25.45,25.39,25.3625.34,25.42,25.45,25.38,25.4225.39,25.43,25.39,25.40,25.4425.40,25.42,25.35,25.41,25.39乙:25.40,25.43,25.44,25.48,25.4825.47,25.49,25.49,25.36,25.3425.33,25.43,25.43,25.32,25.4725.31,25.32,25.32,25.32,25.48从生产的零件内径的尺寸看,谁生产的质量较高?例2、甲乙两人同时生产内径为25.40mm的一种零件.为了对31解:用计算器计算可得:例2、甲乙两人同时生产内径为25.40mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm)解:用计算器计算可得:例2、甲乙两人同时生产内径为25.4032例3:为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的100只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准差.天数151~180181~210211~240241~270271~300301~330331~360361~390灯泡数1111820251672解:各组组中值依次为165,195,225,255,285,315,345,375,由此算得平均数为例3:为了保护学生的视力,教室内的日光灯在使用一段时间后必须33从上述例子我们可以看到,对一名工人生产的零件内径(总体)的质量判断,与我们抽取的内径(样本数据)直接相关.显然,我们可以从这名工人生产的零件中获取许多样本。这样,尽管总体是同一个,但由于样本不同,相应的样本频率分布与平均数,标准差等都会发生改变,这就会影响到我们对总体情况的估计.如果样本的的代表性差,那么对总体所作出的估计就会产生偏差;样本没有代表性时,对总体作出错误估计的可能性就非常大.这也正是我们在前面讲随机抽样时反复强调样本代表性的理由.在实际操作中,为了减少错误的发生,条件许可时,通常采取适当增加样本容量的方法.当然,关键还是要改进抽样方法,提高样本的代表性.从上述例子我们可以看到,对一名工人生产的零件内径(总体)的质34练习:若甲、乙两队比赛情况如下,下列说法哪些说法是不正确的:甲乙平均失球数平均失球个数的标准差1.52.11.10.41、平均来说,甲的技术比乙的技术好;2、乙比甲技术更稳定;3、甲队有时表现差,有时表现好;4、乙队失球较多。全对练习:若甲、乙两队比赛情况如下,下列说法哪些甲乙平均失球数平35推论:如果数据的平均数为,方差为,那么三、标准差与方差:推论:如果数据的平均数36例4:(2)如果数据的平均数为,方差为,中位数为a,求数据3x1+5,3x2+5,…,3xn+5的平均数、标准差、方差、中位数。(1)求数据2,1,0,-1,1的方差。(3)已知40个数据中的前20个数据的平均数和方差分别为60、20,后20个数据的平均数和方差分别为80、40,求这40个数据的平均数和方差。例4:(2)如果数据的37练习:4、若k1,k2,….k8的方差为3,则2(k1-3),2(k2-3),….2(k8-3)的方差为________A练习:4、若k1,k2,….k8的方差为3,则2(k1-3)38B7、在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为________9.5,0.016B7、在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.39回顾小结:1.用样本的数字特征估计总体的数字特征分两类:用样本平均数估计总体平均数。用样本方差、标准差估计总体方差、标准差。样本容量越大,估计就越精确。2.方差、标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度.方差越小,数据的波动越小。回顾小结:1.用样本的数字特征估计总体的数字特征分两类:方差40知识探究:标准差样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息.平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度.知识探究:标准差样本的众数、中位数和平均数常412.2.2

用样本的数字特征估计总体的数字特征(1)2.2.2用样本的数字特征估计总体的数字特征(1)42如果要求我们根据上面的数据,估计、比较甲,乙两名运动员哪一位发挥得比较稳定,就得有相应的数据作为比较依据,即通过样本数据对总体的数字特征进行研究,用样本的数字特征估计总体的数字特征.甲运动员得分:12,15,20,25,31,31, 36,36,37,39,44,49.乙运动员得分:8,13,14,16,23,26,

28,38,39,51,31,29.如果要求我们根据上面的数据,估计、比较甲,乙两名运动员哪一43一众数、中位数、平均数的概念1、众数:在一组数据中,出现次数最多的数据叫做这一组数据的众数。2、中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或两个数据的平均数)叫做这组数据的中位数。3、平均数:一组数据的算术平均数,即

x=(x1+x2+……+xn)/n一众数、中位数、平均数的概念1、众数:在一组数据中,出现44例1、某工厂人员及工资构成如下:人员经理管理人员高级技工工人学徒合计周工资2200250220200100人数16510123合计22001500110020001006900(1)指出这个问题中周工资的众数、中位数、平均数(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?分析:众数为200,中位数为220,平均数为300。因平均数为300,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。例1、某工厂人员及工资构成如下:人员经理管理人员高级技工工人45练习:在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示:成绩(单位:米)1.501.601.651.701.751.801.851.90人数23234111分别求这些运动员成绩的众数,中位数与平均数练习:在一次中学生田径运动会上,参加男子跳高的17名运动46解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;

这组数据的平均数是

答:17名运动员成绩的众数、中位数、平均数依次是1.75(米)、1.70(米)、1.69(米).解:在17个数据中,1.75出现了4次,出现的次数最多,即47思考:如何从频率分布直方图中估计众数、中位数、平均数?频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)思考:如何从频率分布直方图中估计众数、中位数、平均数?频率048例如,在上一节调查的100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图中月均用水量的众数是频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)2.25t.(一)、频率分布直方图中众数的获得1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。例如,在上一节调查的100位居民的月均用水量的问题中,从这些491、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。众数通常用来表示分类变量的中心值,容易计算,并不受极端数据的影响。如果我将4.3不小心写成了43,对众数有影响吗?1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横50(二)、频率分布直方图中中位数的获得

中位数是样本数据所占频率的等分线,即在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。(二)、频率分布直方图中中位数的获得中位数是样本数据所51频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)2、中位数是样本数据所占频率的等分线,即在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。说明:中位数不受几个极端值(即排序靠前或靠后的数据)的影响。频率0.10.20.30.40.5O0.552你高中毕业后招聘会上一家单位打出月工资3000元。你高中毕业后招聘会上一家单位打出月工资3000元。53频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)(三)、频率分布直方图中平均数的获得3、平均数:一组数据的算术平均数,即

x=(x1+x2+……+xn)/n直方图中没有原始数据该怎么处理?频率0.10.20.30.40.5O0.554从居民月均用水量样本数据可知,该样本的众数是2.3,中位数是2.0,平均数是1.971,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗?众数2.25t.中位数是2.02.平均数是2.02.

频率分布直方图损失了一些样本数据,得到的是一个估计值,且所得估值与数据分组有关,由频率分布直方图得到的众数、中位数、平均数估计值往往与样本的实际中位数值不一致..注:在只有样本频率分布直方图的情况下,我们可以按上述方法估计众数、中位数和平均数,并由此估计总体特征.从居民月均用水量样本数据可知,该样本的众数是2.3,中位数是55三三种数字特征的优缺点:1、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征.如上例中众数是2.25t,它告诉我们,月均用水量为2.25t的居民数比月均用水量为其它数值的居民数多,但它并没有告诉我们多多少.2、中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。如上例中假设有某一用户月均用水量为10t,那么它所占频率为0.01,几乎不影响中位数,但显然这一极端值是不能忽视的。3、由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因如此,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。三三种数字特征的优缺点:1、众数体现了样本数据的最大56练习1应该采用平均数来表示每一个国家项目的平均金额,因为它能反映所有项目的信息。但平均数会受到极端数据2200万元的影响,所以大多数项目投资金额都和平均数相差比较大。练习1应该采用平均数来表示每一个国家项目的平均金额,因为它能57练习2、在某校初中学生的一次体检中,随机抽取50名女学生的体重(单位:千克),分组及各组的频数如下〔30,35﹚,1;〔35,40﹚,4;〔40,45﹚,10;〔45,50﹚,22;〔50,55),11;〔55,60〕

,2试估计该校女生平均体重、中位数及众数。解:平均体重X=32.5×I/50+37.5×4/50+42.5×10/50+47.5×22/50+52.5×11/50+57.5×2/50=46.9中位数为45+5×10/22=47.3(或50-5×12/22=47.3)众数为(45+50)/2=47.5答:该校女生的平均体重为46.9千克,中位数为47.3,众数为47.5练习2、在某校初中学生的一次体检中,随机抽取50名女学生的体58小结:一、众数、中位数、平均数的概念1、众数:在一组数据中,出现次数最多的数据叫做这一组数据的众数。2、中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或两个数据的平均数)叫做这组数据的中位数。3、平均数:一组数据的算术平均数,即

x=(x1+x2+……+xn)/n小结:一、众数、中位数、平均数的概念1、众数:在一组数据中,592、中位数是样本数据所占频率的等分线,即在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。3、平均数是频率分布直方图的“重心”.是直方图的平衡点.n个样本数据的平均数由公式:X=每个小矩形的面积乘以对应底边中点的横坐标之和二、众数、中位数、平均数与频率分布直方图的关系:2、中位数是样本数据所占频率的等分线,即在样本中,有50%的602.2.2

用样本的数字特征估计总体的数字特征(2)2.2.2用样本的数字特征估计总体的数字特征(2)61如:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲:78795491074乙:9578768677如果你是教练,你应当如何对这次射击作出评价?如果看两人本次射击的平均成绩,由于思考:两人射击的平均成绩是一样的.那么两个人的水平就没有什么差异吗?若有差异你能说明其水平差异在那里吗?如:有两位射击运动员在一次射击测试中各射靶10次,每次命中的62甲、乙两人射击的平均成绩相等,观察两人成绩的频率分布条形图,你能说明其水平差异在那里吗?环数频率0.40.30.20.145678910O(甲)环数频率0.40.30.20.145678910O(乙)甲的成绩比较分散,乙的成绩相对集中,比较稳定.一组数据的最大值与最小值的差称为极差;极差越大,数据越分散,极差越小,数据越集中.甲的环数极差=10-4=6乙的环数极差=9-5=4.因此我们可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略.甲、乙两人射击的平均成绩相等,观察两人成绩的频率分布条形图,63

1、标准差是样本数据到平均数的一种平均距离。一般用s表示。它用来描述样本数据的离散程度。在实际应用中,标准差常被理解为稳定性。考察样本数据的分散程度的大小,最常用的统计量是标准差.由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差.1、标准差是样本数据到平均数的一种平均距离。一般用s表示。64

1、标准差是样本数据到平均数的一种平均距离。一般用s表示。它用来描述样本数据的离散程度。在实际应用中,标准差常被理解为稳定性。思考:1、标准差的取值范围是什么?2、当标准差为0时,样本数据都是相等的。思考:2、标准差为0的样本数据有什么特点?1、标准差的值必是大于等于0的;1、标准差是样本数据到平均数的一种平均距离。一般用s表示。65思考3:对于一个容量为2的样本:x1,x2(x1<x2),则,在数轴上,这两个统计数据有什么几何意义?由此说明标准差的大小对数据的离散程度有何影响?a3、标准差越大,数据的离散程度越大,数据较分散;标准差越小,数据的离散程度越小,数据较集中在平均数周围.用计算器可算出甲,乙两人的的成绩的标准差由可以知道,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.思考3:对于一个容量为2的样本:x1,x2(x1<x2),则6645678910上面两组数据的离散程度与标准差之间的关系可用图直观地表示出来.45678910上面两组数据的离散程度与标准差之间的关系可用67例题1:画出下列四组样本数据的条形图,说明它们的异同点.(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8;解:四组样本数据的条形图是:O频率1.00.80.60.40.212345678

(1)O频率1.00.80.60.40.212345678

(2)例题1:画出下列四组样本数据的条形图,说明它们的异同点.(168O频率1.00.80.60.40.212345678

(1)O频率1.00.80.60.40.212345678

(2)频率1.00.80.60.40.212345678

O(3)频率1.00.80.60.40.212345678

O(4)O频率1.012345678(1)O频69标准差还可以用于对样本数据的另外一种解释.例如对于城市居民月均用水量样本数据,其平均数,标准差s=0.868.在这100个数据中,落在区间(-s,+s)=[1.105,2.841]外的有28个;落在区间(-2s,+2s)=[0.237,3.709]外的只有4个;落在区间(-3s,+3s)=[-0.631,4.577]外的有0个.一般地,对于一个正态总体,数据落在区间(-s,+s)、(-2s,+2s)、(-3s,+3s)内的百分比分别为68.3%、95.4%、99.7%,这个原理在产品质量控制中有着广泛的应用(参考教材P79“阅读与思考”).标准差还可以用于对样本数据的另外一种解释.例如对于城市居民月702.方差

1、标准差:在刻画样本数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般采用标准差从数学角度考虑,有时也可以用标准差的平方——方差来替代标准差作为测量数据分散程度的工具。现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的,如何求总体的标准差和平均数?-------通常采用样本的平均数和标准差去估计总体的平均数与标准差,只要样本的代表性好,这样做就是合理的.2.方差1、标准差:在刻画样本数据的分散程度上,方差与标准71例2、甲乙两人同时生产内径为25.40mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm)甲:25.46,25.32,25.45,25.39,25.3625.34,25.42,25.45,25.38,25.4225.39,25.43,25.39,25.40,25.4425.40,25.42,25.35,25.41,25.39乙:25.40,25.43,25.44,25.48,25.4825.47,25.49,25.49,25.36,25.3425.33,25.43,25.43,25.32,25.4725.31,25.32,25.32,25.32,25.48从生产的零件内径的尺寸看,谁生产的质量较高?例2、甲乙两人同时生产内径为25.40mm的一种零件.为了对72解:用计算器计算可得:例2、甲乙两人同时生产内径为25.40mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm)解:用计算器计算可得:例2、甲乙两人同时生产内径为25.4073例3:为了保护学生的视力,教室内

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论