版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2.2 用样本估计总体2.2.1 用样本的频率分布估计总体分布一、教材分析 教科书通过探究栏目引导学生思考居民生活用水定额管理问题,引出总体分布的估计问题,该案例贯穿于本节始终.通过对该问题的探究,使学生学会列频率分布表、画频率分布直方图、频率分布折线图.教科书在这里主要介绍有关频率分布的列表和画图的方法,而关于频率分布的随机性和规律性方面则给教师留下了较大的发挥空间.教师可以通过初中有关随机事件的知识,也可以利用计算机多媒体技术,引导学生进一步体会由样本确定的频率分布表和频率分布直方图的随机性;通过初中有关频率与概率之间的关系,了解频率分布直方图的规律性,即频率分布与总体分布之间的关系,进一
2、步体会用样本估计总体的思想. 由于样本频率分布直方图可以估计总体分布,因此可以用样本频率分布特征来估计相应的总体分布特征,这就提供了估计总体特征的另一种途径,其意义在于:在没有原始数据而仅有频率分布的情况下,此方法可以估计总体的分布特征.二、教学目标1、知识与技能(1)通过实例体会分布的意义和作用。(2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图。(3)通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。2、过程与方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和
3、逻辑推理的数学方法。3、情感态度与价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。三、重点难点教学重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.教学难点:能通过样本的频率分布估计总佒的分布.四、课时安排 1课时五、教学设计(一)导入新课思路1 在NBA的2006赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下甲运动员得分:12,15,20,25,31,31,36,36,37,39,44,49,50乙运动员得分:8,13,14,16,23,26,28,38,39,51,31,29,33 请问
4、从上面的数据中你能否看出甲、乙两名运动员哪一位发挥比较稳定? 如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容用样本的频率分布估计总体分布(板书课题).思路2 如下样本是随机抽取近年来北京地区7月25日至8月24日的日最高气温.7月25日至8月10日4193753573543723813473373333253463303083102863152888月8日至8月24日286315288332325303302298331328298256247300301295303 怎样通过上表中的数据,分析比较两时间段内的高温(33 )状况?这就是我们这堂课要研究、学习的主要内容
5、用样本的频率分布估计总体分布.思路3讨论:我们要了解我校学生每月零花钱的情况,应该怎样进行抽样?提问:学习了哪些抽样方法?一般在什么时候选取什么样的抽样方法呢?讨论:通过抽样方法收集数据的目的是什么?(从中寻找所包含的信息,用样本去估计总体)指出两种估计手段:一是用样本的频率分布估计总体的分布,二是用样本的数字特征(平均数、标准差等)估计总体的数字特征.这就是我们这堂课要研究、学习的主要内容用样本的频率分布估计总体分布.(二)推进新课、新知探究、提出问题(1)我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水
6、量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)(2)什么是频率分布?(3)画频率分布直方图有哪些步骤?(4)频率分布直方图的特征是什么?讨论结果:(1)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况. 分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作
7、图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,为我们提供解释数据的新方式. 下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.可以让我们更清楚地看到整个样本数据的频率分布情况.(2)频率分布是指一个样本数据在各个小范围内所占比例的大小;一般用频率分布直方图反映样本的频率分布.(3)其一般步骤为:计算一组数据中最大值与最小值的差,即求极差;决定组距与组数;将数据分组;列频率分布表;画频率分布直方图.(4)频率分布直方图的特征:从频率分布直方图可以清楚地看出数据分布的总体趋势.从频率分布直
8、方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了. 同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同.不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以0.1和1为组距重新作图,然后谈谈你对图的印象.提出问题(1)什么是频率分布折线图?(2)什么是总体密度曲线?(3)对于任何一个总体,它的密度曲线是否一定存在?是否可以被非常准确地画出来?(4)什么叫茎叶图?画茎叶图的步骤有哪些?(5)茎叶图有什么特征?讨论结果:(1)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)在样本频率分布直方图中,相应的频率折
9、线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.(3)实际上,尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确(4)当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.画茎叶图的步骤如下:将每个数据分为茎(高位)和叶(低位)两部分,在此例中,茎为十位上的数字,叶
10、为个位上的数字;将最小茎和最大茎之间的数按大小次序排成一列,写在左(右)侧;将各个数据的叶按大小次序写在其茎右(左)侧.(5)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录(这对于教练员发现运动员现场状态特别有用)
11、;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.正确利用三种分布的描述方法,都能得到一些有关分布的主要特点(如分布是否具有单峰性、是否具有对称性、样本点落在各分组中的频率等),这些主要特点受样本的随机性的影响比较小,更接近于总体分布的相应的特点.频率分布表和频率分布直方图之间的密切关系是显然的,它们只不过是相同的数据的两种不同的表达方式,茎叶图和频率分布表极为类似,事实上,茎相当于频率分布表中的分组;茎上叶的数目相当于频率分布表中指定区间组的频数.(三)应用示例思路1例1 有100名学生,每人只能参加一个运动队,其中参加足球队的有30人,参加篮球队的有27人,参
12、加排球队的有23人,参加乒乓球队的有20人.(1)列出学生参加运动队的频率分布表.(2)画出频率分布条形图.解:(1)参加足球队记为1,参加篮球队记为2,参加排球队记为3,参加乒乓球队记为4,得频率分布表如下:试验结果频数频率参加足球队(记为1)300.30参加篮球队(记为2)270.27参加排球队(记为3)230.23参加乒乓球队(记为4)200.20合 计1001.00(2)由上表可知频率分布条形图如下:例2 为了了解中学生的身体发育情况,对某中学17岁的60名女生的身高进行了测量,结果如下:(单位:cm)154 159 166 169 159 156 166 162 158 156 16
13、6 160 164 160 157 151 157 161 158 153 158 164 158 163 158 153 157 162 159 154 165 166 157 151 146 151 160 165 158 163 163 162 161 154 165 162 159 157 159 149 164 168 159 153 列出样本的频率分布表;绘出频率分布直方图.解:第一步,求极差:上述60个数据中最大为169,最小为146.故极差为:16914623 cm.第二步,确定组距和组数,可取组距为3 cm,则组数为,可将全部数据分为8组.第三步,确定组限:145.5,148
14、.5),148.5,151.5),151.5,154.5),154.5,157.5),157.5,160.5),160.5,163.5),163.5,166.5),166.5,169.5).第四步,列频率分布表:分组个数累计频数频率145.5,148.5)10.017148.5,151.5)30.050151.5,154.5)60.100154.5,157.5)80.133157.5,160.5)180.300160.5,163.5)110.183163.5,166.5)100.167166.5,169.5)30.050合计601.000 第五步,根据上述数据绘制频率分布直方图如下图: 以上例
15、1和例2两种情况的不同之处在于,前者的频率分布表列出的是几个不同数值的频率,相应的条形图是用其高度表示取各个值的频率;后者的频率分布表列出的是在不同区间内取值的频率,相应的直方图是用图表面积的大小来表示在各个区间内取值的频率. 我们在处理一个数理问题时可以采用样本的频率分布估计总体分布的方法,这是因为,频率分布随着样本容量的增大更加接近于总体分布,当样本容量无限增大且分组的组距无限缩小时,频率分布的直方图就演变成一条光滑的曲线总体密度曲线.这条曲线是客观存在的,但是我们却很难将它准确地画出,我们只能用样本的频率分布去对它进行估计.基于频率分布与相应的总体分布有这种关系,再加上我们通常并不知道一
16、个总体的分布,我们往往是从一个总体中抽取一个样本,用样本的频率去估计相应的总体分布.一般说来,样本的容量越大,这种估计就越精确.例3 从某校高一年级的1 002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm)作出该样本的频率分布表,并估计身高不小于170(cm)的同学所占的百分率168165171167170165170152175174165170168169171166164155164158170155166158155160160164156162160170168164174170165179163172180174173159163172167160164
17、169151168158168176155165165169162177158175165169151163166163167178165158170169159155163153155167163164158168167161162167168161165174156167166162161164166解:(1)在全部数据中找出最大值180与最小值151,它们相差(极差)29,决定组距为3;(2)将区间150.5,180.5分成10组;分别是150.5,153.5),153.5,156.5),177.5,180.5);(3)从第一组150.5,153.5)开始分别统计各组的频数,再计算各组的
18、频率,列频率分布表:分组频数累计频数频率150.5,153.5)44004153.5,156.5)128008156.5,159.5)208008159.5,162.5)3111011162.5,165.5)5322022165.5,168.5)7219019168.5,171.5)8614014171.5,174.5)937007174.5,177.5)974004177.5,180.5)1003003合计1001 根据频率分布表可以估计,估计身高不小于170的同学所占的百分率为:0.14+0.07+0.04+0.03100%=21%点评:一般地,编制频率分布表的步骤如下:(1)求极差,决定
19、组数和组距;(2)分组,通常对组内的数值所在的区间取左闭右开区间;(3)登记频数,计算频率,列出频率分布表思路2例1 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位:cm).区间界限122,126)126,130)130,134)134,138)138,142)人数58102233区间界限142,146)146,150)150,154)154,158)人数116520(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134 cm的人数占总人数的百分比.分析:根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:分组频数频率1
20、22,126)50.04126,130)80.07130,134)100.08134,138)220.18138,142)330.28142,146)200.17146,150)110.09150,154)60.05154,158)50.04合计1201(2)其频率分布直方图如下:(3)由样本频率分布表可知身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.例2 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如下图),图中从左到右各小长方形面积之比为24
21、171593,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:=0.08;又因为频率=,所以样本容量=150.(2)由图可估计该学校高一学生的达标率约为100%=88%.例3 甲、乙两篮球运动员在上赛季每场比赛的得分如下,试比较这两位运动员的得分水平甲:12,15,24,
22、25,31,31,36,36,37,39,44,49,50;乙:8,13,14,16,23,26,28,33,38,39,51.解:画出两人得分的茎叶图如下:从这个茎叶图可以看出甲运动员的得分大致对称,平均得分及中位数、众数都是30多分;乙运动员的得分除一个51外,也大致对称,平均得分及中位数、众数都是20多分,因此甲运动员发挥比较稳定,总体得分情况比乙好(四)知能训练1.下面是甲、乙两名运动员某赛季一些场次得分的茎叶图,据下图可知( )A.甲运动员的成绩好于乙运动员 B.乙运动员的成绩好于甲运动员C.甲、乙两名运动员的成绩没有明显的差异 D.甲运动员的最低得分为0分答案:A2.有一个容量为4
23、5的样本数据,分组后各组的频数如下:(12.5,15.5,3;(15.5,18.5, 8;(18.5,21.5,9;(21.5,24.5,11;(24.5,27.5,10;(27.5,30.5,4.由此估计,不大于27.5的数据约为总体的( )A.91% B.92% C.95% D.30%答案:A3.一个容量为20的样本数据,数据的分组及各组的频数如下:(10,20),2;(20,30),3;(30,40),4;(40,50),5;(50,60),4;(60,70),2.则样本在区间(10,50)上的频率为( )A.0.5 B.0.7 C.0.25 D.0.05答案:B4.一个高中研究性学习小
24、组对本地区2000年至2002年快餐公司发展情况进行了调查,制成了该地区快餐公司个数情况的条形图和快餐公司盒饭年销售量的平均数情况条形图(如下图),根据图中提供的信息可以得出这三年中该地区每年平均销售盒饭_万盒 快餐公司个数情况图 快餐公司盒饭年销售量的平均数情况图答案:85(五)拓展提升 为了了解一大片经济林生长情况,随机测量其中的100株的底部周长,得到如下数据表(单位:cm).13598102110991211109610010312597117113110921021091041121091248713197102123104104128105123111103105921141081
25、0410212912697100115111106117104109111891101218012012110410811812999909912112310711191100991011169710210810195107101102108117991181061199712610812311998121101113102103104108(1)编制频率分布表;(2)绘制频率分布直方图;(3)估计该片经济林中底部周长小于100 cm的树木约占多少?周长不小于120 cm的树木约占多少?解:(1)这组数据的最大值为135,最小值为80, 极差为55,可将其分为11组,组距为5频率分布表如下:分
26、组频数频率频率/组距80,85)10.010.00285,90)20.020.00490,95)40.040.00895,100)140.140.028100,105)240.240.048105,110)150.150.030110,115)120.120.024115,120)90.090.018120,125)110.110.022125,130)60.060.012130,13520.020.004合计10010.2(2)直方图如下图:(3)从频率分布表得,样本中小于100的频率为0.01+0.02+0.04+0.14=0.21,样本中不小于120的频率为0.11+0.06+0.02=
27、0.19,估计该片经济林中底部周长小于100 cm的树木约占21%,周长不小于120 cm的树木约占19%(六)课堂小结 总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布. 总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.(七)作业 习题2.2A组1、2.2.2.2 用样本的数字特征估计总体的数字特征一、教材分析 教科书结合实例展示了频率分布的众数、中位数和平均数.对于众数、中位数和平均数的概念,重点放
28、在比较它们的特点,以及它们的适用场合上,使学生能够发现,在日常生活中某些人通过混用这些(描述平均位置的)统计术语进行误导.另一方面,教科书通过思考栏目让学生注意到,直接通过样本计算所得到的中位数与通过频率直方图估计得到的中位数不同.在得到这个结论后,教师可以举一反三,使学生思考对于众数和平均数,是否也有类似的结论.进一步,可以解释对总体众数、总体中位数和总体平均数的两种不同估计方法的特点.在知道样本数据的具体数值时,通常通过样本计算中位数、平均值和众数,并用它们估计总体的中位数、均值和众数.但有时我们得到的数据是整理过的数据,比如在媒体中见到的频数表或频率表,用教科书中的方法也可以得到总体的中
29、位数、均值和众数的估计. 教科书通过几个现实生活的例子,引导学生认识到:只描述平均位置的特征是不够的,还需要描述样本数据离散程度的特征.通过对如何描述数据离散程度的探索,使学生体验创造性思维的过程.教科书通过例题向学生展示如何用样本数字特征解决实际问题,通过阅读与思考栏目“生产过程中的质量控制图”,让学生进一步体会分布的数字特征在实际中的应用.二、教学目标1、知识与技能(1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差。(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释。(3)会用样本的基本数字特征估计总体的基本数字特征。
30、(4)形成对数据处理过程进行初步评价的意识。2、过程与方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法。3、情感态度与价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系。三、重点难点教学重点:根据实际问题对样本数据中提取基本的数据特征并作出合理解释,估计总体的基本数字特征;体会样本数字特征具有随机性.教学难点:用样本平均数和标准差估计总体的平均数与标准差;能应用相关知识解决简单的实际问题.四、课时安排 2课时五、教学设计第1课时 众数、中位数、平均数(一)导入新课思路1
31、 在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下甲运动员:7,8,6,8,6,5,8,10,7,4;乙运动员:9,5,7,8,7,6,8,6,7,7. 观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究.用样本的数字特征估计总体的数字特征.(板书课题)思路2 在日常生活中,我们往往并不需要了解总体的分布形态,而是更关心总体的某一数字特征,例如:买灯泡时,我们希望知道灯泡的平均使用寿命,我们怎样了解灯泡的使用寿命呢?当然不能把所有灯泡一一测试,因为测试后灯泡则报废了.于是,需要通过随机抽样,把这批灯泡
32、的寿命看作总体,从中随机取出若干个个体作为样本,算出样本的数字特征,用样本的数字特征来估计总体的数字特征.(二)推进新课、新知探究、提出问题(1)什么是众数、中位数、平均数?(1)如何绘制频率分布直方图?(3)如何从频率分布直方图中估计众数、中位数、平均数?活动:那么学生回忆初中所学的一些统计知识,思考后展开讨论,教师提示引导.讨论结果:(1)初中我们曾经学过众数(在一组数据中,出现次数最多的数称为众数)、中位数(在按大小顺序排列的一组数据中,居于中间的数称为中位数)、平均数(一般是一组数据和的算术平均数)等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息.(2)画频率分布
33、直方图的一般步骤为:计算一组数据中最大值与最小值的差,即求极差;决定组距与组数;将数据分组;列频率分布表;画频率分布直方图.(3)教材前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25 t(最高的矩形的中点),它告诉我们,该市的月均用水量为2.25 t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少. 请大家翻回到课本看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失了,而2.25是由样本
34、数据的频率分布直方图得来的,所以存在一些偏差. 提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等.由此可以估计出中位数的值为2.02.思考:2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中的原因吗?(原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了) 课本显示,大部分居民的月均用水量在中部(2.02 t左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是
35、非常合理的.思考:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例) 对极端值不敏感有利的例子:考察课本中表21中的数据,如果把最后一个数据错写成22,并不会对样本中位数产生影响.也就是说对极端数据不敏感的方法能够有效地预防错误数据的影响,而在实际应用中,人为操作的失误经常造成错误数据. 对极端值不敏感有弊的例子:某人具有初级计算机专业技术水平,想找一份收入好的工作,这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:很可能所选择公司的初级计算机专业技术水平人员的收入很低
36、,其原因是中位数对极小的数据不敏感.这里更好的方法是同时用平均工资和中位数来作为参考指标,选择平均工资较高且中位数较大的公司就业.对极端值不敏感的方法,不能反映数据中的极端情况. 同样的,可以从频率分布直方图中估计平均数,上图就显示了居民用水的平均数,它等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.由估计可知,居民的月均用水量的平均值为2.02 t. 显示了居民月均用水量的平均数,它是频率分布直方图的“重心”.由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数、众数都不具有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可
37、以反映出更多的关于样本数据全体的信息.从图上可以看出,用水量最多的几个居民对平均数影响较大,这是因为他们的月均用水量与平均数相差太多了. 利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.总之,众数、中位数、平均数都是对数据中心位置的描述,可以作为总体相应特征的估计.样本众数易计算,但只能表达样本数据中的很少一部分信息,不一定唯一;中位数仅利用了数据中排在中间数据的信息,与数据的排列位置有关;平均数
38、受样本中的每一个数据的影响,绝对值越大的数据,对平均数的影响也越大三者相比,平均数代表了数据更多的信息,描述了数据的平均水平,是一组数据的“重心”.(三)应用示例思路1例1 (1)若M个数的平均数是X,N个数的平均数是Y,则这M+N个数的平均数是_;(2)如果两组数x1,x2,xn和y1,y2,yn的样本平均数分别是x和y,那么一组数x1+y1,x2+y2,xn+yn的平均数是_活动:学生思考或交流,教师提示,根据平均数的定义得到结论.解:(1);(2).例2 某校高一年级的甲、乙两个班级(均为50人)的语文测试成绩如下(总分:150分),试确定这次考试中,哪个班的语文成绩更好一些甲班:112
39、 86 106 84 100 105 98 102 94 10787 112 94 94 99 90 120 98 95 119108 100 96 115 111 104 95 108 111 105104 107 119 107 93 102 98 112 112 9992 102 93 84 94 94 100 90 84 114乙班:116 95 109 96 106 98 108 99 110 10394 98 105 101 115 104 112 101 113 96108 100 110 98 107 87 108 106 103 97107 106 111 121 97 10
40、7 114 122 101 107107 111 114 106 104 104 95 111 111 110分析:我们可用一组数据的平均数衡量这组数据的集中水平,因此,分别求出甲、乙两个班的平均分即可解:用计算器分别求出甲班的平均分为101.1,乙班的平均分为105.4,故这次考试乙班成绩要好于甲班思路2例1 下面是某校学生日睡眠时间抽样频率分布表(单位:h),试估计该校学生的日平均睡眠时间睡眠时间人数频率6,6.5)50056.5,7)170177,7.5)330337.5,8)370378,8.5)60068.5,9)2002合计1001分析:要确定这100名学生的平均睡眠时间,就必须计
41、算其总睡眠时间,由于每组中的个体睡眠时间只是一个范围,可以用各组区间的组中值近似地表示解法一:总睡眠时间约为6.255+6.7517+7.2533+7.7537+8.256+8.752=739(h),故平均睡眠时间约为7.39 h解法二:求组中值与对应频率之积的和6.250.05+6.750.17+7.250.33+7.750.37+8.250.06+8.750.02=7.39(h).答:估计该校学生的日平均睡眠时间约为7.39 h例2 某单位年收入在10 000到15 000、15 000到20 000、20 000到25 000、25 000到30 000、30 000到35 000、35
42、 000到40 000及40 000到50 000元之间的职工所占的比分别为10%,15%,20%,25%,15%,10%和5%,试估计该单位职工的平均年收入分析:上述百分比就是各组的频率解:估计该单位职工的平均年收入为12 50010%+17 50015%+22 50020%+27 50025%+32 50015%+37 50010%+45 0005%=26 125(元).答:估计该单位人均年收入约为26 125元(四)知能训练从甲、乙两个公司各随机抽取50名员工月工资:甲公司:800 800 800 800 800 1 000 1 000 1 000 1 0001 000 1 000 1
43、000 1 000 1 000 1 0001 2001 2001 2001 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 2001 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 5001 500 1 500 1 500 1 500 1 500 1 500 2 000 2 000 2 0002 000 2 000 2 500 2 500 2 500乙公司:700 700 700 700 700 700 700 700 700700 700 700 700 700 700 1 000 1 000 1
44、 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 6 000 8 000 10 000试计算这两个公司50名员工月工资平均数、众数、中位数,并估计这两个企业员工平均工资.答案:甲公司:员工月工资平均数1 240,众数1 200,中位数1 200;乙公司:员工月工资平均数1 330,众数1 000,中
45、位数1 000;从总体上看乙公司员工月工资比甲公司少,原因是乙公司有几个收入特高的员工影响了工资平均数.(五)拓展提升 “用数据说话”, 这是我们经常可以听到的一句话.但是,数据有时也会被利用,从而产生误导.例如,一个企业中,绝大多数是一线工人,他们的年收入可能是一万元左右,另有一些经理层次的人,年收入可以达到几十万元.这时,年收入的平均数会比中位数大得多.尽管这时中位数比平均数更合理些,但是这个企业的老板到人力市场去招聘工人时,也许更可能用平均数来回答有关工资待遇方面的提问. 你认为“我们单位的收入水平比别的单位高”这句话应当怎么解释? 这句话的目的是谨防利用人们对统计术语的模糊认识进行误导
46、(蒙骗).使学生能够正确理解在日常生活中像“我们单位的收入水平比别的单位高”这类话的模糊性,这里的“收入水平”是指员工收入数据的某个中心点,即可以是中位数、平均数或众数,不同的解释有不同的含义. 在这里应该注意以下几点:1.样本众数通常用来表示分类变量的中心值,容易计算,但是它只能表达样本数据中的很少一部分信息,通常用于描述分类变量的中心位置.2.中位数不受少数几个极端数据(即排序靠前或排序靠后的数据)的影响,容易计算,它仅利用了数据中排在中间数据的信息.当样本数据质量比较差,即存在一些错误数据(如数据的录入错误、测量错误等)时,应该用抗极端数据强的中位数表示数据的中心值,可以利用计算机模拟样
47、本,向学生展示错误数据对样本中位数的影响程度.3.平均数受样本中的每一个数据的影响,“越离群”的数据,对平均数的影响也越大.与众数和中位数相比,平均数代表了数据更多的信息.当样本数据质量比较差时,使用平均数描述数据的中心位置可能与实际情况产生较大的误差.可以利用计算机模拟样本,向学生展示错误数据对样本平均数的影响程度.在体育、文艺等各种比赛的评分中,使用的是平均数.计分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素而给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量保证公平性.4.如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;
48、反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息,帮助我们作出决策.5.使用者常根据自己的利益去选取使用中位数或平均数来描述数据的中心位置,从而产生一些误导作用.(六)课堂小结1能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(平均数),会用样本的基本数字特征估计总体的基本数字特征;2平均数对数据有“取齐”的作用,代表一组数据的平均水平;3形成对数据处理过程进行初步评价的意识(七)作业 习题2.2A组3.第2课时 标准差(一)导入新课思路1 平均数为我们提供了样本数据的重要信息,但是,有时平均数也会
49、使我们作出对总体的片面判断.某地区的统计显示,该地区的中学生的平均身高为176 cm,给我们的印象是该地区的中学生生长发育好,身高较高.但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质.因此,只有平均数难以概括样本数据的实际状态.所以我们学习从另外的角度来考察样本数据的统计量标准差.(教师板书课题)思路2 在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下 甲运动员:7,8,7,9,5,4,9,10,7,4; 乙运动员:9,5,7,8,7,6,8,6,7,7. 观察上述样本数据,你能判断哪个运动员发
50、挥得更稳定些吗?如果你是教练,选哪位选手去参加正式比赛? 我们知道,x甲=7,x乙=7.两个人射击的平均成绩是一样的.那么,是否两个人就没有水平差距呢? 从上图直观上看,还是有差异的.很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据标准差.(二)推进新课、新知探究、提出问题(1)如何通过频率分布直方图估计数字特征(中位数、众数、平均数)?(2)有甲、乙两种钢筋,现从中各抽取一个标本(如下表)检查它们的抗拉强度(单位:kg/mm2),通过计算发现,两个样本的平均数均为125.甲110120130125120125135125135125乙1151001251301
51、15125125145125145 哪种钢筋的质量较好?(3)某种子公司为了在当地推行两种新水稻品种,对甲、乙两种水稻进行了连续7年的种植对比实验,年亩产量分别如下:(千克)甲:600, 880, 880, 620, 960, 570, 900(平均773)乙:800, 860, 850, 750, 750, 800, 700(平均787)请你用所学统计学的知识,说明选择哪种品种推广更好?(4)全面建设小康社会是我们党和政府的工作重心,某市按当地物价水平计算,人均年收入达到1.5万元的家庭即达到小康生活水平.民政局对该市100户家庭进行调查统计,它们的人均收入达到了1.6万元,民政局即宣布该市民生活水平已达到小康水平,你认为这样的结论是否符合实际?(5)如何考
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高考物理总复习专题八恒定电流实验九测定电源的电动势和内阻练习含答案
- 草莓购买合同
- 江苏地区高一年级信息技术一年教案7资源管理器教案
- 江苏地区高一年级信息技术一年教案26 IF语句教案
- 2024年高中政治 第一单元 公民的政治生活 第二课 我国公民的政治参与 3 民主管理:共创幸福生活教案1 新人教版必修2
- 2024-2025学年新教材高中物理 第七章 万有引力与宇宙航行 4 宇宙航行(1)教案 新人教版必修2
- 2024-2025学年新教材高中地理 第3章 天气的成因与气候的形成 第2节 气压带、风带对气候的影响教案 中图版选择性必修第一册
- 高考地理一轮复习第十二章环境与发展第二节中国国家发展战略课件
- 宝宝防疫针委托书
- 人教A版广东省深圳实验学校高中部2023-2024学年高一上学期第三阶段考试数学试题
- 一次性纸杯生产建设项目可行性研究报告(共31页)
- 小学英语教学活动设计主要方法与技巧
- 《体育科学研究论文的撰写与评价》PPT课件
- 祖国的灿烂文化PPT通用课件
- 隧道支护结构计算
- 第十二讲沟通
- 欧洲合同法PECL韩世远译
- 上海市徐汇区初三英语二模精美含答案听力材料
- 校本教研特色汇报
- 项目管理组织机构框图及说明
- 成都住房公积金单位缴存登记表
评论
0/150
提交评论