9.2.4用样本估计总体课件高一下学期数学人教A版_第1页
9.2.4用样本估计总体课件高一下学期数学人教A版_第2页
9.2.4用样本估计总体课件高一下学期数学人教A版_第3页
9.2.4用样本估计总体课件高一下学期数学人教A版_第4页
9.2.4用样本估计总体课件高一下学期数学人教A版_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

德宏州民族第一中学9.2.4总体离散程度的估计众数、中位数和平均数的定义,计算及其比较课前回顾1.一组数据x1,x2,…,xn的方差和标准差2.总体方差和标准差,样本方差和标准差3.标准差的意义4.分层随机抽样的方差学习目标平均数、中位数和众数为我们提供了一组数据的集中趋势的信息,这是概括一组数据的特征的有效方法.但仅知道集中趋势的信息,很多时候还不能使我们做出有效决策,下面的问题就是一个例子.问题3有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲78795491074乙9578768677如果你是教练,你如何对两位运动员的射击情况作出评价?如果这是一次选拔性考核,你应当如何作出选择?通过简单的排序和计算,可以发现甲、乙两名运动员射击成绩的平均数、中位数、众数都是7.从这个角度看,两名运动员之间没有差别.但从图9.2-13中看,甲的成绩比较分散,乙的成绩相对集中,即甲的成绩波动幅度比较大,而乙的成绩比较稳定.可见,他们的射击成绩是存在差异的.那么,如何度量成绩的这种差异呢?可以发现甲的成绩波动范围比乙的大.极差在一定程度上刻画了数据的离散程度.但因为极差只使用了数据中最大、最小两个值的信息,对其他数据的取值情况没有涉及,所以极差所含的信息量很少.我们知道,如果射击的成绩很稳定,那么大多数的射击成绩离平均成绩不会太远;相反,如果射击的成绩波动幅度很大,那么大多数的射击成绩离平均成绩会比较远.因此,我们可以通过这两组射击成绩与它们的平均成绩的“平均距离”来度量成绩的波动幅度.如何定义“平均距离”?你还能想出其他刻画数据离散程度的办法吗?你还能想出其他刻画数据离散程度的办法吗?你还能想出其他刻画数据离散程度的办法吗?标准差的取值范围是什么?标准差为0的一组数据有什么特点?标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.显然,在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用标准差.在实际问题中,总体平均数和总体标准差都是未知的.就像用样本平均数估计总体平均数一样,通常我们也用样本标准差去估计总体标准差.在随机抽样中,样本标准差依赖于样本的选取,具有随机性.如果要从这两名选手中选择一名参加比赛,要看一下他们的平均成绩在所有参赛选手中的位置.如果两人都排在前面,就选成绩稳定的乙选手,否则可以选甲.例6在对树人中学高一年级学生身高的调查中,采用样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62.你能由这些数据计算出总样本的方差,并对高一年级全体学生的身高方差作岀估计吗?我们可以计算出总样本的方差为51.4862,并据此估计高一年级学生身高的总体方差为51.4862.练习(第213页)1.不经过计算,你能给下列各组数的方差排序吗?(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8.3.农场种植的甲、乙两种水稻,在面积相等的两块稻田中连续6年的产量如下:品种第1年第2年第3年第4年第5年第6年甲/kg900920900850910920乙/kg890960950850860890哪种水稻的产量比较稳定?甲、乙两种水稻6年产量的平均数都是900,但甲种水稻产量的标准差约等于23.8,乙种水稻产量的标准差约等于41.6,所以甲种水稻的产量比较稳定.4.一个小商店从一家有限公司购进21袋白糖,每袋白糖的标准质量是500g,为了了解这些白糖的质量情况,称出各袋白糖的质量(单位:g)如下:486495496498499493493498484497504489495503499503509498487500508(1)21袋白糖的平均质量是多少?标准差s是多少?5.某学校有高中学生500人,其中男生320人,女生180人.有人为了获得该校全体高中学生的身高信息,采用分层抽样的方法抽取样本,并观测样本的指标值(单位:cm),计算得男生样本的均值为173.5,方差为17,女生样本的均值为163.83,方差为30.03.(1)根据以上信息,能够计算出总样本的均值和方差吗?为什么?(2)如果已知男、女样本量按比例分配,你能计算出总样本的均值和方差各为多少吗?(1)不能.因为男生和女生的样本量未知.(3)如果已知男、女的样本量都是25,你能计算出总样本的均值和方差各为多少吗?它们分别作为总体均值和方差的估计合适吗?为什么?用它们分别作为总体均值和方差的估计不合适,因为男生和女生身高的差异比较大,这个样本的分布与总体的分布相差可能比较大,所以总样本均值和总样本方差作为总体均值和总体方差的估计有偏差.小结反思作业:优化课后训练A组习题9.2(第214页)1.棉花的纤维长度是棉花质量的重要指标.在一批棉花中随机抽测了60根棉花的纤维长度(单位:mm),按从小到大排序结果如下:252833505258596061628286113115140143146170175195202206233236238255260263264265293293294296301302303305305306321323325326328340343346348350352355357357358360370380383385(1)请你选择合适的组距,作出这个样本的频率分布直方图,分析这批棉花纤维长度分布的特征;(2)请你估计这批棉花的第5,95百分位数.观察直方图,可以看到这批棉花的纤维长度不是特别均匀,小矩形中间低两端高,即有一部分棉花的纤维长度比较短,在85mm以下的接近20%,也有一部分棉花的纤维长度比较长,在325mm以上的占接近30%.这批棉花很可能来自两个不同的产地或品种.(2)请你估计这批棉花的第5,95百分位数.2.甲乙两台机床同时生产一种零件,在10天中,两台机床每天生产的次品数分别为:甲0102203124

乙2311021101分别计算这两组数据的平均数和标准差,从计算结果看,哪台机床的性能更好?甲机床每天生产次品数的平均数为1.5,标准差为1.2845;乙机床每天生产次品数的平均数为1.2,标准差为0.8718.从计算结果看,乙机床每天生产次品数的平均数和标准差都比甲机床小,说明乙机床生产出的次品比甲机床少,而且更为稳定,说明乙机床的性能更好.3.在去年的足球联赛上,一队每场比赛平均失球数是1.5,全年比赛失球个数的标准差为1.1,二队每场比赛平均失球数是2.1,全年失球个数的标准差是0.43.你认为下列说法中哪一种是正确的,为什么?(1)平均说来一队比二队防守技术好;(2)二队比一队技术水平更稳定;(3)一队有时表现很差,有时表现又非常好;(4)二队很少不失球.(1)正确.从平均失球数的角度,一队的平均失球数1.5小于二队的平均失球数2.1.(2)正确.标准差越小,发挥越稳定,二队失球数的标准差0.4小于一队失球数的标准差1.1,所以说二队的技术水平更稳定.(3)正确.从标准差的角度考虑,一队失球数的标准差为1.1,均值为1.5,说明一队在防守中表现好时失球很少,表现差时失球较多.(4)正确.综合平均数和标准差两个指标考虑,平均数大且标准差小,说明失球数多为1,2,3.6.以往的招生统计数据显示,某所大学录取的新生高考总分的中位数基本上稳定在550分.你的一位高中校友在今年的高考中得了520分,你是立即劝阻他报考这所大学,还是先进一步查阅一下这所大学以往招生的其他统计信息?解释一下你的选择.该高中校友最关心的是自己能否被录取,即他的分数是否在当年录取的最低录取分数之上.根据已有信息,只知道他的分数位于以往分数的中位数之下,这不能判断他被录取的可能性大小.应该进一步查阅这所大学以往招生的其他统计信息,例如以往录取分数的分布情况、平均分数、最低分数等信息.如果知道该校以往录取的平均分数和标准差,且他的分数大于平均分减去标准差的值,那么他被录取的可能性就比较大,可以建议他报考该校;如果知道以往录取分数的分布情况,且他的分数大于第20百分位数,他被录取的可能性也比较大,可以建议他报考该校;如果知道以往录取的最低分数线,且他的分数低于以往最低录取分数线,那么不建议他报考该校;等等.7.甲、乙两个班级,一次数学考试的分数排序如下:甲班51545960646868687071

72727476777879798080

82858586868787878889

9090919697989898100100乙班61636366707171737575

76797980808081818282

83838384848485858585

85858687878890919498请你就这次考试成绩,对两个班级的数学学习情况进行评价.甲班的平均分为80.5,标准差为12.72,最低分为51,最高分为100,极差为49;乙班的平均分为80.5,标准差为8.18,最低分为61,最高分为98,极差为37.可以发现,甲班和乙班学生的平均分相同,甲班的标准差、极差比乙班的大.这说明甲班学生的成绩比较分散,相互差别较大,数据上看既有成绩不及格的,也有成绩为满分的,相对而言乙班的成绩较为集中,相互差别较小.8.有一种鱼的身体吸收汞,一定量身体中汞的含量超过其体重的1.00ppm(百万分之一)的鱼被人食用后,就会对人体产生危害.在30条鱼的样本中发现的汞含量(单位:ppm)如下:0.070.240.950.981.020.981.371.400.391.021.441.580.541.080.610.721.201.141.621.681.851.200.810.820.841.291.262.100.911.31(1)请用合适的统计图描述上述数据,并分析这30条鱼的汞含量的分布特点;(2)求出上述样本数据的平均数和标准差;(3)从实际情况看,许多鱼的汞含量超标的原因是这些鱼在出售之前没有被检测过.你认为每批这种鱼的平均汞含量都比1.00ppm大吗?(4)在上述样本中,有多少条鱼的汞含量在以平均数为中心、2倍标准差的范围内?(2)求出上述样本数据的平均数和标准差;(3)从实际情况看,许多鱼的汞含量超标的原因是这些鱼在出售之前没有被检测过.你认为每批这种鱼的平均汞含量都比1.00ppm大吗?(4)在上述样本中,有多少条鱼的汞含量在以平均数为中心、2倍标准差的范围内?(4)有

28条鱼的汞含量在以平均数为中心、2倍标准差的范围内,占总样本量的

93.33%.9.在一次人才招聘会上,有一家公司的招聘员告诉你,“我们公司的收入水平很高”“去年,在50名员工中,最高年收入达到了200万,员工年收入的平均数是10万”,而你的预期是获得9万元年薪.(1)你是否能够判断年薪为9万元的员工在这家公司算高收入者?9.在一次人才招聘会上,有一家公司的招聘员告诉你,“我们公司的收入水平很高”“去年,在50名员工中,最高年收入达到了200万,员工年收入的平均数是10万”,而你的预期是获得9万元年薪.(2)如果招聘员继续告诉你,“员工年收入的变化范围是从3万到200万”,这个信息是否足以使你作出自己是否受聘的决定?为什么?(2)不能.因为已知有一个极端值,其对均值的影响很大,中位数不受极端值的影响,判断是否受聘还要看中位数的大小,但由“员工年收人的变化范围是从3万到

200万”不能估计中位数的大小.(3)如果招聘员继续给你提供了如下信息,员工收入的第一四分位数为4.5万,第三四分位数为9.5万,你又该如何使用这条信息来作出是否受聘的决定?(4)根据(3)中招聘员提供的信息,你能估计出这家公司员工收入的中位数是多少吗?为什么平均数比估计出的中位数高很多?(3)能.由第一和第三四分位数知,有75%的员工工资在9.5万元以下,其中25%的员工工资在4.5万元以下,所以在该公司获得

9万元的年薪是有难度的.(4)由第一和第三四分位数,可以估计中位数在7万元左右.因为有年收入200万这个极端值的影响,得年平均收入比中位数高许多.10.有20种不同的零食,每100g可食部分包含的能量(单位:kJ)如下:

110120123165432190174235428318249280162146210120123120150140(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论