课件北师大版必修三_第1页
课件北师大版必修三_第2页
课件北师大版必修三_第3页
课件北师大版必修三_第4页
课件北师大版必修三_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、频率分布表、频率分布直方图1.频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求①________;(2)确定②________;(3)确定③________;(4)列频率分布表;(5)画频率分布直方图.2.在频率分布直方图中,小长方形的面积=组距×④________=频率.二、频率分布折线图、总体密度曲线1.频率分布折线图的定义连结频率分布直方图中各小长方形上端的⑤________,就得到频率分布折线图.2.总体密度曲线的定义如果样本容量不断增大,分组的组距不断缩小,则频率分布直方图实际上越来越接近总体的分布,它可以用一条光滑曲线y=f(x)来描绘,这条光滑曲线叫做⑥________.总体密度曲线精确地反映了一个总体在各个范围内取值的规律.

实际上,尽管有些总体密度曲线是客观存在的,但一般很难像函数图像那样准确地画出来,我们只能用样本的频率分布对它进行估计.一般来说,样本容量越大,这种估计就越精确.三、用样本的平均数估计总体平均数设n个样本数据x1,x2,…,xn的平均数为=⑦________.说明:1.用样本的平均数估计总体平均数时,样本的平均数只是总体平均数的近似.2.平均数对数据有“取齐”的作用,代表一组数据的⑧________.3.在频率分布直方图中,平均数是直方图的⑨______.2.标准差因为方差与原始数据的单位不同,且平方后可能夸大了离差的程度,我们将方差的算术平方根称为这组数据的标准差.样本标准差:s=⑪________.如果样本各数据都相等,则标准差为⑫________,表明数据没有波动幅度,数据没有离散性;若个体的值与平均数的差的绝对值较大,则标准差⑬________,表明数据的波动幅度也很大,数据离散程度⑭________,因此,标准差描述了数据对平均数的离散程度.五、两个小结论1.如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变.2.如果把一组数据中的每一个数据乘一个共同的常数k,标准差变为原来的k倍.1.在统计中,经常用数据的统计图来估计总体的分布情况.统计图中样本的分布和总体分布的关系是什么?数据一旦被收集后,人们总希望从中找出所需要的信息.但通过收集得到的数据一般比较多,这样,就需要对这些数据进行适当的整理,将其转化为可以直接利用的形式,并从中获取相应的信息,以帮助人们作出恰当的决策.统计图就是整理数据的重要工具,它不仅可以帮助我们从数据中获取有用的信息,还可以帮助我们直观、准确地理解相应的结果.不同的统计图有着各自的特点和用途.对于总体中个体取值较少的情况,我们常用条形图表示其样本分布;而对于个体取值较多或无限的总体,我们则常用频率分布表、频率分布直方图、频率分布折线图等图表形式表示样本分布.一般样本容量越大,这种估计越精确.当样本容量较大时,样本中落在每个区间内的样本数的频率会稳定于总体在相应区间内取值的频率.因此,我们可以用样本的频率分布直方图来估计总体在任意区间内取值的频率,也即总体的分布情况.在样本的频率分布中,随着样本容量的不断扩大,其分布越来越接近总体分布,当样本容量无限加大,而组距无限缩小时,频率分布直方图的上方将演变成一条光滑的曲线—总体密度曲线.2.用样本估计总体是统计的基本思想.那么在对总体分布的估计中是怎样体现这一思想的?用样本估计总体的某一指标的时候,由于样本毕竟不是总体,所以用样本来估计总体一般来说是有误差的,只是误差的大小而已.当样本的选取合理,具有代表性的时候误差就很小.例如,在全国范围内的测验中,如果民意测验者走进大学校园里去访问1000名大学生,对他们进行民意调查,他们所组成的样本将不会公平地代表全国的民意,这是因为大学生选民的比例很小,而且是一个有倾向性的团体,不能代表全体选民,这样的不公平就使得样本估计总体的误差比较大,这就是样本的选取不合理造成的.3.如何选择不同的统计图估计总体的分布情况?在对一些数据进行统计时,要根据数据的特点和统计结果的精确度选择合适的统计图表.如果需要根据图表了解各数据所占的频率可以使用条形统计图,例如统计一批产品中优等品所占频率.如果要了解数据的增减情况可以采用折线图,例如统计一个人的成绩变化情况.要了解数据的全部信息可以使用茎叶图,例如篮球比赛的计分.用茎叶图表示数据有两个突出的优点:没有信息的损失,所有的原始数据都可以从茎叶图中得到;茎叶图可以随时记录,方便表示与比较.但是,当数据量很大或有多组数据时,茎叶图就不那么直观、清晰了.而频率分布直方图通过计算落在某个区间的频率来简化数据,它能直观地反映数据分布的大致情况,并且能够清晰地表示出各个区间的具体数目,特别是当数据量很大时.但同时,直方图也丢失了原始数据.在面对实际问题时,人们常常根据不同的需要,选择合适的统计图来整理数据.只有合理选择图表才能使统计的数据更加直观.题型一频率分布表、频率分布直方图【例1】对于样本频率分布直方图与总体密度曲线的关系,下列说法正确的是 ()A.频率分布直方图与总体密度曲线无关B.频率分布直方图就是总体密度曲线C.样本容量很大的频率分布直方图就是总体密度曲线D.如果样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近总体密度曲线解析:根据总体密度曲线的定义,如果样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近一条光滑曲线,这条光滑曲线就是总体密度曲线,所以应选D.答案:D评析:总体密度曲线是一种极限情况,样本的频率分布直方图是它的一个近似图,样本容量越大,分组的组距越小,它们的误差就越小. 下列命题正确的是()A.频率分布直方图中每个小矩形的面积等于相应组的频数B.频率分布直方图的面积为样本的频数C.频率分布直方图中各小矩形高(平行于纵轴的边)表示频率与组距的比D.用茎叶图统计某运动员得分:13,51,23,8,26,38,16,33,14,28,39时,茎是指中位数26[答案]C题型二画频率分布表、频率分布直方图、折线图【例2】为了了解某地区高三学生的身体发育情况,抽查了该地区内100名年龄为17.5~18岁的男生的体重情况,结果如下:(单位:kg)56.569.56561.564.566.56464.57658.57273.556677057.565.56871756268.562.56659.563.564.567.57368557266.574636055.57064.5586470.55762.5656971.573625876716663.55659.563.5657074.568.56455.572.566.5687657.56071.55769.57464.56961.5676863.5585965.562.569.57264.575.568.5646265.558.567.570.5656666.5706359.5

请根据上述数据画出样本的频率分布直方图,并对相应的总体分布作出估计.解:按照下列步骤获得样本的频率分布.(1)求最大值与最小值的差在上述数据中,最大值是76,最小值是55,它们的差(又称为极差)是76-55=21,所得的差告诉我们,这组数据的变动范围有多大.(2)确定组距与组数如果将组距定为2,那么由21÷2=10.5,组数为11,这个组数是合适的.于是组距为2,组数为11.(3)决定分点根据本例中数据的特点,第1小组的起点可取为54.5,第1小组的终点可取为56.5,为了避免一个数据既是起点,又是终点从而造成重复计算,我们规定分组的区间是“左闭右开”的.这样,所得到的分组是[54.5,56.5),[56.5,58.5),…,[74.5,76.5).(4)列频率分布表频率分布表分组`频率累计频数频率[54.5,56.5)50.05[56.5,58.5)80.08[58.5,60.5)90.09[60.5,62.5)50.05[62.5,64.5)130.13[64.5,66.5)160.16[66.5,68.5)120.12[68.5,70.5)110.11[70.5,72.5)90.09[72.5,74.5)60.06[74.5,76.5)60.06合计1001.00(5)绘制频率分布直方图如下图所示.由于图中各小长方形的面积等于相应各组的频率,这个图形的面积的形式反映了数据落在各个小组的频率的大小.在反映样本的频率分布方面,频率分布表比较确切,频率分布直方图比较直观,它们起着相互补充的作用.在得到了样本的频率后,就可以对相应的总体情况作出估计.例如可以估计,体重在[64.5,66.5)kg间的学生最多,约占学生总数的16%;体重小于58.5kg的学生较少,约占13%等.评析:频率分布表比较确切,频率分布直方图比较直观. 有一容量为200的样本,数据的分组以及各组的频数如下:[-20,-15)7,[-15,-10)11,[-10,-5)15,[-5,0)40,[0,5)49,[5,10)41,[10,15)20,[15,20)17.(1)列出样本的频率分布表;(2)画出频率分布直方图和折线图;(3)求样本数据不足0的频率.[解](1)频率分布表如下:分组频数频率[-20,-15)70.035[-15,-10)110.055[-10,-5)150.075[-5,0)400.2[0,5)490.245[5,10)410.205[10,15)200.1[15,20)170.085合计2001.00(2)下图是频率分布直方图和折线图:(3)样本数据不足0的频率为:0.035+0.055+0.075+0.2=0.365.[评析](1)频率分布折线图与横轴相连,是为了看图方便,横轴上的左右两端点没有实际的意义.(2)频率分布折线图反映了数据的变化趋势,可用来对数据进行估计和预测.如果样本容量不断增加,分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线.题型三用样本的频率分布估计总体的分布用样本估计总体,是研究统计问题的一个基本的思想方法,对于不易知道的总体分布,总是用样本的频率分布对它进行估计.一般地,样本容量越大,估计就越精确.【例3】从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下:(单位:分)[40,50)2,[50,60)3,[60,70)10,[70,80)15,[80,90)12,[90,100)8.(1)列出样本的频率分布表(含累积频率);(2)画出频率分布直方图;(3)估计成绩在[60,90)分内的学生比例;(4)估计成绩在85分以下的学生比例.解析:成绩在某一范围内的学生比例即学生成绩在该范围内的概率,由(3)(4)求相应频率即可.解:(1)频率分布表如下:成绩分组频数频率累积频率[40,50)20.040.04[50,60)30.060.1[60,70)100.20.3[70,80)150.30.6[80,90)120.240.84[90,100)80.161.00合计501.00(2)频率分布直方图如图.评析:估计b实际上利用了线性插值,不用累积频率而直接利用频率分布表插值本质相同.从而成绩在85分以下的学生约占0.04+0.06+0.2+0.3+0.12=0.72=72%.

为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如下图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.【例4】(例题变式)为了解一大片经济林的生长情况,随机测量其中的100株的底部周长得到如下数据:(单位:cm)99121110961001031259711711311092102109104112109124871041041281051231111031059211410810410212912697100115111106117104109111891101218012012110410811812999909912112310711191100991011169710210810195107101102108117991181061199712610812311998121101113102103104108(1)编制频率分布表.(2)绘制频率分布直方图、折线图.(3)估计该片经济林中底部周长小于100cm的树木约占多少,周长不小于120cm的树木约占多少?分组频数频率[80,85)10.010.002[85,90)20.020.004[90,95)40.040.008[95,100)140.140.028[100,105)240.240.048[105,110)150.150.030[110,115)120.120.024[115,120)90.090.018[120,125)110.110.022[125,130)60.060.012[130,135]20.020.004合计10010.2(2)这组数据的频率分布直方图、折线图如图所示:(3)从频率分布表可以看出,该样本中小于100的频率为0.01+0.02+0.04+0.14=0.21,不小于120的频率为0.11+0.06+0.02=0.19.故可估计该片经济林中底部周长小于100cm的树木约占21%,周长不小于120cm的树木约占19%.评析:频率分布表从数值上直观地体现了各组的频率,频率分布直方图则更形象地反映了各组数据的频率与样本分布趋势,所以往往通过两者综合考察样本.

(难题巧解)对某电子元件进行寿命追踪调查,情况如下:

(1)列出频率分布表;(2)画出频率分布直方图及折线图;(3)估计电子元件寿命在400h以上的概率.寿命(h)100~200200~300300~400400~500500~600个数2030804030[解](1)频率分布表如下:寿命(h)频数频率100~200200.10200~300300.15300~400800.40400~500400.20500~600300.15合计2001.00(2)频率分布直方图及折线图如图.(3)由频率分布表可知,寿命在400h以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400h以上的概率为0.35.[评析]先画出频率分布直方图,然后根据图形进行推测,当所取数值不正好在端点时,比如450小时以上的频率是多少,可取400~500频率的一半,再加上500~600的频率.1.“频率分布”与“相应的总体分布”的关系是 ()A.“频率分布”与“相应的总体分布”是同样的分布B.“频率分布”与“相应的总体分布”是互不相关的两种分布C.“频率分布”将随着样本容量的增大更加接近“总体分布”D.“频率分布”的样本容量增大到某一定值时就变成了“总体分布”[解析]样本容量越大,样本的频率分布越接近总体分布.故选C.[答案]C2.已知样本:10,8,6,10,13,8,10,12,11,7,8,9,11,9,12,9,10,11,12,11.那么频率为0.4的范围为 ()A.5.5~7.5B.7.5~9.5C.9.5~11.5 D.11.5~13.5[解析]只要列出频率分布表,依次对照就可以找出答案.频率分布表如下:

分组频数频率5.5~7.520.17.5~9.560.39.5~11.580.411.5~13.540.2合计201

从表中可以看出,频率为0.4的范围是9.5~11.5.故选C.[答案]C3.根据某水文观测点的历史统计数据,得到某条河流水位的频率分布直方图(如下图).从图中可以看出,该水文观测点平均至少一百年才遇到一次的洪水的最低水位是()A.48米 B.49米C.50米 D.51米[解析]由频率分布直方图知水位为50米的频率/组距为1%,即水文观测点平均至少一百年才遇到一次的洪水的最低水位是50米.故选C.[答案]C4.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5~18岁的男生体重(kg),得到频率分布直方图如下:

根据上图可得这100名学生中体重在[56.5,64.5)kg间的学生人数是 ()A.20 B.30C.40 D.50[解析]根据该图可知,组距为2,得这100名学生中体重在[56.5,64.5)kg间的学生人数所占的频率为(0.03+0.05+0.05+0.07)×2=0.4,所以该段学生的人数是40,故选C.[答案]C

5.如下图,在某路段检测点,对200辆汽车的车速进行检测,检测结果表示为如下频率分布直方图,则车速不小于90km/h的汽车约有________辆.[答案]606.如下图是一个容量为200的样本频率分布直方图,请根据图形中的数据填空:(1)样本数据落在范围[5,9)内的频率为________;(2)样本数据落在范围[9,13)内的频数为________.[答案]0.32727.在学校开展的综合实践活动中,某班进行了小制作

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论