用样本数字特征估计整体数字特征_第1页
用样本数字特征估计整体数字特征_第2页
用样本数字特征估计整体数字特征_第3页
用样本数字特征估计整体数字特征_第4页
用样本数字特征估计整体数字特征_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1对一个未知总体,我们已经学过的用样本分布估计总体分布的方法有哪些?2它们各有什么优缺点?频率分布表和频率分布直方图能够很容易表示大量数据,非常直观地表明其分布形状,使我们能够看到许多隐藏在数据后的信息,但是,损失了一些样本数据的信息,不能保留原有数据茎时图由所有样本数据组成,没有损失任何样本信息,可以在抽样过程中随时记录,但是,只能适用于样本容量较小时复习巩固甲

乙834636838910123455451166

7990问题1:你能理解这个图是如何记录这些数据的吗?你能通过该图说明哪个运动员的发挥更稳定吗?甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39问题2:在统计中,上图叫做茎叶图,它也是表示样本数据分布情况的一种方法,其中“茎”指的是哪些数,“叶”指的是哪些数?甲

乙8463368389 101234554616

7990问题3:一般地,画出一组样本数据的茎叶图的步骤如何?第一步,将每个数据分为“茎”(高位)和“叶”(低位)两部分;第二步,将最小的茎和最大的茎之间的数按大小次序排成一列,写在左(右)侧;第三步,将各个数据的叶按大小次序写在茎右(左)侧问题4:用茎叶图表示数据的分布情况是一种好方法,你认为茎叶图有哪些优点?(1)保留了原始数据,没有损失样本信息;(2)数据可以随时记录、添加或修改问题5:比较茎叶图和频率分布表,茎叶图中“茎”和“叶”的数目分别与频率分布表中哪些数目相当?问题6:对任意一组样本数据,是否都适合用茎叶图表示?为什么?不适合样本容量很大或茎、叶不分明的样本数据对于样本容量较大的样本,为了从整体上更好地把握总体规律,我们该如何处理呢?1众数、中位数、平均数2标准差众数、中位数、平均数平均数:一组数据的算术平均数,即=众数、中位数、平均数的概念中数:将一组数据按大小依次排列,把处在最中间位置的一个数据或最中间两个数据的平均数叫做这组数据的中位数.众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.平均数中位数众数练习三种数字特征的优缺点特征数优点缺点体现了样本数据的最大集中点无法客观反映总体特征不受少数极端值的影响不受少数极端值的影响有时也是缺点与每一个数据有关,更能反映全体的信息.受少数极端值的影响较大,使其在估计总体时的可靠性降低.众数中位数平均数平均数大于(或小于)中位数,说明样本数据中存在许多较大(或较小)的极端值这句话具有模糊性甚至蒙骗性,其中收入水平是员工工资的某个中心点,它可以是众数、中位数或平均数讨论:一组数据的中位数一般不受少数几个极端值的影响,在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点,你能理解下例中“我们单位的收入水平比别的单位高”这句话的含义?探究1:众数、中位数和平均数思考1:如何从频率分布直方图中估计众数、中位数、平均数?思考2:在城市居民月均用水量样本数据的频率分布直方图中,你认为众数应在哪个小矩形内?由此估计总体的众数是什么?月均用水量/t频率组距050403020105115225335445O取最高矩形下端中点的横坐标2.25作为众数.思考4:在城市居民月均用水量样本数据的频率分布直方图中,从左至右各个小矩形的面积分别是004,008,015,022,025,014,006,004,002由此估计总体的中位数是什么?月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O05-004-008-015-022=001,设小矩形的宽为X,则:05X=001,得X=002,所以中位数是2002=202思考3:在频率分布直方图中,每个小矩形的面积表示什么中位数左右两侧的直方图的面积应有什么关系?思考5:平均数是频率分布直方图的“重心”,在下面的频率分布直方图中,各个小矩形的重心在哪里?从直方图估计总体在各组数据内的平均数分别为多少?025,075,125,175,225,275,325,375,425月均用水量/t频率组距050403020105115225335445O样本数据的估计平均数就是将频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积相加由此估计总体的平均数就是025×004075×008125×015175×022225×025275×014325×006375×004425×002=202(t)思考6:从居民月均用水量样本数据可知,该样本的众数是23,中位数是20,平均数是1973,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗?在制作频率分布直方图“丢失”了一些样本数据,得到的是一个估计值,且所得估计值与数据分组有关注:在只有样本频率分布直方图的情况下,才可按上述方法估计众数、中位数和平均数,并由此估计总体特征从频率分布直方图中估计众数、中位数、平均数众数:最高矩形的中点中位数:频率直方图中,中位数左右两边的直方图面积相等平均数:样本数据的估计平均数就是将频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积相加知识探究月均用水量/t频率组距050403020105115225335445O根据上面的频率分布直方图,估计众数、中位数和平均数例1某工厂人员及工资构成如下:人员经理管理人员高级技工工人学徒合计周工资2200250220200100人数16510123合计220015001100200010069001指出这个问题中周工资的众数、中位数、平均数2这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?众数为200,中位数为220,平均数为300因平均数为300,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平人员经理管理人员高级技工工人学徒合计周工资2200250220200100人数16510123合计22001500110020001006900506070809010000.0050.0100.0150.030.04练习:”八一”前夕,某中学举行国防知识竞赛:满分为100分,80分以上为优秀,现将高一的两个班参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、第二、第三、第四、第五小组的频率分别是03,04,015,01,005求:(1)成绩的众数、中位数;(2)平均成绩165,65267标准差1方差:设在一组数据,1,2,…,n中,各数据与它们的平均数的差的平方分别是来衡量这组数据的波动大小,并把它叫做这组数据的方差,一组数据方差越大,则这组数据波动越大那么我们用它们的平均数,即2标准差:我们把数据的方差的算术平方根叫做这组数据的标准差,它也是一个用来衡量一组数据的波动大小的重要的量计算标准差的算法:2算出每个样本数据与样本平均数的差(i=1,2,……,n);;3算出(i=1,2,…,n);4算出(i=1,2,…,n)这n个数的平均数,即为样本方差s2;5算出方差的算术平方根,即为样本标准差s标准差和频率直方图的关系从标准差的定义可知,如果样本各数据都相等,则标准差得0,这表明数据没有波动幅度,数据没有离散性;若个体的值与平均数的差的绝对值较大,则标准差也较大,表明数据的波动幅度也很大,数据的离散程度很高,因此标准差描述了数据对平均数的离散程度的平均数为,(2)新数据方差为.,方差仍为.(1)新数据的平均数为,方差为.的平均数为(3)新数据如果数据的平均数为,方差为,则方差的运算性质:解:依题意计算可得1=9002=900s1≈238s2≈426甲乙两种水稻6年平均产量的平均数相同,但甲的标准差比乙的小,所以甲的生产比较稳定思考1:在一次射击选拔赛中,甲、乙两名运动员各射击10次,每次命中的环数如下:甲:78795491074乙:9578768677甲、乙两人本次射击的平均成绩分别为多少环?思考2:甲、乙两人射击的平均成绩相等,观察两人成绩的频率分布条形图,你能说明其水平差异在那里吗?环数频率0.40.30.20.145678910O(甲)环数频率0.40.30.20.145678910O(乙)甲的成绩比较分散,极差较大,乙的成绩相对集中,比较稳定1.有甲、乙两种水稻,测得每种水稻各10株的分蘖数后,计算出样本方差分别为S2甲=11,S2乙=34,由此可以估计()(A)甲种水稻比乙种水稻分蘖整齐(B)乙种水稻比甲种水稻分蘖整齐(C)甲、乙种水稻分蘖整齐程度相同(D)甲、乙两种水稻分蘖整齐程度不能比较B2.甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm2),试根据这组数据估计哪一种水稻品种的产量比较稳定。品种第1年第2年第3年第4年第5年甲9.89.910.11010.2乙9.410.31

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论