用样本的数字特征估计总体的数字特征 省赛获奖_第1页
用样本的数字特征估计总体的数字特征 省赛获奖_第2页
用样本的数字特征估计总体的数字特征 省赛获奖_第3页
用样本的数字特征估计总体的数字特征 省赛获奖_第4页
用样本的数字特征估计总体的数字特征 省赛获奖_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、求极差,即数据中最大值与最小值的差二、决定组距与组数:组数=极差/组距三、分组,通常对组内数值所在区间,取左闭右开区间,最后一组取闭区间四、登记频数,计算频率,列出频率分布表五、画出频率分布直方图(纵轴表示频率/组距)复习回顾画频率分布直方图的步骤:连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.画茎叶图的步骤:(1)将每个数据分为茎(高位)和叶(低位)两部分;(2)将最小茎和最大茎之间的数按大小次序排成一列,写在一侧;(3)将各个数据的叶按大小次序写在其茎的另一侧.用样本的数字特征估计总体的分布众数、中位数、平均数的概念中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.平均数:一组数据的算术平均数,即

x=二、众数、中位数、平均数与频率分布直方图的关系

例如,在上一节调查的100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出众数、中位数、平均数为多少?频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)

在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。众数众数众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征.特点:频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)2.02这个中位数的估计值,与样本的中位数值2.0不一样,为什么??因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是从直方图本身得不出原始的数据内容,所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致.

左边和右边的直方图的面积应该相等,由此可以估计中位数的值。中位数:2、中位数不受少数几个极端值的影响1、中位数易计算,能较好地表现数据信息3、常用于计算数据质量较差时特点:频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)

是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点横坐标之和平均数3、平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。1、平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变2、平均数可以反映出更多的关于样本数据全体的信息特点:众数、中位数、平均数的简单应用例某工厂人员及工资构成如下:人员经理管理人员高级技工工人学徒合计周工资2200250220200100人数16510123合计22001500110020001006900(1)指出这个问题中周工资的众数、中位数、平均数(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?

分析:众数为200,中位数为220,平均数为300。因平均数为300,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。三种数字特征的优缺点1、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征.2、中位数它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。3、由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因如此,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。练习:在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示:成绩(米)1.501.601.651.701.751.801.851.90人数23234111分别求这些运动员成绩的众数,中位数与平均数练习:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲:78795491074乙:9578768677如果你是教练,你应当如何对这次射击作出评价?如果看两人本次射击的平均成绩,由于

两人射击的平均成绩是一样的.那么两个人的水平就没有什么差异吗?考察样本数据的分散程度的大小,所谓“平均距离”,其含义可作如下理解:标准差是样本数据到平均数的一种平均距离,一般用s表示.标准差由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差.例题1:画出下列四组样本数据的条形图,说明它们的异同点.(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8;标准差还可以用于对样本数据的另外一种解释.例如,在关于居民月均用水量的例子中,平均数标准差s=0.868,一般地,样本数据落在区间[x-ns,x+ns]内例2甲乙两人同时生产内径为25.40mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm)25.46,25.32,25.45,25.39,25.3625.34,25.42,25.45,25.38,25.4225.39,25.43,25.39,25.40,25.4425.40,25.42,25.35,25.41,25.3925.40,25.43,25.44,25.48,25.4825.47,25.49,25.49,25.36,25.3425.33,25.43,25.43,25.32,25.4725.31,25.32,25.32,25.32,25.48从生产的零件内径的尺寸看,谁生产的质量较高?甲乙练习:某工厂对200个电子元件的使用寿命进行检查,按照使用寿命(单位:h),可以把这批电子元件分成第一组[100,200],第二组(200,300],第三组(300,400],第四组(400,500],第五组(500,600],第六组(600,700],请根据给出的图表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论