数学知识导引平均数及其估计_第1页
数学知识导引平均数及其估计_第2页
数学知识导引平均数及其估计_第3页
数学知识导引平均数及其估计_第4页
数学知识导引平均数及其估计_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学必求其心得,业必贵于专精学必求其心得,业必贵于专精学必求其心得,业必贵于专精6。3总体特征数的估计前面我们学习了用图、表来表示样本数据,并且学习了如何通过图、表所提供的信息,用样本的频率估计总体的分布.为了从整体上更好地把握总体的规律,我们还需要通过样本数据对总体的数字特征进行研究.在数学中,通常把能反映总体某种特征的量(如:平均数、方差、标准差等)称为总体特征数。6。3.1平均数及其估计案例探究为了了解某地区高三学生的身体发育情况,抽查了地区内100名年龄为17。5~18岁的男生的体重情况,结果如下(单位:kg)56。569.56561.564.566。56464.57658.57273.556677057.565。56871756268。562.56659.563.564。567。57368557266.574636055。57064.5586470。55762.5656971.573625876716663.55659.563.5657074.568。56455.572.566。5687657.56071.55769.57464.55961.5676863.5585965。562.569。57264.575。568.5646265.558。567.570.5656666。5706359.5根据上述数据我们可以画出样本的频率分布直方图,并对相应的总体分布作出估计.由于图中各小长方形的面积等于相应各组的频率,这个图形的面积反映了数据落在各个小组的频率的大小。在得到了样本的频率后,就可以对相应的总体情况作出估计。例如从这些样本数据的频率分布直方图可以看出,体重在(64.5,66。5)kg的学生比体重为其他值的学生数多,但他并没有告诉我们多多少.试问:怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?能否用一个数值来描写样本数据的离散程度?初中我们曾经学过众数、中位数、平均数等各种数字特征。应当说,这些数字都能够为我们提供关于样本数据的特征信息。我们常用算术平均数(其中ai(i=1,2,…,n)为n个实验数据)作为体重的最理想的近似值,它的依据是什么呢?处理实验数据的原则是使这个近似值与实验数据之间的离差最小,设这个近似值为x,那么它与n个实验值ai(i=1,2,…,n)的离差分别为x-a1,x-a2,x-a3,…,x-an.由于上述离差有正有负,故不宜直接相加.可以考虑将各个离差的绝对值相加,研究|x-a1|+|x—a2|+…+|x-an|取最小值时x的值.但由于含有绝对值,运算不太方便,所以,考虑离差的平方和,即(x-a1)2+(x-a2)2+…+(x-an)2,当此和最小时,对应的x的值作为近似值。因为(x-a1)2+(x-a2)2+…+(x-an)2=nx2-2(a1+a2+…+an)x+a12+a22+…+an2,所以当x=时离差的平方和最小,故可用作为表示体重的理想近似值,称其为这n个数据a1,a2,…,an的平均数(average)或均值(mean),一般记为=。这样,我们可以用计算器求得,该地区内100名年龄为17.5~18岁的男生的体重的最佳近似值为x=65。5(kg).这样我们就得到了样本平均数的求解方法:样本数据的算术平均数,即=.Excel中函数“AVERAGE()”可直接用于计算给定数据的平均数.如求12,12.4,12.8,13,12.2,12.8,12.3,12.5,12.5的平均数,可直接把它们输到工作表中A1∶J1区域后,在某空白单元格中输入“=AVERAGE(A1∶H1)”即可,即得它们的平均数为12.5(如下图).自学导引1.在频率分布直方图中,众数是指最高矩形的中点的横坐标,中位数是指样本数据中累积频率为0.5时所对应的样本数据值,平均数是指样本数据的算术平均数.2.下列数字特征一定是数据组中数据的是()A.众数B.中位数C.标准差D.平均数答案:A3.数据:1,1,3,3的众数和中位数分别是()A.1或3,2B.3,2C.1或3,1或3D.3,3答案:A4.频率分布直方图的重心是()A.众数B.中位数C.标准差D.平均数答案:D疑难剖析【例1】某校高一年级的甲、乙两个班级(均为50人)的语文测试成绩如下:(总分:150)甲班:1128610684100105981029410787112949499901209895119108100961151111049510811110510410711910793102981121129992102938494941009084114乙班:116951099610698108991101039498105101115104112101113961081001109810787108106103971071061111219710711412210110710711111410610410495111111110试确定这次考试中,哪个班的语文成绩更好些.思路分析:我们可用一组数据的平均数衡量这组数据的水平,因此,分别求得甲、乙两个班级的平均分即可。解析:用科学计算器或计算机分别求得甲班的平均分为101.1,乙班的平均分为105.4,故这次考试乙班成绩要好于甲班。【例2】某教师出了一份共3道题的测试卷,每题1分,全班得3分、2分、1分和0分的学生所占比例分别为0。3、0.5、0。1和0。1.(1)若全班共10人,则平均分是多少?(2)若全班共20人,则平均分是多少?(3)若该班人数未知,能求出该班的平均分吗?思路分析:上述所占比例就是各数据的频率.解:由题意,平均分=3×0。3+2×0。5+1×0。1=2.答:全班的平均分为2分。思维启示:各数据频率确定时,平均数不受样本容量的影响.【例3】某工厂人员及工资构成如下表:人员经理管理人员高级技工工人学徒合计周工资2200250220200100人数16510123合计22001500110020001006900(1)指出这个问题中周工资的众数、中位数、平均数;(2)这个问题中,平均数能客观地反映该工厂的工资水平吗?为什么?思路分析:根据众数、中位数、平均数各自的特点,选择合适的数据反映该厂的工资水平.解析:由表格可知:众数=200,∵23的中间位置众数是12,∴中位数=220.平均数=(2200+1500+1100+2000+100)÷23=300.虽然平均数为300元/周,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.思维启示:平均数受数据中的极端值的影响较大,妨碍了对总体估计的可靠性,这时平均数反而不如众数、中位数更能反映客观情况。拓展迁移【拓展点1】以往的招生统计数据显示,某大学录取的新生高考总分的中位数基本上稳定在550分.你的一位校友在今年的高考中得了520分,你是立即劝阻他报考这所大学,还是先查阅一下这所大学招生的其他信息?解释一下你的选择.提示:应该查阅一下这所大学的其他招生信息,例如平均信息、最低录取分数线信息等,尽管该校友的分数位于中位数之下,而中位数本身并不能提供更多录取分数分布的信息。在已知最低录取分数线的情况下,很容易作出判断;在已知平均数的情况下,如果平均数小于中位数很多,则说明最低录取分数线较低,可以推荐该校友报考这所大学,否则还要获取其他的信息(如标准差的信息)来作出判断.【拓展点2】在一次人才招聘会上,有一家公司的招聘员告诉你,“我们公司的收入水平很高”,“去年,在50名员工中,最高年收入达到了100万,他们年收入的平均数是3。5万”。如果你希望获得年薪2.5万元,(1)你是否能够判断自己可以成为此公司的一名高收入者?(2)如果招聘员继续告诉你,“员工收入的变化范围是从0.5万到100万”,这个信息是否足以使你作出自己是否受聘的决定?为什么?(3)如果招聘员继续给你提供了如下信息,员工收入的中间0。5(即去掉最少的0.25和最多的0.25后所剩下的)的变化范围是1万到3万,你又该如何使用这条信息来作出是否受聘的决定?(4)你能估计出收入的中位数是多少吗?为什么均值比估计出的中位数高很多?答案:(1)不能,因为平均收入和最高收入相差太多,说明高收入的职工只占极少数.现在已经知道至少有一个人的收入为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论