版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二十一章数据的整理与初步处理从图上看一年中北京气温变化的幅度比新加坡气温变化的幅度大,但是你知道如何通过计算比较这两地气温变化幅度的大小吗?这里四季分明。这里一年四季温度差不大你们更喜欢住在哪个城市?这里四季分明。这里一年四季温度差不大你们更喜欢住在哪个城市?§21.1算术平均数与加权平均数算术平均数的意义解决一些与不确定现象有关的问题,常常离不开收集和分析数据,数据是我们思考的基础.那么,有了一组数据以后,怎样表达和概括这一组数据呢?能否找到某些指标作为这组数据的代表呢?我们在小学已经学过的算术平均数经常就被用来作为一组数据的代表.回顾表21.1.1给出了某户居民2005年下半年的电话费用,请你帮这户居民算一算:平均每月花费了多少元电话费?表21.1.1某户居民2005年7—12月电话费用统计表月份789101112电话费(元)75.8045.0076.3065.9055.9045.90例1植树节到了,某单位组织职工开展植树竞赛,图21.1.1反映的是植树量与人数之间的关系.请根据图中信息计算:(1)总共植树多少棵?(2)平均每人植树多少棵?解(1)3×8+4×1+5×10+6×8+7×3+8×1=155,所以,总共植树155棵.(2)=5,所以,平均每人植树5棵.思考你发现植树总量、植树量的平均数和人数这三者之间的数量关系了吗?例2丁丁所在的初二(1)班共有学生40人.图21.1.2是该校初二年级各班学生人数分布情况.(1)请计算该校初二年级每班平均人数;(2)请计算各班学生人数,并绘制条形统计图.解(1)40÷20%=200(人),200÷5=40(人),所以,该校初二年级每班平均40人.(2)(2)班:200×23%=46(人);(3)班:200×22%=44(人);(4)班:200×17%=34(人);(5)班:200×18%=36(人).可以绘制如图21.1.3(a)的条形统计图来表示该校初二年级各个班级的人数情况:思考如图21.1.3(b),在你所绘制的条形统计图中画出一条代表平均人数40的水平线.图中代表各班人数的五个条形,有的位于这条线的上方,有的位于它的下方.想一想,水平线上方超出部分之和与下方不足部分之和在数量上有什么关系?练习1甲乙两所学校号召学生们向希望小学捐赠图书.已知甲校800名学生平均每人捐书4.5本;乙校学生比甲校少80人.如果要达到相同的捐书总量,那么乙校学生平均每人要捐书多少本?2某省统计数据显示,2005年1—6月平均每月进出口总额为82.445亿美元.下图是根据该省2005年上半年每月的进出口总额情况绘制的.不计算出口总额,你能将缺少的一点补在虚线恰当的位置上吗?用计算器求算术平均数当数据个数很多时,用计算器计算算术平均数显得非常简便.我们只要按照指定的顺序按键,便可得到计算结果.以前面某户居民2005年7—12月电话费这组数据为例,按键顺序如下:1,打开计算器;2,启动统计计算功能;3……,输入所有数据;4(STAT),计算出这组数据的算术平均数.你还可以根据计算器使用说明书动手试一试,怎样修改已经输入的数据,怎样简便地输入多个相同数据.练习1试用计算器算出以下各组数据的算术平均数:(1)5,5,6,6,6,7,8,8,8,8;(2)2578,364,98,46523;(3)41,32,53,43,56,26,37,58,69,15.2有一组数据的算术平均数等于7,参考上题计算算术平均数获得的经验,判断下列说法是否正确,错误的请举出一个反例:(1)如果这组数据共有三个,且其中一个大于7,那么必有一个小于7;(2)如果这组数据共有四个,且其中两个小于7,那么必有两个大于7.加权平均数在日常生活中,我们经常会与平均数打交道,但有时发现以前计算平均数的方法并不适用.〖〗你知道为什么要这样计算吗?例如老师在计算学生每学期的总评成绩时,不是简单地将一个学生的平时成绩与考试成绩相加除以2,作为该学生的总评成绩,而是按照“平时成绩占40%,考试成绩占60%”的比例计算(如图21.1.4),考试成绩更为重要.这样如果一个学生的平时成绩为70分,考试成绩为90分,那么他的学期总评成绩就应该为70×40%+90×60%=82(分).一般来说,由于各个指标在总结果中占有不同的重要性,因而会被赋予不同的权重,上例中的40%与60%就是平时成绩与考试成绩在学期总评成绩中的权重,最后计算得到的学期总评成绩82分就是上述两个成绩的加权平均数(weightedmean).小青在初一年级第二学期的数学成绩分别为:测验一得89分,测验二得78分,测验三得85分,期中考试得90分,期末考试得87分.如果按照图21.1.5所显示的平时、期中、期末成绩的权重,那么小青该学期的总评成绩应该为多少分?例3某公司对应聘者A、B、C、D进行面试,并按三个方面给应聘者打分,最后打分结果如表21.1.2所示.如果你是人事主管,会录用哪一位应聘者?表21.1.2四位应聘者的面试成绩满分ABCD专业知识2014181716工作经验2018161416仪表形象2012111416分析 甲同学说:看谁的总分高就录用谁.通过计算可以发现D的总分最高,应被录用.这时乙同学说:我有不同意见.三个方面满分都是20分,但按理这三个方面的重要性应该有所不同,比如专业知识就应该比仪表形象更重要.讨论 假设上述三个方面的重要性之比为6∶3∶1(如图2116),那么应该录用谁呢?解 因为6∶3∶1=60%∶30%∶10%,所以专业知识、工作经验与仪表形象这三个方面的权重分别是60%、30%与10%.这样A的最后得分为14×60%+18×30%+12×10%=15.请你根据这样的权重要求,继续算出另三位应聘者的最后得分.从你的计算结果看,谁应被录用?思考如果这三方面的重要性之比为10∶7∶3,此时哪个方面的权重最大?哪一位应被录用呢?练习一家小吃店原有三个品种的馄饨,其中菜馅馄饨售价为3元/碗,鸡蛋馅馄饨售价为4元/碗,肉馅馄饨售价为5元/碗.每碗有10个馄饨.该店新增了混合馄饨,每碗3个菜馅的、3个鸡蛋馅的、4个肉馅的.算一算,混合馄饨每碗的定价该是多少?如果混合馄饨的定价是3.8元,你觉得三个品种的馄饨可以如何合理搭配?思考商店里有两种苹果,一种单价为3.50元/千克,另一种单价为4元/千克.如果妈妈各买了2千克,那么妈妈所买苹果的平均价格为(3.50+4)÷2=3.75元/千克,这种算法对吗?为什么?如果妈妈买了单价为3.50元/千克的苹果1千克,单价为4元/千克的苹果3千克,那么这种算法对吗?为什么?例4一架电梯的最大载重是1000千克.现有13位“重量级”的乘客要搭乘电梯,已知其中11位先生的平均体重是80千克,2位女士的平均体重是70千克.请问他们能否一起安全地搭乘这架电梯?他们的平均体重是多少千克?解 11位先生的总体重=80×11=880(千克).2位女士的总体重=70×2=140(千克).13位乘客的总体重=880+140=1020(千克).因为总体重超过了电梯的最大载重,所以他们不能一起安全地搭乘.13位乘客的平均体重=1020÷13≈78.5(千克).这是一个已知两个平均数再求总平均数的问题,解这类问题一般不能采取“相加除以2”的平均化策略,因为两个方面的权重常常不相等.练习某人在A商店买了2包饼干,单价是2.20元.走了没多远,看见B商店也有卖这种饼干的,每包1.80元,他又买了3包.请先估计一下他买5包饼干的平均价格是小于、等于还是大于2元,然后再算出5包饼干的平均价格,看看你的估计对不对.扇形统计图的制作在日常生活中我们会见到和用到各种各样的统计图,扇形统计图(sectordiagram)就是其中的一种.问题1在某所医院的健康宣传栏里有一幅海报,如图21.1.7.显然,这样的统计图比文字更具有表现力.请保护您的牙齿!请保护您的牙齿!因为牙齿一旦失去,不再拥有!图中各个扇形分别代表了什么?人们失去牙齿最主要的原因是什么?对于不同年龄的人群,情况有没有不同?图21.1.7的每个圆中所有扇形表示的百分比之和为多少?量一量,每个扇形的圆心角度数是多少?同一个扇形图中各扇形圆心角的大小与图上所标的相应百分比之间有什么关系?因为扇形统计图可以清楚地告诉我们各部分数量占总数量的百分比,所以我们在表示各部分数量在总量中所占份额时常常使用扇形统计图.问题22002年12月3日22点16分,从摩纳哥蒙特卡洛举行的国际展览局大会上传来了振奋人心的消息——中国当选为2010年世博会的东道主!选举由国际展览局89个成员国的代表以无记名投票方式进行.在首轮投票中,中国以36票居第一,韩国28票,俄罗斯12票,墨西哥6票,波兰被淘汰;在第二轮投票中,中国获38票,韩国34票,俄罗斯10票,墨西哥遭淘汰;在第三轮投票中,中国获44票,韩国32票,俄罗斯被淘汰;在最后一轮投票中,中国以54票胜出.(消息来源/epublish/gb/paper51/1/class005100020/hwz835111.htm)怎样用扇形统计图表示各国得票数占总票数的百分比?以首轮投票的结果为例:中国得票数占总票数的百分比为36÷89≈40.45%,如图21.1.8,反映在扇形统计图上,扇形圆心角的度数应为360°×40.45%≈145.6°.你能将韩国、俄罗斯、墨西哥的该轮得票率补充在上面的扇形统计图中吗?如果条件允许,请借助计算机中的Excel软件绘制这幅扇形统计图,看看是不是又快又好.练习1某省2001年粮食总产量为2500.3万吨,其中,夏粮804.2万吨,早稻147.3万吨,秋粮1548.8万吨.如果用扇形统计图表示这组数据,各部分扇形的圆心角分别约为多少度?(精确到0.1°)2根据下表,你能用扇形统计图把各大洲土地面积占全球土地总面积的百分比表示出来吗?有条件的话,请尝试用计算机中的Excel软件帮你作图.(精确到0.1%)七大洲土地面积表洲名亚洲非洲欧洲北美洲南美洲大洋洲南极洲土地面积(万平方千米)4400302010162422.81797897140032002年10月12日《青年报》第2版刊载了下面的扇形统计图.(1)从图上看,被调查者对目前的医疗服务价格是如何评价的?(2)有人说这幅图有问题,你看出来了吗?(数据来源:中国经济景气监测中心)习题21.11在一批圆柱形机器零件中抽出20件.测得直径如下(单位:mm):56.1,55.9,55.9,56.0,55.8,56.1,55.7,55.6,56.3,56.2,56.2,55.7,56.3,56.1,56.2,56.2,55.9,55.8,56.0,56.0.计算这些零件的平均直径.想一想,有哪些不同的算法?22002年4月11日《文汇报》报道,据不完全统计,至今上海自愿报名去西部地区工作的专业技术人员和管理人员已达3600多人,其中硕士、博士占4%,本科学历占79%,大专学历占13%.根据上述数据绘制扇形统计图表示这些人员的学历分布情况.3第一组数据:10,10;第二组数据:20,20,20;第三组数据:30,30,30,30,30.请问每组数据的算术平均数分别是多少?如果将这三组数据合成一组新的数据,请问新数据的算术平均数是多少?4不用计算,根据条形统计图你能判断哪个班级学生的平均成绩高吗?5某同学在这学期的前四次数学测验中得分依次为95、82、76和88,马上要进行第五次数学测验了,她希望五次成绩的算术平均数能够达到或超过85分,那么,这次测验她至少要考多少分?6已知一组数据:0,1,3,3,3,5,6,7,9,10,在计算这组数据的算术平均数时,甲、乙、丙三位同学列出了不同的算式,请你帮他们判断对错,并说说理由.甲:(1+3+3+3+5+6+7+9+10)÷9;乙:(0+1+3+5+6+7+9+10)÷8;丙:(0+1+3×3+5+6+7+9+10)÷10.7中秋节到了,某班40名同学举行赏月联欢活动,有8位同学带来了月饼,数量如下:6,7,5,3,5,10,4,10.如果在全班同学中平分这些月饼,那么每人可以分得多少?阅读材料“均贫富”一组数据的平均数是什么含义?也许你会打个比方:有一组数据1,1,2,3,是我们每人手头现有的钱(单位:元),现在,我们四个人决定均贫富,大家将钱全都集中到一起,一共是7元,然后再将这些钱平分给每个人,那么,每人都分到1.75元,这1.75就是原来那组数据的平均数.不错,汇总然后平分这既是计算平均数的过程,也是从不平均到平均的过程.在这组数据中,凡是比平均数大的数与平均数的差都是正数,比平均数小的数与平均数的差都是负数,与平均数一样大的数(如果有的话)与平均数的差恰好为零.那么将所有的差相加答案会是什么呢?尝试一下,就以这组数据为例,所有的差之和是(1-1.75)+(1-1.75)+(2-1.75)+(3-1.75)=(-0.75)+(-0.75)+0.25+1.25=(-1.5)+1.5=0.经过均贫富,两个原来只有1元钱的人都额外得到了0.75元,他们得到的这1.5元正是另外两个人一起付出的1.5元,正负相抵,相加应该为零.从图上看,两条细线长度之和与两条粗线长度之和也恰好相等.一般地,假如这组数据是由a、b、c、d四个数组成的,它们的平均数是m,那么,所有的差相加是(a-m)+(b-m)+(c-m)+(d-m)=(a+b+c+d)-4m=4m-4m=0.假如这组数据是由五个或更多数字组成的,我们也一样可以证明这组数据中每个数与平均数的差相加是零.§21.2平均数、中位数和众数的选用一组数据的代表,除了我们已经学习过的平均数(mean)以外,常用的还有中位数(median)和众数(mode).中位数和众数例1 据中国气象局2001年8月23日8时预报,我国大陆各直辖市和省会城市当日的最高气温(℃)如表21.2.1所示,请分别用平均数(此为算术平均数)、中位数和众数代表这31个城市当日最高气温这组数据.表21.2.1 2001年8月23日8时预报的各地当日最高气温(℃)北京32天津33石家庄36太原31呼和浩特27沈阳27长春26哈尔滨26上海34南京32杭州32合肥32福州36南昌30济南33郑州34武汉31长沙29广州35海口35南宁36成都29重庆27贵阳24昆明23拉萨21西安33兰州28银川30西宁26乌鲁木齐29解 (1)平均数:32+33+36+31+27+27+26+26+34+32+32+32+36+30+33+34+31+29+35+35+36+29+27+24+23+21+33+28+30+26+29=937,937÷31≈30.2.所以,这些城市当日预报最高气温的平均数约为30.2℃.(2)中位数:如图21.2.1,将31个城市的气温数据按由低到高的顺序重新排列,用去掉两端逐步接近正中心的办法可以找出处在正中间位置的那个值,即中位数.所以,这些城市当日预报最高气温的中位数是31℃.思考如果是偶数个城市,那么用去掉两端逐步接近正中心的办法,最后也只剩下惟一一个没被划去的数据吗?如果是偶数个城市,那么最后就将剩下两个处在正中间的数,这时,为了公正起见,我们取这两个数的算术平均数作为中位数.(3)众数:如表21.2.2,统计每一气温在31个城市预报最高气温数据中出现的频数,可以找出频数最多的那个气温值,它就是众数.表21.2.2气温℃2123242627282930313233343536频数11133132243223由表21.2.2可知,这些城市当日预报最高气温的众数是32℃.思考若有两个气温(如29℃和32℃)的频数并列最多,那么怎样决定众数呢?如果这样,那么我们不是取29℃和32℃这两个数的平均数作为众数,而是说这两个气温值都是众数.我们可以把例1中的平均数、中位数和众数在统计图上表示出来,如图21.2.2.平均数是概括一组数据的一种常用指标,反映了这组数据中各数据的平均大小.中位数是概括一组数据的另一种指标,如果将一组数据按由小到大的顺序排列(即使有相等的数据也要全部参加排列),那么中位数的左边和右边恰有一样多的数据.众数告诉我们,这个值出现的次数最多.一组数据可以有不止一个众数,也可以没有众数.平均数、中位数和众数从不同的侧面概括了一组数据,正因为如此,这三个指标都可作为一组数据的代表.例2 一名警察在高速公路上随机观察了6辆过往车辆,它们的车速分别为(单位:千米/时):66,57,71,54,69,58.那么,这6辆车车速的中位数和众数是什么呢?解 将6辆车的速度按从小到大的顺序重新排列,得到54,57,58,66,69,71.位于正中间的数值不是一个而是两个,所以应取这两个数值的平均数作为中位数,即中位数是(58+66)÷2=62(千米/时).因为每辆车的速度都不一样,没有哪个车速出现的次数比别的多,所以这6辆车的速度没有众数.练习1判断题:(正确的打“√”,不正确的打“×”)(1)给定一组数据,那么这组数据的平均数一定只有一个. ()(2)给定一组数据,那么这组数据的中位数一定只有一个. ()(3)给定一组数据,那么这组数据的众数一定只有一个. ()(4)给定一组数据,那么这组数据的平均数一定位于最大值和最小值之间.()(5)给定一组数据,那么这组数据的中位数一定等于最小值和最大值的算术平均数. ()(6)给定一组数据,如果找不到众数,那么众数一定就是0. ()2某商场进了一批苹果,每箱苹果质量约5千克.进入仓库前,从中随机抽出10箱检查,称得10箱苹果的质量如下(单位:千克):4.8,5.0,5.1,4.8,4.9,4.8,5.1,4.9,4.7,4.7.请指出这10箱苹果质量的平均数、中位数和众数.平均数、中位数和众数的选用从前面的学习内容我们知道,平均数、中位数和众数都是用来代表一组数据的,而且,它们互相之间可以相等也可以不相等,没有固定的大小关系.当它们不全相等的时候,就产生如何选用才恰当的问题了.让我们先来讨论一个同学之间互相比较成绩的问题.例3八年级某班的教室里,三位同学正在为谁的数学成绩最好而争论,他们的5次数学成绩分别是:小华:62,94,95,98,98;小明:62,62,98,99,100;小丽:40,62,85,99,99.他们都认为自己的成绩比另两位同学好,你看呢?分析 根据表21.2.3,小华说他的成绩平均数最高,所以他成绩最好;小明说应该比较中位数,他的成绩中位数最高;小丽则说应该比较众数,她是三人中成绩众数最高的人.表21.2.3平均数中位数众数小华89.49598小明84.29862小丽778599从三人的测验分数对照图21.2.3来看,你认为哪一个同学的成绩最好呢?例4 随着汽车的日益普及,越来越多的城市发生了令人头痛的交通堵塞问题.你认为用过往车辆一天车速的平均数衡量某条交通主干道的路况合适吗?分析 人们上、下班的时候是一天中道路最繁忙的两个时段,其他时段车流量明显减少,因此,如果用一天车速的平均数来衡量道路的路况,那么上、下班交通堵塞的问题就给掩盖了.所以,较为合理的是按道路繁忙的不同程度,将一天分为几个时段分别计算平均车速.平均数、中位数和众数各有其长,也各有其短,下面的几个例子也许能让你对它们了解得更深.▲那边草地上有6个人正在玩游戏,他们年龄的平均数是15岁.请想象一下是怎样年龄的6个人在玩游戏.通常人们会想象是一群中学生在玩游戏,但是,如果是一个65岁的大娘领着5个5岁的孩子在玩游戏也是有可能的嘛!这是一个不适合用平均数而适合用众数或中位数代表一组数据的例子,大娘的年龄把平均年龄一下子给抬上去了.▲为筹备班级里的新年晚会,班长对全班同学爱吃哪几种水果作了民意调查.最终买什么水果,该由调查数据的平均数、中位数还是众数决定呢?当然由众数决定,因为各种水果喜好人数的平均数或中位数都没什么意义.▲八年级有4个班级,如果已知在一次测验中这4个班级每班的平均分,也知道各班级的学生人数,那么,我们可以计算出整个年级的平均分,但是,如果已知的是每个班级的中位数或者众数,那么我们是没有办法得出整个年级的中位数或者众数的.请老师准备一根绳子.面对所有学生,捏住绳子的两端,将绳子拉直,请全班同学目测几秒钟后估计这根绳子的长度.请全班同学设计和完成一张统计表和一张统计图,全面反映每个同学对这根绳子长度的估计值,计算出全班同学估计值的平均数、中位数和众数.在全班同学估计值的基础上,请给出一个最后的估计值,作为全班集体对这根绳子长度的估计值.最后,教师重新出示这根绳子,请学生代表当众用尺量出这根绳子的长度.这个测量值与全班同学目测的估计值接近吗?全班讨论一下比较的结果,为什么测量值与估计值相差不大或者相差较大.练习检验某厂生产的手表质量时,检查人员随机抽取了10只手表,在下表中记下了每只手表的走时误差(正数表示比标准时间快,负数表示比标准时间慢),你认为用这10只手表误差的平均数来衡量这10只手表的精度合适吗?手表序号12345678910日走时误差(秒)-201-3-1024-32习题21.21根据所给数据,求出平均数、中位数和众数,并填入下表.(精确到0.1)数据平均数中位数众数20,20,21,24,27,30,320,2,3,4,5,5,10-2,0,3,3,3,8-6,-4,-2,2,4,62老师想知道学生们每天在上学的路上要花多少时间,于是让大家将每天来校上课的单程时间写在纸上.下面是全班30名学生单程所花的时间(分钟):20,20,30,15,20,25,5,15,20,10,15,35,45,10,20,25,30,20,15,20,20,10,20,5,15,20,20,20,5,15.(1)请画出学生上学单程所花时间(5分钟,10分钟,15分钟,……)出现频数的条形统计图;(2)求学生上学单程所花时间的平均数、中位数和众数;(3)假如老师随机地问一个同学,你认为老师最可能得到的回答是多少分钟?3简答题,请说明理由:(1)河水的平均深度为2.5米,一个身高1.5米但不会游泳的人下水后肯定会淹死吗?(2)某校录取新生的平均成绩是535分,如果某人的考分是531分,他肯定没有被这个学校录取吗?(3)5位学生在一次考试中的得分分别是:18,73,78,90,100,考分为73的同学是在平均分之上还是之下?你认为他在5人中考分属“中上”水平吗?(4)9位学生的鞋号由小到大是:20,21,21,22,22,22,22,23,23.这组数据的平均数、中位数和众数中哪个指标是鞋厂最不感兴趣的?哪个指标是鞋厂最感兴趣的?4判断下列说法是否正确,若认为不正确,请举出反例:(1)只要一组数据中新添入一个数据,那么平均数就一定会跟着变动;(2)只要一组数据中有一个数据变动,那么中位数就一定会跟着变动.5今天是小学班主任张老师的生日,小华、小明、小丽和小芳都是张老师以前的学生,他们打算每人带一些桃子去看望张老师.根据以下两种情况,先分别画出条形统计图,表示每人所带桃子的数量,再回答两种情况中的哪一种用平均数代表学生们送的桃子数较为合理?为什么?(1)小华带来8个,小明带来20个,小丽带来10个,小芳带来12个;(2)小华带来8个,小明带来10个,小丽带来10个,小芳带来12个.阅读材料计算机帮我们求平均数、中位数和众数MicrosoftOffice中的Excel不仅可以用来画统计图,还可以用来求平均数、中位数和众数.不妨就以第140页例1中31个城市当日最高气温这组数据为例,用计算机来求这三个指标.操作步骤是这样的:(1)打开Excel,在空白的这张表中的第一列逐个输入所有的数据,一个数据占一格.选中一个空白格,作为计算机放答案的位置.如图1所示.图1(2)点击工具栏中的“=”后,在“=”这一行的最前面会出现一个可下拉的菜单,点击一下这个菜单,将显示如图2所示的屏幕.如果要计算平均数,就选择“AVERAGE”;要计算中位数,就选择“MEDIAN”;要计算众数,就选择“MODE”.(3)拖动鼠标,将我们刚才输入的这一列数据全部选中,于是,在Number1这一格中就会显示这列数据所在的范围(从A1到A31),如图3所示.按一下确定,答案就出现在你刚才选定放答案的那个格子中了.图2图3试一试吧!要注意的是,利用Excel求众数时只能得到一个结果.如果一组数据有两个以上的众数,你获得的只是首先出现的那个众数.§21.3级差、方差与标准差表示一组数据离散程度的指标回顾我们已经知道,如果要概括一组数据,那么可以选用这些数据的代表:平均数、中位数或众数.问题1表21.3.1显示的是上海2001年2月下旬和2002年同期的每日最高气温,如何对这两段时间的气温进行比较呢?表21.3.1上海每日最高气温统计表(单位:℃)2月21日2月22日2月23日2月24日2月25日2月26日2月27日2月282001年12131422689122002年131312911161210从表21.3.1中可以看出,2002年2月下旬和2001年同期的气温相比,有4天的温度相对高些,有3天的温度相对低些,还有1天的温度相同.我们可以由此认为2002年2月下旬的气温总体上比2001年同期高吗?比较两段时间气温的高低,求平均气温是一种常用的方法.经计算可以看出,对于2月下旬的这段时间而言,2001年和2002年上海地区的平均气温相等,都是12℃.这是不是说,两个时段的气温情况总体上没有什么差异呢?图21.3.1是根据两段时间的气温情况绘成的折线图.图21.3.1不同时段的最高气温观察一下,你感觉它们有没有差异呢?把你通过观察得到的判断写在下面的横线上:_______________________________________________________________________________________________________________________________________________________________________________________________________________通过观察,我们可以发现:图(a)中折线波动的范围比较大——从6℃到22℃,图(b)中折线波动的范围则比较小——从9℃到16℃.思考什么样的指标可以反映一组数据变化范围的大小?我们可以用一组数据中的最大值减去最小值所得的差来反映这组数据的变化范围.用这种方法得到的差称为极差(range).极差=最大值-最小值极差=最大值-最小值在图21.3.1中我们可以看出,图(a)中最高气温与最低气温之间差距很大,相差16℃,也就是极差为16℃;图(b)中所有气温的极差为7℃,所以从图中看,总体上气温变化的范围不太大.在生活中,我们常常会和极差打交道.班级里个子最高的学生比个子最矮的学生高多少?家庭中年纪最大的长辈的年龄比年纪最小的孩子大多少?这些都是求极差的例子.思考为什么说本章导图中的两个城市,一个“四季温差不大”,一个“四季分明”?问题2图2132小明和小兵两人参加体育项目训练,近期的5次测试成绩如表21.3.2所示.谁的成绩较为稳定?为什么?表21.3.2测试次数12345小明1314131213小兵1013161412通过计算,我们发现两人测试成绩的平均值都是13分.从图21.3.2可以看到:相比之下,小明的成绩大部分集中在13分附近,而小兵的成绩与其平均值的离散程度较大.通常,如果一组数据与其平均值的离散程度较小,我们就说它比较稳定.思考怎样的数能反映一组数据与其平均值的离散程度?我们已经看出,小兵的测试成绩与平均值的偏差较大,而小明的较小.那么如何加以说明呢?可以直接将各数据与平均值的差进行累加吗?在表21.3.3中写出你的计算结果.表21.3.312345求和小明每次测试成绩1314131213每次成绩-平均成绩小兵小兵每次测试成绩1013161412每次成绩-平均成绩通过计算,依据最后求和的结果可以比较两组数据围绕其平均值的波动情况吗?如果不行,请你提出一个可行的方案,在表21.3.4的红色格子中写上新的计算方案,并将计算结果填入表中.表21.3.412345小明每次测试成绩1314131213小兵每次测试成绩1013161412思考如果一共进行了7次测试,小明因故缺席了两次,怎样比较谁的成绩更稳定?请将你的方法与数据填入表21.3.5中.表21.3.51234567小明每次测试成绩131413缺席13缺席12小兵每次测试成绩10101314121616我们可以用“先平均,再求差,然后平方,最后再平均”得到的结果表示一组数据偏离平均值的情况.这个结果通常称为方差(variance).我们通常用表示一组数据的方差,用表示一组数据的平均数,、、…表示各个原始数据.表21.3.2中小明5次测试成绩的方差的计算式就是从方差的计算过程,可以看出的数量单位与原数据的不一致了,因此在实际应用时常常将求出的方差再开平方,这就是标准差(standarddeviation).计算可得:小明5次测试成绩的标准差为______________________________,小兵5次测试成绩的标准差为______________________________.练习1比较下列两组数据的极差和方差:A组:0,10,5,5,5,5,5,5,5,5;B组:4,6,3,7,2,8,1,9,5,5.2算一算,第150页问题1中哪一年气温的离散程度较大?和你从图21.3.1中直观看出的结果一致吗?用计算器求标准差用笔算的方法计算标准差比较繁琐,如果能够利用计算器,就会大大提高效率.下面以计算2002年2月下旬的上海每日最高气温的标准差为例,按键顺序如下:1,打开计算器;2,启动统计计算功能;3……,输入所有数据;4(STAT),计算出这组数据的标准差.练习下表给出了两种股票从2002年4月1日到4月19日的交易日收盘价格,分别计算它们的平均数和方差,并比较这两种股票在这段时间内的涨跌变化幅度.日期12345891011121516171819A股票11.5911.1711.1511.6211.5111.3911.9412.2912.0212.0211.9511.9711.8911.5911.76B股票13.4913.5313.5114.0713.8413.9814.6714.8014.6114.6014.4114.3114.3814.0214.17习题2131下表是甲、乙两人10次射击的成绩(环数).甲9676877989乙2468778697将下表填写完整.甲乙每次成绩每次成绩-平均成绩(每次成绩-平均成绩)每次成绩每次成绩-平均成绩(每次成绩-平均成绩)12345678910总计平均(2)谁的平均成绩高?(3)谁的成绩较为稳定?为什么?2下表是掷两颗骰子的实验中得到的数据.投掷次数5101520253035404550出现数字之和为奇数的频数24810141720222526出现数字之和为奇数的频率0.4000.4000.5330.5000.5600.5670.5720.5500.5560.520投掷次数556065707580859095100出现数字之和为奇数的频数27283034374042454750出现数字之和为奇数的频率0.4910.4670.4620.4860.4930.5000.4940.5000.4950.500分别计算前10个频率值的极差、标准差和后10个频率值的极差、标准差,说说哪一段的频率表现得更为稳定.3甲、乙两运动员在10次百米跑练习中成绩如下.(单位:秒)甲10.810.911.010.711.010.710.9乙10.*910.910.810.811.010.910.811.110.910.8如果根据这10次成绩选拔一人参加比赛,你认为哪一位较为合适?阅读材料早穿皮袄午穿纱“早穿皮袄午穿纱”是一句地方民谣,它形象地在我们面前描绘出一幅奇特的景象:早上寒冷得穿上又厚又重的皮袄,中午却炎热得只穿又薄又轻的纱衣.为什么会出现这种现象?那是因为在我国的西北地区一日之间气温变化较大.有时午后最高气温达到三十摄氏度以上,但清晨最低气温却只有十几度.下面是我国西北和南方一些地区某日的最高、最低气温,看看西北各地区该日气温的极差有多大,再和南方对比一下,你将不难理解在我国的西北地区为什么广为流传“早穿皮袄午穿纱”这一句民谣.2002年6月29日我国部分地区天气情况最高温度(℃)最低温度(℃)极差(℃)西北乌鲁木齐331914>10达坂城341915石河子332013吐鲁番442519银川342014敦煌341816南方汕头34277<10高雄33312海口34277广州34268 新疆的博格达峰和天鹅湖小结知识结构处表示一组数据集中程度的指标表示一组数据集中程度的指标表示一组数据离散程度的指标处理数据加权平均数平均数中位数众数极差方差标准差用计算器求平均数合理选用平均数、中位数和众数用计算器求标准差二、概括1数据对我们了解所考察的对象非常重要,但过多的数据有时反而让我们无法把握,这时可以做两件事:一是制作形象的统计图表,对这组数据形成一个整体印象;二是计算代表这组数据的平均数、中位数和众数,以这几个指标概括这组数据.当然,不是在所有问题中这三个指标都有实际的意义,如果某个指标没意义,自然不必计算.有了好的工具还要用得恰当,选取一组数据的代表要注意平均数、中位数和众数的适用范围.2对于给出的一组数据,可以通过求平均数、中位数和众数来反映数据的中心,与此同时,了解数据的离散程度也非常重要.因此,我们可以通过求极差、方差和标准差的方式来了解数据的离散程度.极差计算方便,但只对极端值较为敏感;方差计算比较复杂,但可以比较全面地反映数据的离散程度.3计算器和计算机具有强大的数据处理功能,可以将我们从繁杂的计算和绘图工作中解放出来.复习题A组1说说你从下图中获得了哪些信息?并用扇形统计图重新表示这些数据.2某班30名学生的考试成绩如下:76,56,80,78,71,78,90,79,92,83,81,93,84,86,98,61,75,84,90,73,80,86,84,88,81,90,78,92,89,100.请计算这次考试全班分数的平均数、中位数和众数.3第一组数据是:1,3,5,7,9.第二组数据是:21,23,25,27,29,31,33.先分别求出这两组数据的平均数,再将这两组数据合并在一起,求合并后这组数据的平均数,想一想,它是前两个平均数的算术平均数吗?4下表中给出了某校六年级和九年级部分同学的身高(单位:厘米),哪个年级的同学平均身高较高?哪个年级的同学身高的方差较大?请先不计算试着回答这两个问题,再通过计算得出答案,与你预期的答案一致吗?六年级
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度离婚协议财产分割及子女抚养权协商书15篇
- 2024年度担保公司业务拓展合作协议3篇
- 2024年度农产品加工区域代理合作协议3篇
- 2024年度幼儿园园长全面管理聘用合同范本3篇
- 2024停车场智能化改造与运营维护综合合同3篇
- 2024医疗保健机构内部审计与风险管理合同3篇
- 2024年二零二四年度农业种子安全检测与风险评估合同3篇
- 2024年度担保业务操作规范合同3篇
- 2024年度能源单位劳务派遣劳动合同(含环保责任)3篇
- 2024年度特色旅游演出项目合作合同3篇
- 期末素养展示-2024-2025学年语文三年级上册统编版
- 2024中华人民共和国学前教育法学习解读课件
- 蒸镀机基础知识单选题100道及答案解析
- 2024年秋新人教PEP版3年级上册英语教学课件 Unit 4 第4课时 Part B Let's talk
- 私募股权基金公司的账务处理-记账实操
- 期末模拟考试卷01-2024-2025学年上学期高二思想政治课《哲学与人生》原题卷+答案卷
- 沙金矿承包开采合作协议书范文
- 英语四级模拟试题(附答案)
- 2024智慧城市数据分类标准规范
- 文玩交易合同(2篇)
- 智研咨询发布-2024年中国牛油果行业现状、发展环境及投资前景分析报告
评论
0/150
提交评论