高中数学必修32_第1页
高中数学必修32_第2页
高中数学必修32_第3页
高中数学必修32_第4页
高中数学必修32_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2.2.2用样本的数字特征估计总体的数字特征学习目标1.理解样本数据标准差的意义和作用,学会计算数据的标准差2会用样本的基本数字特征来估计总体的基本数字特征.知识点一众数、中位数、平均数思考平均数、中位数、众数中,哪个量与样本的每一个数据有关,它有何缺点?答案平均数与样本的每一个数据有关,它可以反映出更多的关于样本数据总体的信息,但是平均数受数据中极端值的影响较大.梳理众数、中位数、平均数定义⑴众数:一组数据中出现次数最多的数⑵中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置的额或中间两个数的平均数)叫做这组数据的中位数.⑶平均数:如果n个数%1,%2,…,xn,那么7=n(X1+X2+…+xn)叫做这n个数的平均数知识点二方差、标准差标准差、方差的概念及计算公式⑴标准差是样本数据到平均数的一种平均距离,一般用S表示.S=平均数是mx+a.(2)设数据x1,x2,…,xn的平均数为x,方差为s2,则1a.s2—n[(x1+x2H Hxn)—nx2];b.数据x1+a,x2+a,…,xn+a的方差也为s2;c.数据ax1,ax2,…,axn的方差为a2s2..中位数是一组数据中间的数.(X).众数是一组数据中出现次数最多的数.(V).一组数据的标准差越小,数据越稳定,且稳定在平均数附近(V)类型一众数、中位数、平均数的应用命题角度1众数、中位数、平均数的计算例1某公司的各层人员及工资数构成如下:人员:经理1人,周工资22000元;高层管理人员6人,周工资均为1800元;高级技工5人,周工资均为1500元;工人10人,周工资均为1000元;学徒1人,周工资为500元.⑴计算该公司员工周工资的众数、中位数、平均数;(2)这个问题中,平均数能客观地反映这个公司的工资水平吗?考点众数、平均数、中位数的综合题点具体数据中的众数、平均数、中位数解⑴众数为1000,中位数为1500,平均数为22000X1+1800X6+1500X5+1000X10+500X1 弋2209.1+6+5+10+1(2)虽然平均数为2209,但由给出的数据可见,只有经理的周工资在平均数以上,其余的都在平均数以下,故用平均数不能客观地反映该公司的工资水平反思与感悟⑴众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.(2)众数考查各个数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中部分数据多次重复出现时,众数往往更能反映问题⑶中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响,中位数可能在所给的数据中,也可能不在所给的数据中.(4)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引起平均数的变动.(5)因为平均数与每一个样本数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数不具有的性质,也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于全体样本数据的信息但平均数受数据的极端值的影响较大,使平均数在估计总体时可靠性降低跟踪训练1在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:成绩(单位:m)1.501.601.651.701.751.801.851.90人数23234111分别求这些运动员成绩的众数、中位数与平均数.考点众数、平均数、中位数的综合题点具体数据中的众数、平均数、中位数解在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70.这组数据的平均数是T=上(1.50X2+1.60X3+…+28.751.90X1)=下一心1.69(m).答17名运动员成绩的众数、中位数、平均数依次为1.75m,1.70m,1.69m.命题角度2用频率分布直方图估算众数、中位数、平均数例2已知一组数据:125 121 123 125 127 129 125 128 130 129126 124 125 127 126 122 124 125 126 128⑴填写下面的频率分布表:分组频数频率[121,123)[123,125)[125,127)[127,129)[129,131]合计(2)作出频率分布直方图;⑶根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数考点众数、平均数、中位数的综合题点频率分布直方图中的众数、平均数、中位数解(1)频率分布表如下:分组频数频率[121,123)20.10[123,125)30.15[125,127)80.40[127,129)40.20[129,131]30.15合计201.00(2濒率分布直方图如下:⑶在[125,127)中的数据最多,取这个区间的中点值作为众数的近似值,得众数126,事实上众数的精确值为125.图中虚线对应的数据是125+2x5=126.25事实上中位数为125.5.8使用“组中值”求平均数:T=122X0.1+124X0.15+126X0.4+128X0.2+130X0.15=126.3,平均数的精确值为T=125.75.反思与感悟(1)利用频率分布直方图估计数字特征①众数是最高的矩形的底边中点的横坐标;②中位数左右两侧直方图的面积相等;③平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和(2)利用直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致跟踪训练2一批乒乓球,随机抽取100个进行检查,球的直径频率分布直方图如图.试估计这个样本的众数、中位数和平均数.考点众数、平均数、中位数的综合题点频率分布直方图中的众数、平均数、中位数39.99+40.01解众数= 2 =40;中位数为39.99+02=39.998;四个矩形的面积分别是0.02X5=0.1,0.02X10=0.2,0.02X25=0.5,0.02X10=0.2.平均数为39.96X0.1+39.98X0.2+40X0.5+40.02X0.2=39.996.类型二标准差、方差的应用例3计算数据89,93,88,91,94,90,88,87的方差和标准差(标准差结果精确到0.1).考点方差与标准差题点求方差与标准差1. . . . .... 1解①%=90+Z[(-1)+3+(-2)+1+4+0+(-2)+(-3)]=90+7X0=90;88②计算x.-7(i=1,2,…,8),得各数据为-1,3,-2,1,4,0,-2,-3;③计算(x-7)2(i=1,2,…,8),得各数据为1,9,4,1,16,0,4,9;1 44④计算方差:s2=8(1+9+4+1+16+0+4+9)=8=5.5;⑤计算标准差:s=.'53^2.3.所以这组数据的方差为5.5,标准差约为2.3.反思与感悟⑴方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小.(2)样本标准差反映了各样本数据围绕样本平均数波动的大小,标准差越小,表明各样本数据在样本平均数周围越集中;反之,标准差越大,表明各样本数据在样本平均数的两边越分散.(3)若样本数据都相等,则s=0.(4)当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估计总体的数字特征,而样本数据的离散程度是由标准差来衡量的.跟踪训练3某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其质量,分别记录抽查数据如下(单位:kg):甲:102 101 99 98 10398 99乙:110 115 90 85 75115 110试计算甲、乙两个车间产品质量的平均数与方差,并说明哪个车间产品比较稳定考点方差与标准差题点求方差与标准差解T甲二;(102+101+99+98+103+98+99)=100;- 1%乙=7(110+115+90+85+75+115+110)=100;s甲=1[[(102-100)2+(101-100)2+(99-100)2+(98-100)2+(103-100)2+(98-100)2+(99-100)2]=1(4+1+1+4+9+4+1户3.43;s乙=7[(110-100)2+(115-100)2+(90-100)2+(85-100)2+(75-100)2+(115-100)2+(110-100)2]=7(100+225+100+225+625+225+100户228.57.所以s甲<s乙,故甲车间产品较稳定..某市2017年各月的平均气温(℃)数据的茎叶图如图:则这组数据的中位数是()A.19B.20C.21.5D.23考点中位数题点求茎叶图中的中位数答案B解析由茎叶图知,平均气温在20℃以下的有5个月,在20℃以上的也有5个月,恰好是20℃的有2个月,由中位数的定义知,这组数据的中位数为20.故选B..设样本数据%],%2,…,%10的平均数和方差分别为1和4,若%=%+a(a为非零常数,i=1,2,…,10),则y1,y2,…,匕0的平均数和方差分别为()A.1+a,4 B.1+a,4+aC.1,4 D.1,4+a考点平均数题点由两组数的关系求平均数和方差答案A解析•.•%1,%2,…,%10的平均数%=1,方差阡=4,且/=x.+a(i=1,2,…,10),,y1,为,…,y10的平均数—_1 1 _1_y=i0'(y1+y2+…+y10)=m.(%1+%2+^+%10+10a尸血心1+%2+…+%10)+a=%+a=1+a,1 1其方差,2二百口1-y)2+(y2-y)2+…+(y10-y沏=元[(%1-1)2+(%2-1)2+•••+(%10-1)2]=,2-4.故选A..某校从高一年级参加期末考试的学生中抽出60名,其成绩(均为整数)的频率分布直方图如图所示,由此估计此次考试成绩的中位数、众数分别是()A.73.3,75 B.73.3,80C.70,70 D,70,75考点中位数题点求频率分布直方图中的中位数答案A解析由图可知小于70的有24人,大于80的有18人,则在[70,80)之间的有18人,所以中位数落在[70,8。)这组内,且为70+13°-73.3;众数就是频率分布直方图中最高的矩形底70+80边中点的横坐标,即*0=75..若样本数据11,%2,…,%10的标准差为8,则数据2%1-1,2x2—1,…,2%10-1的标准差为.考点方差与标准差题点求标准差答案16解析设样本数据11,%2,…,%10的标准差为s,则s=8,可知数据2%1T,2x2-1,…,2%10-1的标准差为2s=16..某校医务室抽查了高一10位同学的体重(单位:kg)如下:74,71,72,68,76,73,67,70,65,74.求这10个学生体重数据的平均数、中位数、方差、标准差;2)估计高一所有学生体重数据的平均数、中位数、方差、标准差考点平均数与方差的综合应用题点利用定义求平均数与方差一、. - 1解(1)这10个学生体重数据的平均数为%=历X(74+71+72+68+76+73+67+70+65+74)=71.这10个学生体重数据从小到大依次为65,67,68,70,71,72,73,74,74,76,位于中间的两个数是71,72,71+72.•.这10个学生体重数据的中位数为一=715这10个学生体重数据的方差为s2=Rx[(74-71)2+(71-71)2+(72-71)2+(68-71)2+(76-71)2+(73-7功+(67-71)2+(70-71)2+(65-71)2+(74-71)2]=11,这10个学生体重数据的标准差为s=\昆=-..;T1.(2)由样本估计总体得高一所有学生体重数据的平均数为71,中位数为71.5,方差为11.标准差为.JI.标准差的平方S2称为方差,有时用方差代替标准差测量样本数据的离散程度方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差..现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有随机性,用样本的数字特征估计总体的数字特征,是一种统计思想,没有唯一答案一、选择题1.某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各1人,则该小组数学成绩的平均数,众数,中位数分别为()A.85分,85A.85分,85分,85分B.87分,85分,86分C.87分,C.87分,85分,85分D.87分,85分,90分考点众数、平均数、中位数的综合题点具体数据中的众数、平均数、中位数答案C解析100+解析100+95+90X2+85X4+80+75平均数为 行 二87,众数为85,中位数为85,故选C.2.某台机床加工的五批同数量的产品中次品数的频率分布如表:次品数01234频率0.50.20.050.20.05则次品数的平均数为()A.1.1 B.3C.1.5 D.2考点平均数题点由表或图估计平均数答案A解析设数据外出现的频率为p/i=1,2,…,n),则11,%2,…,xn的平均数为x1p1+x%+…+xpn=0X0.5+1X0.2+2X0.05+3X0.2+4X0.05=1.1,故选A..样本中共有5个个体,其值分别为。,0,1,2,3.若该样本的平均数为1,则样本的标准差为aa/IC.2考点艮6aa/IC.2考点艮6D.\12题点方差与标准差求方差与标准差答案解析•・解析•・•样本《0,1,2,3的平均数为1,...亨=1,解得a=-1.贝雅样本的方差s2=|x[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2,故标准差为、故选D..某省农科所经过5年对甲、乙两棉种的实验研究,将连续5年棉花产量(千克/亩)的统计数据用茎叶图表示,如图所示,则平均产量较高与产量较稳定的分别是()A.甲棉种;甲棉种 B.乙棉种;甲棉种C.甲棉种;乙棉种 D.乙棉种;乙棉种考点用样本数字特征估计总体数字特征题点平均数与方差的综合应用答案C解析根据茎叶图的数据知,甲棉种产量为68,69,70,71,72;乙棉种产量为68,68,69,69,71..•.甲棉种的平均值7甲=5*(68+69+70+71+72)=70;乙棉种的平均值T乙二上X(68+68+69+69+71)=69.甲的方差,=1*[(68-70)2+(69-70)2+(70-70)2+(71-70)2+(72-70用=2,乙的方差s乙=1*[(68-69)2+(68-69)2+(69-69)2+(69-69)2+(71-69用=1.2.,甲棉种平均产量较高,乙棉种产量较稳定.故选C..200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速的众数、中位数的估计值为()A.62,62.5 B,65,62C.65,62.5 D.62.5,62.5考点众数、中位数的综合应用题点频率分布直方图中的众数、中位数答案C解析..•最高的矩形为第三个矩形,•・时速的众数的估计值为65.前两个矩形的面积为(0.01+0.03)X10=0.4..•0.5-0.4=0.1,首*10=2.5,.・中位数的估计值为60+2.5=62.5.故选C.6.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有()A.a>b>c B.b>c>aC.c>a>b D.c>b>a考点众数、平均数、中位数的综合题点具体数据中的众数、平均数、中位数答案D解析由已知得a==X(15+17+14+10+15+17+17+16+14+12)=14.7,b=2*(15+15)=15,c=17,・,・c>b>a.故选D.7.高三学生李丽在一年的五次数学模拟考试中的成绩(单位:分)为:%,必105,109,110.已知

该同学五次数学成绩数据的平均数为108,方差为35.2,则I%—yI的值为()A.15B.16C.17D.18考点平均数与方差的综合应用题点平均数与方差中的方程问题答案D解析由题意得,%+解析由题意得,%+y+105+109+1105二108=35.2(%-108)2+(y-5%=99, |%=117由=35.25%=99, |%=117由①②解得彳 或彳、y=117, 〔y二99,所以I%-yI=18.故选D.8.一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是()A.57.2,3.6 B.57.2,56.4C.62.8,63.6 D.62.8,3.6考点平均数与方差的综合应用题点平均数与方差中的方程问题答案D解析每一个数据都加上60,所得新数据的平均数增加60,而方差保持不变.9.甲、乙两名同学在5次体育测试中的成绩统计的茎叶图如图所示.若甲、乙两人的平均成绩分别是7甲,7乙则下列结论正确的是()A.%甲<%乙乙比甲成绩稳定b.7甲〉7乙甲比乙成绩稳定C.1甲〉1乙乙比甲成绩稳定d.7甲<7乙甲比乙成绩稳定考点平均数与方差的综合应用题点平均数和方差在决策中的意义答案A解析甲同学的成绩为78,77,72,86,92,乙同学的成绩为78,82,88,91,95,所以三甲=5*(78+77+72+86+92)=81,— —1 /C"CCCT C,C%乙=5*(78+82+88+91+95)=86.8.所以T甲<T乙,从叶在茎上的分布情况来看,乙同学的成绩更集中于平均值附近,这说明乙比甲成绩稳定.二、填空题.一组数据2,%,4,6,10的平均数是5,则此组数据的标准差是 .考点方差与标准差题点求方差与标准差答案2行解析一组数据2,%,4,6,10的平均数是5,,・2+%+4+6+10=5*5,解得%=3,•・此组数据的方差s2=5*[(2-5)2+(3-5)2+(4-5)2+(6-5卜+(10-5均=8,•・此组数据的标准差s=2-;2..如图所示的茎叶图是甲、乙两组各5名学生的数学竞赛成绩(70分〜99分),若甲、乙两组学生的平均成绩一样,则a=;甲、乙两组学生的成绩相对稳定的是 .考点平均数与方差的综合应用题点平均数和方差在决策中的意义答案5甲组解析由题意可知考点平均数与方差的综合应用题点平均数和方差在决策中的意义答案5甲组解析由题意可知75+88+89+98+90+a76+85+89+98+97.已知一组数据按从小到大的顺序排列,得到一1,0,4,%,7,14,中位数为5,则这组数据的平均数为,方差为.考点平均数与方差的综合应用题点求平均数与方差答案574解析V-1,0,4,1,7,14的中位数为5,4+%「.,=5,・・%=6.-1+0+4+6+7+14・•・这组数据的平均数是 6 =5,这组数据的方差悬x(36+25+1+1+4+81)=竿三、解答题13.现有某城市100户居民的月平均用电量(单位:度)的数据,根据这些数据,以160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图所示.⑴求直方图中%的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)内的用户中应抽取多少户?考点用样本的数字特征估计总体的数字特征的综合应用题点众数、平均数、中位数的综合应用解(1)由(0.002+0.0095+0.011+0.0125+%+0.005+0.0025)X20=1得%=0.0075,故直方图中%的值是0.0075.220+240(2)月平均用电量的众数为一2—二230.,;(0.002+0.0095+0.011)X20=0.45<0.5,・•・月平均用电量的中位数在[220,240)内,设中位数为a,由(0.002+0.0095+0.011)X20+0.0125X(a-220)=0.5,得a=224,即月平均用电量的中位数为224.⑶月平均用电量在[220,240)内的有0.0125x20x100=25(户)月平均用电量在[240,260)内的有0.0075x20x100=15(户),月平均用电量在[260,280)内的有0.005x20x100=10(户),月平均用电量在[280,300]内的有0.0025X20X100=5(户),抽取比例为——11——=1,25+15+10+55・••月平均用电量在[220,24

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论