北师大版高数必修三第3讲:用样本估计总体_第1页
北师大版高数必修三第3讲:用样本估计总体_第2页
北师大版高数必修三第3讲:用样本估计总体_第3页
北师大版高数必修三第3讲:用样本估计总体_第4页
北师大版高数必修三第3讲:用样本估计总体_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

用样本估计总体____________________________________________________________________________________________________________________________________________________________________1.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图,理解数形结合的数学思想和逻辑推理的数学方法.2.通过对样本分析和总体估计的过程,感受数学对实际生活的需要,通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地作出总体估计,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系.3.能利用频率分布直方图估计总体的众数、中位数、平均数;能用样本的众数、中位数、平均数估计总体的众数、中位数、平均数,并结合实际,对问题作出合理判断,制定解决问题的有效方法;初步体会、领悟“用数据说话”的统计思想方法;通过对有关数据的搜集、整理、分析、判断,培养学生“实事求是”的科学态度和严谨的工作作风.4.正确理解样本数据标准差的意义和作用,学会计算数据的标准差;能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;会用样本的基本数字特征估计总体的基本数字特征,形成对数据处理过程进行初步评价的意识.1.分析数据的方法(1)借助于图形.用图将各个数据画出来,作图可以达到两个目的,一是从数据中__________;二是利用图形__________.(2)借助于表格.用紧凑的表格改变数据的______方式,为我们提供_____数据的新方式.提取信息传递信息构成解释2.频率分布直方图(1)绘制步骤:①求______,即一组数据中的最大值与最小值的差.②决定______与______.组距与组数的确定没有具体的标准,一般来说,数据分组的组数与样本容量有关,样本容量越大,所分组数越____.当样本容量不超过100时,按照数据的多少,常分为5~12组.③将数据______.④列出__________表.⑤画出频率分布直方图.其中横轴表示_____,纵轴表示_____________的比.(2)意义:频率分布直方图中,每个小矩形的面积表示相应组的______,所有小矩形的面积的总和等于____.(3)频率分布的估计:频率分布是指各个小组数据在容量中所占______的大小,可以用______的频率分布估计总体的频率分布,频率分布表是反映样本的频率分布的表格.通过频率分布直方图和频率分布表可以看到样本的频率分布.极差组距组数多分组频率分布数据频率与组距频率1比例样本3.频率分布直方图的特征:直观、形象地反映了样本的分布规律;可以大致估计出总体的分布.但是从频率分布直方图中得不出原始的数据内容,把数据绘制成频率分布直方图后,原有的具体数据信息就被抹掉了.4.频率分布折线图和总体密度曲线(1)类似于频数分布折线图,连接频率分布直方图中各个小长方形上端的中点,就得到频率分布折线图.一般地,当总体中的个体数较多时,抽样时样本容量就不能太小.例如,如果要抽样调查一个省乃至全国的居民的月均用水量,那么样本容量就应比调查一个城市的时候大.可以想像,随着样本容量的增加.作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.频率分布折线图反映了数据的变化趋势.总体密度曲线反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.(2)估计方法:实际上,尽管有些总体密度曲线是客观存在的,但是在实际应用中我们并不知道它的具体表达形式,需要用______来估计.由于样本是随机的,不同的样本得到的频率分布折线图______;即使对于同一个样本,不同的分组情况得到的频率分布折线图也不同.频率分布折线图是随__________和分组情况的变化而变化的,因此不能用样本的___________________得到准确的总体密度曲线.样本不同样本容量频率分布折线图5.茎叶图(1)制作方法:将所有两位数的十位数字作为_____,个位数字作为___,茎相同者共用一个茎,茎按从_________的顺序从上向下列出,共茎的叶可以按从大到小(或从小到大)的顺序同行列出(也可以没有大小顺序).(2)优缺点:在样本数据_______时,用茎叶图表示数据的效果较好.它不但可以保留所有信息,而且可以随时______,这对数据的记录和表示都能带来方便.但是当样本数据______时,茎叶图就显得不太方便,因为每一个数据都要在图中占据一个空间,如果数据很多,枝叶就会很长.茎叶小到大较少记录较多6.茎叶图的特征:统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;茎叶图中的数据可以随时记录,随时添加,方便记录与表示.但是茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两位以上的数据虽然能够记录,但是没有表示两位数记录那么直观、清晰.7.规律总结[总结1]估计总体分布的步骤是:(1)选择适当的抽样方法从总体中抽取样本,即收集数据.(2)利用样本数据画出统计图或计算数字特征.(3)结合统计图分析样本取值的分布规律.(4)用样本取值的分布规律估计总体分布,由于是用科学抽样抽取的样本,那么样本与总体取值的分布规律近似,有时也可看成相同.(5)利用总体分布解决有关问题.[总结2]频率分布表、频率分布直方图、频率分布折线图和茎叶图的比较(1)四种图表的区别与联系名称区别频率分布表从数量上比较准确地反映样本的频率分布规律频率分布直方图反映样本的频率分布情况频率分布折线图直观地反映了数据的变化趋势总体密度曲线虽客观存在,但要准确画出难度较大,只能用样本频率分布估计.样本容量越大,估计越准确这四种图表都是描述样本数据分布情况,估计总体频率分布规律的,其联系如下:(2)四种图表的优缺比较优点缺点频率分布表表示数量较确切分析数据分布的总体态势不方便频率分布直方图表示数据分布情况非常直观原有的具体数据信息被抹掉了频率分布折线图能反映数据的变化趋势不能显示原有数据信息茎叶图一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况样本数据较多或数据位数较多时,不方便表示数据8.众数(1)定义:一组数据中出现次数______的数称为这组数据的众数.(2)特征:一组数据中的众数可能______一个,也可能没有,反映了该组数据的____________.[破疑点]众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使其无法客观地反映总体特征.最多不止集中趋势9.中位数(1)定义:一组数据按从小到大的顺序排成一列,处于______位置的数称为这组数据的中位数.(2)特征:一组数据中的中位数是______的,反映了该组数据的______________.在频率分布直方图中,中位数左边和右边的直方图的面积______.[破疑点]中位数不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点.中间唯一集中趋势相等10.平均数(1)定义:一组数据的和与这组数据的个数的商.数据x1,x2,…,xn的平均数为eq\x\to(x)n=_________________.(2)特征:平均数对数据有“取齐”的作用,代表该组数据的_____________.任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的______,但平均数受数据中_________的影响较大,使平均数在估计总体时可靠性降低.eq\f(x1+x2+…+xn,n)平均水平信息极端值11.标准差(1)定义:标准差是样本数据到平均数的一种平均距离,一般用s表示,通常用以下公式来计算s=__________________________.可以用计算器或计算机计算标准差.(2)特征:标准差描述一组数据围绕______波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差较大,数据的离散程度较______;标准差较小,数据的离散程度较______.eq\r(\f(1,n)[x1-\x\to(x)2+x2-\x\to(x)2+…+xn-\x\to(x)2])平均数大小12.方差(1)定义:标准差的平方,即s2=________________________________________.(2)特征:与____________的作用相同,描述一组数据围绕平均数波动程度的大小.(3)取值范围:___________.eq\f(1,n)[(x1-eq\x\to(x))2+(x2-eq\x\to(x))2+…+(xn-eq\x\to(x))2]标准差[0,+∞)数据组x1,x2,…,xn的平均数为eq\x\to(x),方差为s2,标准差为s,则数据组ax1+b,ax2+b,…,axn+b(a,b为常数)的平均数为aeq\x\to(x)+b,方差为a2s2,标准差为as.6.用样本估计总体现实中的总体所包含的个体数往往很多,总体的平均数、众数、中位数、标准差、方差是不知道的,因此,通常用样本的平均数、众数、中位数、标准差、方差来估计.这与用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.用样本的数字特征估计总体的数字特征分两类:用样本平均数估计总体平均数;用样本标准差估计总体标准差,样本容量越大,估计就越精确.类型一绘制频率分布直方图例1:抽查100袋洗衣粉,测量它们的净重如下(单位:g):494498493505496492485483508511495494483485511493505488501491493509509512484509510495497498504498483510503497502511497500493509510493491497515503515518510514509499493499509492505489494501509498502500508491509509499495493509496509505499486491492496499508485498496495496505499505496501510496487511501496(1)列出样本的频率分布表;(2)画频率分布直方图及频率分布折线图;(3)估计净重在~g之间的频率.[解析](1)在样本数据中,最大值是518,最小值是483,所以极差为35.取组距为4g,由于eq\f(35,4)=8eq\f(3,4),故要分成9组.使分点比数据多一位小数,且把第1组的起点稍微减小一点,得分组如下:[,,[,,[,,…,[,].列出频率分布表如下:分组频数累计频数频率[,8[,3[,正正正17[,正正正正21[,正正14[,正9[,正正正19[,正6[,]3合计100(2)频率分布直方图及频率分布折线图如下图:(3)净重在~g之间的频率为++=.练习1:为了解某中学高一年级男生的体重情况,抽取了同年级40名男生的体重,数据如下(单位:千克):62605959595858575757575656565656565655555555545454545353525252525251515150504948列出样本的频率分布表,绘出频率分布直方图,并估计体重在58千克以上的男生比例.[答案](1)计算极差:62-48=14.(2)决定组距与组数:取组距为2.又因为eq\f(极差,组距)=eq\f(14,2)=7,故共分成7组.(3)将数据分组:以组距为2将数据分组时,可以分成以下7组:[48,50),[50,52)、[52,54),[54,56),[56,58),[58,60),[60,62].(4)列出频率分布表如下:分组频数频率[48,50)2[50,52)5[52,54)7[54,56)8[56,58)11[58,60)5[60,62]2合计40(5)绘出频率分布直方图(如下图所示):从频率分布表中可看出,样本数据落在58以上的频率为+=,由此可估计,体重在58千克以上的男生比例约为练习2:在2014年第十六届亚运会中,各个国家和地区金牌获得情况的条形统计图,如图所示.第十六届亚运会各个国家和地区金牌获得情况统计图从图中可以看出中国是亚洲第一体育强国,中国所获得金牌数占全部金牌数的比例约是()A.% B.% C.% D.%[答案]D练习3:频率分布直方图中,各小矩形面积的和等于()A.0 \f(1,2) C.1 D.不确定[答案]C练习4:在画频率分布直方图时,某组的频数为10,样本容量为50,总体容量为600,则该组的频率是()\f(1,5) \f(1,6) \f(1,10) D.不确定[答案]A类型二茎叶图的画法及应用例2:某中学甲、乙两名同学最近几次的数学考试成绩情况如下:甲的得分:95,81,75,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.[解析][答案]甲、乙两人数学成绩的茎叶图如图所示.从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,大多集中在80~100之间,中位数是98分.甲同学的得分情况除一个特殊得分外,也大致对称,多集中在70~90之间,中位数是88分,但分数分布相对于乙来说,趋向于低分阶段.因此,乙同学发挥比较稳定,总体得分情况比甲同学好.练习2:在某电脑杂志的一篇文章中,每个句子的字数如下10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)画出两组数据的茎叶图;(2)比较分析两组数据,能得出什么结论?[答案](1)依题意,画出茎叶图如下图所示:(2)电脑杂志文章中每个句子的字数集中在10~30之间,中位数为,而报纸文章中每个句子的字数集中在20~40之间,中位数为.还可以看出,电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.这与电脑杂志作为科普读物需要简明、通俗易懂的要求相吻合.类型三茎叶图与频率分布直方图的综合应用例3:(2015·湖北武汉调研)某学校随机抽取20个班,调查各班中有网购经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是()[解析]借助已知茎叶图得出各小组的频数,再由频率=eq\f(频数,样本容量)求出各小组的频率,进一步求出eq\f(频率,组距)并得出答案.方法一:由题意知样本容量为20,组距为5.列表如下:分组频数频率eq\f(频率,组距)[0,5)1eq\f(1,20)[5,10)1eq\f(1,20)[10,15)4eq\f(1,5)[15,20)2eq\f(1,10)[20,25)4eq\f(1,5)[25,30)3eq\f(3,20)[30,35)3eq\f(3,20)[35,40]2eq\f(1,10)合计201观察各选择项的频率分布直方图知选A.方法二:由茎叶图知落在区间[0,5)与[5,10)上的频数相等,故频率、eq\f(频率,组距)也分别相等.比较四个选项知A正确,故选A.[答案]A练习1:某学校为调查高三年级学生的身高情况,按随机抽样的方法抽取80名学生,得到男生身高情况的频率分布直方图1和女生身高情况的频率分布直方图2.已知图1中身高在170cm~175cm的人数为16.问:在抽取的学生中,男、女生各有多少人?[答案]因为身高在170cm~175cm的男生的频率为×5=,设男生的总人数为n1,则=eq\f(16,n1),解得n1=40,即抽取的学生中,男生的人数为40,女生的人数为80-40=40.练习2:没有信息的损失,所有的原始数据都可以从图中得到的统计图是()A.总体密度曲线 B.茎叶图C.频率分布折线图 D.频率分布直方图[答案]B类型四中位数、众数、平均数的应用例4:据报道,某公司的33名职工的月工资(以元为单位)如下:职务董事长副董事长董事总经理经理管理员职员人数11215320工资5500500035003000250020001500(1)求该公司的职工月工资的平均数、中位数、众数;(2)假设副董事长的工资从5000元提升到20000元,董事长的工资从5500元提升到30000元,那么新的平均数、中位数、众数又是什么?(精确到1元)(3)你认为哪个统计量更能反映这个公司职工的工资水平?结合此问题谈一谈你的看法.[解析](1)平均数是eq\x\to(x)=1500+eq\f(4000+3500+2000×2+1500+1000×5+500×3+0×20,33)≈1500+591=2091(元).中位数是1500元,众数是1500元.(2)平均数是eq\x\to(x)′=1500+eq\f(28500+18500+2000×2+1500+1000×5+500×3+0×20,33)≈1500+1788=3288(元).中位数是1500元,众数是1500元.(3)在这个问题中,中位数或众数均能反映该公司职工的工资水平.因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数偏差较大,所以平均数不能反映这个公司职工的工资水平.练习1:某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):甲群13,13,14,15,15,15,15,16,17,17;乙群54,3,4,4,5,5,6,6,6,57.(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好反映甲群市民的年龄特征?(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好反映乙群市民的年龄特征?[答案](1)甲群市民年龄的平均数为eq\f(13+13+14+15+15+15+15+16+17+17,10)=15(岁),中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.(2)乙群市民年龄的平均数为eq\f(54+3+4+4+5+5+6+6+6+57,10)=15(岁),中位数为5岁,众数为6岁.由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.类型五标准差、方差的应用从甲、乙两种玉米的苗中各抽10株,分别测它们的株高如下:(单位:cm)甲:25414037221419392142乙:27164427441640401640问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?[解析]看哪种玉米的苗长得高,只要比较甲、乙两种玉米的苗的均高即可;要比较哪种玉米的苗长得齐,只要看两种玉米的苗高的方差即可,因为方差是体现一组数据波动大小的特征数.(1)eq\x\to(x)甲=eq\f(1,10)(25+41+40+37+22+14+19+39+21+42)=eq\f(1,10)×300=30(cm),eq\x\to(x)乙=eq\f(1,10)(27+16+44+27+44+16+40+40+16+40)=eq\f(1,10)×310=31(cm).所以eq\x\to(x)甲<eq\x\to(x)乙.(2)seq\o\al(2,甲)=eq\f(1,10)[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=eq\f(1,10)(25+121+100+49+64+256+121+81+81+144)=eq\f(1,10)×1042=(cm2),seq\o\al(2,乙)=eq\f(1,10)[(2×272+3×162+3×402+2×442)-10×312]=eq\f(1,10)×1288=(cm2).所以seq\o\al(2,甲)<seq\o\al(2,乙).[答案](1)乙种玉米的苗长得高,(2)甲种玉米的苗长得齐.练习1:甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表:甲的成绩环数78910频数5555乙的成绩环数78910频数6446丙的成绩环数78910频数4664s1,s2,s3分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有()A.s3>s1>s2 B.s2>s1>s3 C.s1>s2>s3 D.s2>s3>s1[答案]B练习2:(2015·天津高一检测)一次数学知识竞赛中,两组学生成绩如下表:分数5060708090100人数甲组251013146乙组441621212已经算得两个组的平均分都是80分,请根据你所学过的统计知识,进一步判断这两个组这次竞赛中成绩谁优谁次,并说明理由.[答案](1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数比较看,甲组成绩好些.(2)seq\o\al(2,甲)=eq\f(1,2+5+10+13+14+6)×[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=eq\f(1,50)×(2×900+5×400+10×100+13×0+14×100+6×400)=172.seq\o\al(2,乙)=eq\f(1,50)×(4×900+4×400+16×100+2×0+12×100+12×400)=256.因为seq\o\al(2,甲)<seq\o\al(2,乙),所以甲组成绩较乙组成绩稳定.(3)甲、乙两组成绩的中位数、平均数都是80分,其中甲组成绩在80分以上(含80分)的有33人,乙组成绩在80分以上(含80分)的有26人,从这一角度看,甲组成绩总体较好.(4)从成绩统计表看,甲组成绩大于或等于90分的人数为20人,乙组成绩大于或等于90分的人数为24人,所以乙组成绩在高分阶段的人数多,同时,乙组得满分的比甲组得满分的多6人,从这一角度看,乙组成绩较好.类型六频率分布直方图与数字特征的综合应用例6:(1)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差(2)某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.①求这次测试数学成绩的众数.②求这次测试数学成绩的中位数.③求这次测试数学成绩的平均分.[解析](1)eq\x\to(x)甲=eq\f(1,5)(4+5+6+7+8)=6,eq\x\to(x)乙=eq\f(1,5)(5×3+6+9)=6,甲的中位数是6,乙的中位数是5.甲的成绩的方差为eq\f(1,5)(22×2+12×2)=2,乙的成绩的方差为eq\f(1,5)(12×3+32×1)=.甲的极差是4,乙的极差是4.所以A,B,D错误,C正确.(2)①由图知众数为eq\f(70+80,2)=75.②由图知,设中位数为x,由于前三个矩形面积之和为,第四个矩形面积为,+>,因此中位数位于第四个矩形内,得=(x-70),所以x≈.③由图知这次数学成绩的平均分为:eq\f(40+50,2)××10+eq\f(50+60,2)××10+eq\f(60+70,2)××10+eq\f(70+80,2)××10+eq\f(80+90,2)××10+eq\f(90+100,2)××10=72.[答案](1)C(2)见解析练习1:(2015·山东淄博高三模拟)参加市数学调研抽测的某校高三学生成绩分布的茎叶图1和频率分布直方图2均受到不同程度的破坏,但可见部分信息如下,据此解答如下问题:求参加数学抽测的人数n,抽测成绩的中位数及分数分布在[80,90),[90,100]内的人数.[答案]分数在[50,60)内的频率为2,由频率分布直方图可以看出,分数在[90,100]内的同样有2人.由eq\f(2,n)=10×,得n=25.由茎叶图可知抽测成绩的中位数为73.∴分数在[80,90)之间的人数为25-(2+7+10+2)=4.参加数学竞赛人数n=25,中位数为73,分数在[80,90),[90,100]内的人数分别为4人,2人.1.在用样本的频率分布估计总体的频率分布的过程中,下列说法正确的是()A.总体的容量越大,估计越准确B.总体的容量越小,估计越准确C.样本的容量越大,估计越准确D.样本的容量越小,估计越准确[答案]C2.在频率分布表中,下列说法正确的是()A.起始点不同,不影响分组数B.分组数越多,就越能反映总体的情况C.各组频率之和一定是1D.不同起始点的频率分布表,各组频率一定不同[答案]C3.下列关于茎叶图的叙述正确的是()A.茎叶图可以展示未分组的原始数据,它与频率分布表以及频率分布直方图的处理方式不同B.对于重复的数据,只算一个C.茎叶图中的叶是“茎”十进制的上一级单位D.制作茎叶图的程序是:第1步画出茎;第2步画出叶;第3步将“叶子”任意排列[答案]A4.(2014·高考山东卷)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组,下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6 B.8 C.12 D.18[答案]C5.甲、乙两中学生在一年里学科平均分相等,但他们的方差不相等,正确评价他们的学习情况是()A.因为他们平均分相等,所以学习水平一样B.成绩平均分虽然一样,方差较大的,说明潜力大,学习态度端正C.表面上看这两个学生平均成绩一样,但方差小的成绩稳定D.平均分相等,方差不等,说明学习不一样,方差较小的同学,学习成绩不稳定,忽高忽低[答案]C6.在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88,若样本B数据恰好是样本A都加上2后所得数据,则A、B两样本的下列数字特征对应相同的是()A.众数 B.平均数C.中位数 D.标准差[答案]D7.如图,是某篮球运动员在一个赛季的30场比赛中得分的茎叶图,则得分的中位数与众数分别为()A.3与3 B.23与3C.3与23 D.23与23[答案]D8.(2015·沈阳铁路实验中学期末考试)已知样本9,10,11,x,y的平均数是10,方差是2,则xy=()A.98 B.88C.76 D.96[答案]D9.某篮球运动员在2014赛季各场比赛得分情况如下:12,15,24,25,31,31,36,36,37,39,44,49,50.制作茎叶图,并分析这个运动员的整体水平及发挥的稳定程度.[解析]该运动员得分茎叶图如下:从这张图中可以粗略地看出,该运动员得分大多能在20分到40分之间,且分布较为对称,集中程度高,说明其发挥比较稳定.10.从某校参加数学竞赛的试卷中抽取一个样本,考查竞赛的成绩分布,将样本分成6组,得到频率分布直方图如图,从左到右各小组的小长方形的高的比为113642,最右边的一组的频数是8.请结合直方图的信息,解答下列问题:(1)样本容量是多少?(2)成绩落在哪个范围的人数最多?并求出该小组的频数和频率.(3)估计这次数学竞赛成绩的众数、中位数和平均数.[解析](1)从左到右各小组的频率分别为eq\f(1,17),eq\f(1,17),eq\f(3,17),eq\f(6,17),eq\f(4,17),eq\f(2,17),样本容量为eq\f(8,\f(2,17))=68.(2)成绩落在70~80之间的人数最多;频率为eq\f(6,17);频数为68×eq\f(6,17)=24.(3)众数的估计值是75,中位数的估计值是70+eq\f(\f(1,2)-\f(1,17)-\f(1,17)-\f(3,17),\f(6,17))×10=eq\f(455,6)≈.平均数的估计值是eq\f(1,17)×45+eq\f(1,17)×55+eq\f(3,17)×65+eq\f(6,17)×75+eq\f(4,17)×85+eq\f(2,17)×95=75.__________________________________________________________________________________________________________________________________________________________________基础巩固(1)基础巩固一、选择题1.下列关于频率分布直方图的说法正确的是()A.直方图的高表示取某数的频率B.直方图的高表示该组上的个体在样本中出现的频率C.直方图的高表示取某组上的个体在样本中出现的频数与组距的比值D.直方图的高表示取该组上的个体在样本中出现的频率与组距的比值[答案]D[解析]要注意频率直方图的特点.在直方图中,纵轴(矩形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积.[点评]注意区别直方图与条形图.2.下列说法正确的是()A.对于样本数据增加时,频率分布表不能增加变化B.对于样本数据增加时,茎叶图不能增加变化C.对于样本数据增加时,频率折线图不会跟着变化D.对于样本数据增加时,频率分布直方图变化不太大[答案]D3.一个容量为80的样本中数据的最大值是140,最小值是51,组距是10,则应将样本数据分为()A.10组 B.9组C.8组 D.7组[答案]B[解析]根据列频率分布表的步骤,eq\f(极差,组距)=eq\f(140-51,10)=.所以分为9组较为恰当.4.(2013·福建卷)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测度成绩不低于60分的学生人数为()A.588 B.480C.450 D.120[答案]B[解析]本题考查频率分布直方图及频数的求法.成绩在[40,60)的频率P1=+×10=,则成绩不少于60分的频率P2=1-=,所以可估计成绩不少于60分的学生人数为600×=480,故选B.5.(2013·重庆高考)如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为()A. B.C. D.[答案]B[解析]利用频率及茎叶图的知识直接运算求解.由题意知,这10个数据落在区间[22,30)内的有22、22、27、29,共4个,所以其频率为eq\f(4,10)=,故选B.6.(2015·河北省唐山一中月考)某校100名学生的数学测试成绩的频率分布直方图如图所示,分数不低于a即为优秀,如果优秀的人数为20,则a的估计值是()A.130 B.140C.133 D.137[答案]C[解析]本题考查频率分布直方图.由已知可以判断a∈(130,140),所以[(140-a)×+×10]×100=20,解得a≈133,故选C.二、填空题7.今年5月海淀区教育网开通了网上教学,某校高一年级(8)班班主任为了了解学生上网学习时间,对本班40名学生某天上网学习时间进行了调查,将数据(取整数)整理后,绘制出如图所示频率分布直方图,已知从左到右各个小组的频率分别是,,,,,则根据直方图所提供的信息,这一天上网学习时间在100~119分钟之间的学生人数是________人,如果只用这40名学生这一天上网学习时间作为样本去推断该校高一年级全体学生该天的上网学习时间,这样推断是否合理?________(填“合理”或“不合理”)[答案]14不合理[解析]由频数=样本容量×频率=40×=14(人)因为该样本的选取只在高一(8)班,不具有代表性,所以这样推断不合理.8.青年歌手大奖赛共有10名选手参赛,并请了7名评委.如图所示的茎叶图是7名评委给参加最后决赛的两位选手甲、乙评定的成绩,去掉一个最高分和一个最低分后,甲、乙选手剩余数据的平均成绩分别为________、________.[答案]分85分[解析]甲的成绩去掉一个最高分92分和一个最低分75分后,甲的剩余数据的平均成绩为分;乙的成绩去掉一个最高分93分和一个最低分79分后,乙的剩余数据的平均成绩为85分.三、解答题9.有关部门从甲、乙两个城市所有的自动售货机中随机抽取了16台,记录了上午800~1100之间各自的销售情况(单位:元)甲:18,8,10,43,5,30,10,22,6,27,25,58,14,18,30,41;乙:22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23.试用两种不同的方式分别表示上面的数据,并简要说明各自的优点.[解析]方法一:从题目中的数不易直接看出各自的分布情况,为此,我们将以上数据用条形统计图表示.如图:方法二:茎叶图如图,两竖线中间的数字表示甲、乙销售额的十位数,两边的数字表示甲、乙销售额的个位数.从方法一可以看出条形统计图能直观地反映数据分布的大致情况,并且能够清晰地表示出各个区间的具体数目;从方法二可以看出,用茎叶图表示有关数据,对数据的记录和表示都带来方便.10.(2015·合肥高二检测)为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午800~1000间各自的点击量,得如图所示的茎叶图,根据茎叶图回答下列问题.(1)甲、乙两个网站点击量的极差分别是多少?(2)甲网站点击量在[10,40]间的频率是多少?(3)甲、乙两网站哪个更受欢迎?并说明理由.[解析](1)甲网站的极差为:73-8=65,乙网站的极差为:71-5=66.(2)eq\f(4,14)=eq\f(2,7)≈.(3)甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的分布情况来看,甲网站更受欢迎.基础巩固(2)一、选择题1.对于数据3,3,2,3,6,3,10,3,6,3,2.①这组数据的众数是3;②这组数据的众数与中位数的数值都不相等;③这组数据的中位数与平均数的数值相等;④这组数据的平均数与众数的值相等.其中正确的结论的个数()A.1 B.2C.3 D.4[答案]A[解析]在这11个数据中,数据3出现了6次,概率最高,故众数是3;将这11个数据按从小到大排列得2,2,3,3,3,3,3,3,6,6,10,中间数据是3,故中位数是3;而平均数eq\x\to(x)=eq\f(2×2+3×6+6×2+10,11)=4.2.(2015·安徽卷)若样本数据x1,x2,……,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为()A.8 B.15C.16 D.32[答案]C[解析]样本数据x1,x2,……,x10,其标准差eq\r(Dx)=8,则Dx=64,而样本数据2x1-1,2x2-1,……,2x10-1的方差D(2x-1)=22Dx=22×64,其标准差为eq\r(22×64)=16.故选C.3.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如下图所示,假设得分值的中位数为me,众数为mO,平均值为eq\x\to(x),则()A.me=mO=eq\x\to(x) B.me=mO<eq\x\to(x)C.me<mO<eq\x\to(x) D.mO<me<eq\x\to(x)[答案]D[解析]由图可知,30名学生的得分情况依次为:2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分.中位数为第15,16个数(分别为5,6)的平均数,即me=,5出现次数最多,故mO=5,eq\x\to(x)=eq\f(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10,30)=.于是mO<me<eq\x\to(x).故选D.4.为了稳定市场,确保农民增收,某农产品7个月份的每月市场收购价格与其前三个月的市场收购价格有关,并使其与前三个月的市场收购价格之差的平方和最小,下表列出的是该产品今年前6个月的市场收购价格:月份123456价格(元/担)687867717270则前7个月该产品的市场收购价格的方差为()\f(75,7) \f(76,7)C.11 \f(78,7)[答案]B[解析]设7月份的市场收购价格为x,则y=(x-71)2+(x-72)2+(x-70)2=3x2-426x+15125,则当x=71时,7月份的市场收购价格与前三个月的市场收购价格之差的平方和最小,则7月份的市场收购价格为71.则计算得前7个月该产品的市场收购价格的平均数是71,方差是eq\f(76,7).5.(2013·安徽)某班级有50名学生,其中有30名男生和20名女生.随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是()A.这种抽样方法是一种分层抽样B.这种抽样方法是一种系统抽样C.这五名男生成绩的方差大于这五名女生成绩的方差D.该班男生成绩的平均数小于该班女生成绩的平均数[答案]C[分析]根据抽样方法的概念可判断选项A,B;分别把数据代入方差和平均数的公式可判断选项C,D.[解析]若抽样方法是分层抽样,男生、女生应分别抽取6人、4人,所以A错;由题目看不出是系统抽样,所以B错;这五名男生成绩的平均数eq\x\to(x)1=eq\f(86+94+88+92+90,5)=90,这五名女生成绩的平均数eq\x\to(x)2=eq\f(88+93+93+88+93,5)=91,故这五名男生成绩的方差为eq\f(1,5)[(86-90)2+(94-90)2+(88-90)2+(92-90)2+(90-90)2]=8,这五名女生成绩的方差为eq\f(1,5)[(88-91)2×2+(93-91)2×3]=6,所以这五名男生成绩的方差大于这五名女生成绩的方差,但该班男生成绩的平均数不一定小于女生成绩的平均数,所以D错.6.(2015·山东临沂高一月考)某市要对两千多名出租车司机的年龄进行调查,现从中随机抽出100名司机,已知抽到的司机年龄都在[20,45)岁之间,根据调查结果得出司机的年龄情况残缺的频率分布直方图如图所示,利用这个残缺的频率分布直方图估计该市出租车司机年龄的中位数大约是()A.31,6岁 B.岁C.岁 D.岁[答案]C[解析]根据所给的信息可知,在区间[25,30)上的数据的频率为1-+++×5=.故中位数在第3组,且中位数的估计为30+(35-30)×eq\f(5,3)=(岁).二、填空题7.由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)[答案]1,1,3,3[解析]不妨设x1≤x2≤x3≤x4,得:x2+x3=4,x1+x2+x3+x4=8⇒x1+x4=4,s2=1⇔(x1-2)2+(x2-2)2+(x3-2)2+(x4-2)2=4⇒①如果有一个数为0或4;则其余数为2,不合题意;②只能取|x1-2|=1;得:这组数据为1,1,3,3.8.阶段考试以后,班长算出了全班40个人数学成绩的平均分为M,如果把M当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均分为N,那么MN为________.[答案]1[解析]M=eq\f(x1+x2+…+x40,40),N=eq\f(x1+x2+…+x40+M,41)=eq\f(40M+M,41)=M,故MN=1.三、解答题9.(2013·新课标全国卷Ⅰ)为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.63.52.3服用B药的20位患者日平均增加的睡眠时间:3.21.42.7(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据绘制茎叶图,从茎叶图看,哪种药的疗效更好?[解析](1)设A药观测数据的平均数为eq\x\to(x),B药观测数据的平均数为eq\x\to(y).由观测结果可得eq\x\to(x)=eq\f(1,20)×+++++++++++++++++++=,eq\x\to(y)=eq\f(1,20)×+++++++++++++++++++=.由以上计算结果可得eq\x\to(x)>eq\x\to(y),因此可看出A药的疗效更好.(2)由观测结果可绘制如下茎叶图:从以上茎叶图可以看出,A药疗效的试验结果有eq\f(7,10)的叶集中在茎2,3上,而B药疗效的试验结果有eq\f(7,10)的叶集中在茎0,1上,由此可看出A药的疗效更好.[名师点睛]从平均数上分析,甲、乙中平均数大的效果较好;从茎叶图上分析,要看甲、乙的叶在哪些茎上分布的比率大.如果甲的叶在某茎上分布的比率大,且该茎所对应的数据较大,那么甲的效果就较好.10.某学校高一(1)班和高一(2)班各有49名学生,两班在一次数学测验中的成绩统计如下:班级平均分众数中位数标准差(1)班797087(2)班797079(1)请你对下面的一段话给予简要分析:高一(1)班的小刚回家对妈妈说:“昨天的数学测验,全班平均分为79分,得70分的人最多,我得了85分,在班里算上上游了!”(2)请你根据表中的数据,对这两个班的数学测验情况进行简要分析,并提出建议.[分析](1)根据平均数、中位数、众数所反映的情况来分析;(2)结合方差的意义来提出建议.[解析](1)由于(1)班49名学生数学测验成绩的中位数是87,则85分排在全班第25名之后,所以从位次上看,不能说85分是上游,成绩应该属于中游.但也不能以位次来判断学习的好坏,小刚得了85分,说明他对这段的学习内容掌握得较好,从掌握学习的内容上讲,也可以说属于上游.(2)①班成绩的中位数是87分,说明高于87分(含87)的人数占一半以上,而平均分为79分,标准差又很大,说明低分也多,两极分化严重,建议加强对学习困难的学生的帮助.②班的中位数和平均数都是79分,标准差又小,说明学生之间差别较小,学习很差的学生少,但学习优异的也很少,建议采取措施提高优秀率.能力提升(1)一、选择题1.一个样本的容量为72,分成5组,已知第一、五组的频数都为8,第二、四组的频率都为eq\f(2,9),则第三组的频数为()A.16 B.20C.24 D.36[答案]C[解析]因为频率=eq\f(频数,样本容量),所以第二、四组的频数都为72×eq\f(2,9)=16.所以第三组的频数为72-2×8-2×16=24.2.某工厂对一批产品进行了抽样检测,下图是根据抽样检测后的产品净重数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100g的个数是36,则样本中净重大于或等于98g并且小于104g的产品的个数是A.90 B.75C.60 D.45[答案]A[解析]由频率分布直方图可知,产品净重小于100g的频率是×2十×2=,所以样本中产品的个数为eq\f(36,=120.产品净重大于或等于104g的频率为×2=.所以产品净重大于或等丁98g而小于104g的频率为1--=.则净重在此范围内的产品个数为120×=3.为了解电视对生活的影响,一个社会调查机构就平均每天看电视的时间对某地居民调查了10000人,并根据所得数据画出样本的频率分布直方图(如图),为了分析该地居民平均每天看电视的时间与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人做进一步调查.则在[,3]h时间段内应抽出的人数是()A.25 B.30C.50 D.75[答案]A[解析]抽出的100人中平均每天看电视的时间在[,3](h)时间内的频率是×=,所以这10000人中平均每天看电视的时间在[,3](11)时间内的人数是10000×=2500,抽样比是eq\f(100,10000)=eq\f(1,10),则在[,3](h)时间内应抽出的人数是2500×eq\f(1,100)=25.4.下图是根据《山东统计年鉴2009》中的资料作成的1999年至2008年山东省城镇居民百户家庭人口数的茎叶图,图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字,从图中可以得到1999年至2008年山东省城镇居民百户家庭人口数的平均数为()A. B.C. D.[答案]B[解析]自1999年至2008年百户家庭人口数分别为291,291,295,298,302,306,310,312,314,317,则平均数为eq\f(1,10)(291+291+295+298+302+306+310+312+314+317)=.二、填空题5.某校开展“爱我海西,爱我家乡”摄影比赛,9位评委给参赛作品A打出的分数如茎叶图所示,记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现一个数字(茎叶图中的x)无法看清.若记分员计算无误,则数字x应该是________.[答案]1[解析]若x≤4,则由平均分为91知总分应为91×7=637.故637=89+89+92+93+92+91+90+x,得x=1;若x>4,637≠89+89+92+93+92+91+94=640不合题意.6.图1是某工厂2010年9月份10个车间产量统计条形图,条形图从左到右表示各车间的产量依次记为A1,A2,…,A10(如A3表示3号车间的产量为950件).图2是统计图1中产量在一定范围内车间个数的一个算法流程图.那么运行该算法流程后输出的结果是________.[答案]4[解析]通过算法流程图可知,它的功能是统计产量超过950件的车间数,所以通过条形统计图可知产量超过950件的车间数为4个,所以最后输出的结果是4.三、解答题7.某市2010年4月1日~461,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45,(1)完成频率分布表;(2)作出频率分布直方图;(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.[解析](1)频率分布表:分组频数频率[41,51)2eq\f(2,30)[51,61)1eq\f(1,30)[61,71)4eq\f(4,30)[71,81)6eq\f(6,30)[81,91)10eq\f(10,30)[91,101)5eq\f(5,30)[101,111)2eq\f(2,30)(2)频率分布直方图,如图所示.(3)答对下述两条中的一条即可:①该市一个月中空气污染指数有2天处于优的水平,占当月天数的eq\f(1,15),有26天处于良的水平,占当月天数的eq\f(13,15),处于优或良的天数共有28天,占当月天数的eq\f(14,15).说明该市空气质量基本良好.②轻微污染有2天,占当月天数的eq\f(1,15).污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的eq\f(17,30),超过50%,说明该市空气质量有待进一步改善.8.某电视台为宣传本省,随机对本省内15~65岁的人群抽取了n人,回答问题“本省内著名旅游景点有哪些”统计结果如图表所示.组号分组回答正确的人数回答正确的人数占本组的频率第1组[15,25)a第2组[25,35)18x第3组[35,45)b第4组[45,55)9第5组[55,65]3y(1)分别求出a、b、x、y的值;(2)从第2、3、4组回答正确的人中用分层抽样的方法抽取6人,求第2、3、4组每组各抽取多少人?[解析](1)由频率表中第4组数据可知,第4组总人数为eq\f(9,=25,再结合频率分布直方图可知n=eq\f(25,×10)=100,∴a=100××10×=5,b=100××10×=27,x=eq\f(18,20)=,y=eq\f(3,15)=.(2)第2、3、4组回答正确的共有54人.∴利用分层抽样在54人中抽取6人,每组分别抽取的人数为:第2组:eq\f(18,54)×6=2(人);第3组:eq\f(27,54)×6=3(人);第4组:eq\f(9,54)×6=1(人).能力提升(2)一、选择题1.某校高一、高二年级各有7个班参加歌咏比赛,他们的得分的茎叶图如图所示,对这组数据分析正确的是()A.高一的中位数大,高二的平均数大B.高一的平均数大,高二的中位数大C.高一的平均数、中位数都大D.高二的平均数、中位数都大[答案]A[解析]由茎叶图可以看出,高一的中位数为93,高二的中位数为89,所以高一的中位数大.由计算得,高一的平均数为91,高二的平均数为92eq\f(3,7),所以高二的平均数大.2.(2013·重庆)如图所示的茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)已知甲组数据的中位数为15,乙组数据的平均数为,则x,y的值分别为()A.2,5 B.5,5C.5,8 D.8,8[答案]C[分析]观察茎叶图,由中位数的概念可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论