高中数学人教B版第二章统计单元测试 2023版第2章章末分层突破_第1页
高中数学人教B版第二章统计单元测试 2023版第2章章末分层突破_第2页
高中数学人教B版第二章统计单元测试 2023版第2章章末分层突破_第3页
高中数学人教B版第二章统计单元测试 2023版第2章章末分层突破_第4页
高中数学人教B版第二章统计单元测试 2023版第2章章末分层突破_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

章末分层突破[自我校对]①随机数法②系统抽样③分层抽样④频率分布直方图⑤茎叶图⑥方差与标准差⑦散点图⑧回归方程抽样方法及应用随机抽样有简单随机抽样、系统抽样和分层抽样三种.其共同点是在抽样过程中每个个体被抽到的机会相等,当总体中的个体数较少时,常采用简单随机抽样;当总体中的个体数较多时,多采用系统抽样;当已知总体由差异明显的几部分组成时,常采用分层抽样.其中简单随机抽样是最简单、最基本的抽样方法.在进行系统抽样和分层抽样时都要用到简单随机抽样.应用各种抽样方法抽样时要注意以下问题:(1)利用抽签法时要注意把号签放在不透明的容器中且搅拌均匀;(2)利用随机数表法时注意编号位数要一致;(3)利用系统抽样时,若抽样间隔k=eq\f(N,n)不是整数,应剔除部分个体;(4)在分层抽样中,若在某一层抽到的个体数不是整数,应在该层剔除部分个体,使抽取个体数为整数.某高级中学有学生270人,其中一年级108人,二、三年级各81人.现要从所有学生中随机抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250;②5,9,100,107,111,121,180,195,200,265;③11,38,65,92,119,146,173,200,227,254;④30,57,84,111,138,165,192,219,246,270.关于上述样本的下列结论中,正确的是()A.②③都不能为系统抽样B.②④都不能为分层抽样C.①④都可能为系统抽样D.①③都可能为分层抽样【精彩点拨】分层抽样时,在各层所抽取的样本个数与该层个体数的比值等于抽样比;系统抽样抽取的号码按从小到大排列后,每一个号码与前一个号码的差都等于分段间隔.【规范解答】按分层抽样时,在一年级抽取108×eq\f(10,270)=4(人),在二年级、三年级各抽取81×eq\f(10,270)=3(人),则在号码段1,2,…,108中抽取4个号码,在号码段109,110,…,189中抽取3个号码,在号码段190,191,…,270中抽取3个号码,①②③符合,所以①②③可能是分层抽样,④不符合,所以④不可能是分层抽样;如果按系统抽样时,抽取出的号码应该是“等距”的,①③符合,②④不符合,所以①③都可能为系统抽样,②④都不能为系统抽样.【答案】D[再练一题]1.①教育局督学组到校检查工作,临时需在每班各抽调两人参加座谈;②某班数学期中考试有15人在120分以上,40人在90~119分,1人不及格,现从中抽出8人研讨进一步改进教与学;③某班春节聚会,要产生两位“幸运者”.就这三件事,合适的抽样方法分别为()A.分层抽样,分层抽样,简单随机抽样B.系统抽样,系统抽样,简单随机抽样C.分层抽样,简单随机抽样,简单随机抽样D.系统抽样,分层抽样,简单随机抽样【尝试解答】①每班各抽两人需用系统抽样.②由于学生分成了差异比较大的几层,应用分层抽样.③由于总体与样本容量较小,应用简单随机抽样.故选D.【答案】D用样本的频率分布估计总体分布利用样本的频率分布表和频率分布直方图对总体情况作出估计,有时也利用频率分布折线图和茎叶图对总体情况作出估计.直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式,这样根据样本的频率分布,我们可以大致估计出总体的分布.但是,当总体的个体数较多时,所需抽样的样本容量也不能太小,随着样本容量的增加,频率分布折线图会越来越接近于一条光滑曲线,统计中称这条曲线为总体密度曲线,它能给我们提供更加精细的信息.在样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留原始信息,而且可以随时记录,这给数据的记录和表示都能带来方便.如下表所示给出了某校500名12岁男孩中用随机抽样得出的120人的身高资料.(单位:cm)区间界限[122,126)[126,130)[130,134)[134,138)[138,142)人数58102233区间界限[142,146)[146,150)[150,154)[154,158]人数201165(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计身高低于134cm的人数占总人数的百分比.【精彩点拨】(1)根据频数计算出频率.分“分组”、“频数”、“频率”三列,列出频率分布表.(2)根据频率分布表画出频率分布直方图.(3)根据频率分布表计算出身高低于134cm的频率.【规范解答】(1)样本的频率分布表:分组频数频率[122,126)5[126,130)8[130,134)10[134,138)22[138,142)33[142,146)20[146,150)11[150,154)6[154,158]5合计120(2)画出频率分布直方图,如下图所示:(3)因为样本中身高低于134cm的人数的频率为eq\f(5+8+10,120)=eq\f(23,120)≈,所以估计身高低于134cm的人数约占总人数的19%.[再练一题]2.为了了解某校高一学生的视力情况,随机地抽查了该校100名高一学生的视力情况,得到频率分布直方图如图2­1,由于不慎将部分数据丢失,但知道后5组频数和为62,视力在到之间的学生数为a,最大频率为,则a的值为()图2­1【解析】[,之间频率为,[,之间频率为1---=1-=.∴a=+×100=54.【答案】B用样本的数字特征估计总体的数字特征样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括平均数、众数、中位数;另一类是反映样本数据的波动大小,包括样本方差及标准差.通常,在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度,在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,数据越集中,质量越稳定.甲、乙两人数学成绩的茎叶图如图2­2所示:图2­2(1)求出这两名同学的数学成绩的平均数、标准差;(2)比较两名同学的成绩,谈谈你的看法.【精彩点拨】(1)利用茎叶图中的数据计算平均数、标准差.(2)从平均数和方差两方面比较两人的成绩.【规范解答】eq\x\to(x)甲=eq\f(1,10)(65+70+80+86+89+95+91+94+107+113)=89.seq\o\al(2,甲)=eq\f(1,10)[(65-89)2+(70-89)2+(80-89)2+(86-89)2+(89-89)2+(95-89)2+(91-89)2+(94-89)2+(107-89)2+(113-89)2]=,∴s甲≈.eq\x\to(x)乙=eq\f(1,10)(79+86+83+88+93+99+98+98+102+114)=94.seq\o\al(2,乙)=eq\f(1,10)[(79-94)2+(86-94)2+(83-94)2+(88-94)2+(93-94)2+(99-94)2+(98-94)2+(98-94)2+(102-94)2+(114-94)2]=.∴s乙≈.∴eq\x\to(x)甲<eq\x\to(x)乙且s甲>s乙.∴乙同学的平均成绩较高且标准差较小;说明乙同学比甲同学的成绩扎实,稳定.[再练一题]3.对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:甲6080709070乙8060708075问:甲、乙谁的平均成绩好?谁的各门功课发展较平衡?【解】甲的平均成绩为eq\x\to(x)甲=74,乙的平均成绩为eq\x\to(x)乙=73.所以甲的平均成绩好.甲的方差是seq\o\al(2,甲)=eq\f(1,5)(142+62+42+162+42)=104,乙的方差是seq\o\al(2,乙)=eq\f(1,5)×(72+132+32+72+22)=56.因为seq\o\al(2,甲)>seq\o\al(2,乙),所以乙的各门功课发展较平衡.回归直线的方程分析两个变量的相关关系时,可根据样本数据散点图确定两个变量之间是否存在相关关系,还可利用最小二乘法求出回归方程.从散点图上,我们可以分析出两个变量是否存在相关关系.如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系,这条直线叫做回归直线,直线的方程叫做回归方程.求回归方程的步骤:(1)先把数据制成表,从表中计算出eq\i\su(i=1,n,x)i,eq\i\su(i=1,n,y)i,eq\i\su(i=1,n,x)eq\o\al(2,i),eq\i\su(i=1,n,x)iyi;(2)计算回归系数eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^));(3)写出回归方程eq\o(y,\s\up6(^))=bx+a.下表数据是退水温度x(℃)对黄酮延长性y(%)效应的试验结果,y是以延长性计算的,且对于给定的x,y为正态变量,其方差与x无关.x(℃)300400500600700800y(%)405055606770(1)画出散点图;(2)指出x,y是否线性相关;(3)若线性相关,求y关于x的回归方程;(4)估计退水温度是1000℃时,黄酮延长性的情况.【精彩点拨】先画出散点图,确定y与x之间是否线性相关,再根据求回归直线方程的步骤求出回归直线方程,最后根据回归方程确定黄酮延长性的情况.【规范解答】(1)散点图如图:(2)由散点图可以看出样本点分布在一条直线的附近,可见y与x线性相关.(3)列出下表并用科学计算器进行有关计算.i123456xi300400500600700800yi405055606770xiyi120002000027500360004690056000xeq\o\al(2,i)90000160000250000360000490000640000eq\x\to(x)=550,eq\x\to(y)=57,eq\o(∑,\s\up16(6),\s\do7(i=1))xeq\o\al(2,i)=1990000,eq\o(∑,\s\up16(6),\s\do7(i=1))xiyi=198400于是可得eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up16(6),\s\do7(i=1))xiyi-6\o(\x\to(x))\o(\x\to(y)),\o(∑,\s\up16(6),\s\do7(i=1))x\o\al(2,i)-6\x\to(x)2)=eq\f(198400-6×550×57,1990000-6×5502)≈86,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\o(\x\to(x))=57-86×550=.因此所求的回归直线的方程为:eq\o(y,\s\up6(^))=86x+.(4)将x=1000代入回归方程得eq\o(y,\s\up6(^))=86×1000+=,即退水温度是1000℃时,黄酮延长性大约是%.[再练一题]4.有人收集了2023年春节期间平均气温x与某取暖商品销售额y的有关数据如下表:平均气温(℃)-2-3-5-6销售额(万元)20232730根据以上数据,用线性回归的方法,求得销售额y与平均气温x之间的线性回归方程eq\o(y,\s\up6(^))=bx+a的系数eq\o(b,\s\up6(^))=-,则预测平均气温为-8℃时该商品的销售额为()万元 万元万元 万元【解析】eq\x\to(x)=eq\f(-2+-3+-5+-6,4)=-4,eq\x\to(y)=eq\f(20+23+27+30,4)=25,所以25=(-×(-4)+a.所以eq\o(a,\s\up6(^))=.所以回归直线方程为eq\o(y,\s\up6(^))=-+.当x=-8时,y=,即预测平均气温为-8℃时,该商品的销售额为万元.故选A.【答案】A数形结合思想数形结合思想在本章中的重要应用是通过频率分布的态势对总体进行估计及根据散点图确定两个变量是否具有相关关系,并做出判断.统计图表(频率分布直方图、茎叶图)与数字特征(平均数、中位数、方差)是高考的重点和热点内容,几乎每年必考,通常以茎叶图和频率分布直方图为载体,考查平均数、中位数、方差等的计算,高考对变量间的相关性的考查呈逐年上升的趋势,主要考查借助散点图直观地分析两个变量间的相关关系,知道回归直线经过样本中心,会求回归方程,并能利用方程对有关变量作出估计.为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午8:00~10:00间各自的点击量,得如图2­3所示的茎叶图,根据茎叶图求:图2­3(1)甲、乙两个网站点击量的极差分别是多少?(2)甲网站点击量在[10,40]间的频率是多少?(3)观察茎叶图,估计甲、乙两个网站哪个更受欢迎,并说明理由.【导学号:00732067】【精彩点拨】茎叶图的比较可以观察茎叶图中反映的信息,通过极差可以粗略判断分散集中程度.【规范解答】(1)根据茎叶图,得甲网站的点击量的最大值是73,最小值是8,乙网站的点击量的最大值是71,最小值是5,则甲网站的极差为73-8=65,乙网站的极差为71-5=66.(2)观察茎叶图,得甲网站点击量在[10,40]间的有20,24,25,38,共4个,所以甲网站点击量在[10,40]间的频率为eq\f(4,14)=eq\f(2,7).(3)观察茎叶图,得甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的分布情况来看,甲网站更受欢迎.[再练一题]5.从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图2­4所示).设甲、乙两组数据的平均数分别为eq\x\to(x)甲、eq\x\to(x)乙,中位数分别为m甲、m乙,则下列关系中正确的是________(填序号).图2­4①eq\x\to(x)甲<eq\x\to(x)乙,m甲>m乙; ②eq\x\to(x)甲<eq\x\to(x)乙,m甲<m乙;③eq\x\to(x)甲>eq\x\to(x)乙,m甲>m乙; ④eq\x\to(x)甲>eq\x\to(x)乙,m甲<m乙.【解析】由茎叶图m甲=eq\f(22+18,2)=20,m乙=eq\f(27+31,2)=29.∴m甲<m乙.eq\x\to(x)甲=eq\f(1,16)(41+43+30+30+38+22+25+27+10+10+14+18+18+5+6+8)=eq\f(345,16),eq\x\to(x)乙=eq\f(1,16)(42+43+48+31+32+34+34+38+20+22+23+23+27+10+12+18)=eq\f(457,16).∴eq\x\to(x)甲<eq\x\to(x)乙.【答案】②1.根据下面给出的2023年至2023年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()图2­5A.逐年比较,2023年减少二氧化硫排放量的效果最显著年我国治理二氧化硫排放显现成效年以来我国二氧化硫年排放量呈减少趋势年以来我国二氧化硫年排放量与年份正相关【解析】对于A选项,由图知从2023年到2023年二氧化硫排放量下降得最多,故A正确.对于B选项,由图知,由2023年到2023年矩形高度明显下降,因此B正确.对于C选项,由图知从2023年以后除2023年稍有上升外,其余年份都是逐年下降的,所以C正确.由图知2023年以来我国二氧化硫年排放量与年份负相关,故选D.【答案】D2.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图2­6所示的频率分布直方图,其中自习时间的范围是[,30],样本数据分组为[,20),[20,,[,25),[25,,[,30].根据直方图,这200名学生中每周的自习时间不少于小时的人数是()图2­6【解析】由直方图可知每周自习时间不少于小时的频率为++×=,则每周自习时间不少于小时的人数为×200=140.故选D.【答案】D3.某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.【导学号:00732068】A地区用户满意度评分的频率分布直方图图2­7①B地区用户满意度评分的频数分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100]频数2814106在图2­7②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图图2­7②【解】如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.4.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.图2­8eq\x\to(x)eq\x\to(y)eq\x\to(w)eq\o(∑,\s\up16(8),\s\do7(i=1))(xi-eq\x\to(x))2eq\o(∑,\s\up16(8),\s\do7(i=1))(wi-eq\x\to(w))2eq\o(∑,\s\up16(8),\s\do7(i=1))(xi-eq\x\to(x))(yi-eq\x\to(y))eq\o(∑,\s\up16(8),\s\do7(i=1))(wi-eq\x\to(w))(yi-eq\x\to(y))5631469表中wi=eq\r(xi),w]=eq\f(1,8)eq\o(∑,\s\up16(8),\s\do7(i=1))wi.(1)根据散点图判断,y=a+bx与y=c+deq\r(x)哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z=-x.根据(2)的结果回答下列问题:①年宣传费x=49时,年销售量及年利润的预报值是多少?②年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为eq\o(β,\s\up6(^))=eq\f(\o(∑,\s\up6(n),\s\do7(i=1))ui-\x\to(u)vi-\x\to(v),\o(∑,\s\up6(n),\s\do7(i=1))ui-\x\to(u)2),eq\o(α,\s\up6(^))=eq\x\to(v)-eq\o(β,\s\up6(^))eq\o(\x\to(u)).【解】(1)由散点图可以判断,y=c+deq\r(x)适宜作为年销售量y关于年宣传费x的回归方程类型.(2)令w=eq\r(x),先建立y关于w的线性回归方程.由于eq\o(d,\s\up6(^))=eq\f(\i\su(i=1,8,)wi-\x\to(w)yi-\x\to(y),\i\su(i=1,8,)wi-\x\to(w)2)=eq\f,=68,eq\o(c,\s\up6(^))=eq\x\to(y)-eq\o(d,\s\up6(^))eq\x\to(w)=563-68×=,所以y关于w的线性回归方程为eq\o(y,\s\up6(^))=+68w,因此y关于x的回归方程为eq\o(y,\s\up6(^))=+68eq\r(x).(3)①由(2)知,当x=49时,年销售量y的预报值eq\o(y,\s\up6(^))=+68eq\r(49)=,年利润z的预报值eq\o(z,\s\up6(^))=×-49=.②根据(2)的结果知,年利润z的预报值eq\o(z,\s\up6(^))=+68eq\r(x))-x=-x+\r(x)+.所以当eq\r(x)=eq\f,2)=,即x=时,eq\o(z,\s\up6(^))取得最大值.故年宣传费为千元时,年利润的预报值最大.5.我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,,[,1),…,[4,]分成9组,制成了如图2­9所示的频率分布直方图.图2­9(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.【解】(1)由频率分布直方图知,月均用水量在[0,中的频率为×=.同理,在[,1),[,2),[2,,[3,,[,4),[4,]中的频率分别为,,,,,.由++×a+++×a+++=1,解得a=.(2)由(1),知100位居民每人的月均用水量不低于3吨的频率为++=.由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300000×=36000.(3)因为前6组的频率之和为+++++=>,而前5组的频率之和为++++=<,所以≤x<3.由×(x-=-,解得x=.所以,估计月用水量标准为吨时,85%的居民每月的用水量不超过标准.6.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125)频数62638228(1)作

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论