课标专用5年高考3年模拟A版2020高考数学第十章概率统计及统计案例2统计及统计案例试题文_第1页
课标专用5年高考3年模拟A版2020高考数学第十章概率统计及统计案例2统计及统计案例试题文_第2页
课标专用5年高考3年模拟A版2020高考数学第十章概率统计及统计案例2统计及统计案例试题文_第3页
课标专用5年高考3年模拟A版2020高考数学第十章概率统计及统计案例2统计及统计案例试题文_第4页
课标专用5年高考3年模拟A版2020高考数学第十章概率统计及统计案例2统计及统计案例试题文_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

课标专用5年高考3年模拟A版2020高考数学第十章概率统计及统计案例2统计及统计案例试题文课标专用5年高考3年模拟A版2020高考数学第十章概率统计及统计案例2统计及统计案例试题文PAGEPAGE87课标专用5年高考3年模拟A版2020高考数学第十章概率统计及统计案例2统计及统计案例试题文统计及统计案例挖命题【考情探究】考点内容解读5年考情预测热度考题示例考向关联考点抽样方法①理解随机抽样的必要性和重要性;②会用简单随机抽样方法从总体中抽取样本2018课标全国Ⅲ,14,5分抽样方法抽样方法的选择★★☆统计图表了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率分布折线图、茎叶图,体会它们各自的特点2017课标全国Ⅲ,3,5分认识折线图利用折线图解决实际问题★★☆2018课标全国Ⅰ,3,5分认识统计图由统计图解决实际问题2018课标全国Ⅰ,19,12分用频率分布直方图解决实际问题频率分布与数字特征样本的数字特征①理解样本数据标准差的意义和作用,会计算数据标准差;②能从样本数据中提取基本的数字特征,并给出合理的解释;③会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;④会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题2017课标全国Ⅰ,2,5分理解方差或标准差样本的数字特征★★☆2014课标Ⅰ,18,12分频率分布直方图与数字特征数字特征与实际应用2014课标Ⅱ,19,12分茎叶图的认识茎叶图与实际应用变量间的相关性①会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系;②了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程2016课标全国Ⅲ,18,12分相关系数与回归方程数据处理★★☆2017课标全国Ⅰ,19,12分相关系数与数字特征数据处理2015课标Ⅰ,19,12分回归方程的求解非线性关系转换成线性关系独立性检验了解独立性检验的基本思想、方法及其简单应用,能通过计算判断两个变量的相关程度2017课标全国Ⅱ,19,12分频率分布直方图与独立性检验数据的处理★★☆2018课标全国Ⅲ,18,12分茎叶图与独立性检验数据的处理分析解读从近几年的高考试题来看,本部分在高考中的考查点如下:1.主要考查分层抽样的定义、频率分布直方图、平均数、方差的计算、识图能力及借助概率知识分析、解决问题的能力;2。在频率分布直方图中,注意小矩形的竖直方向的长度=频率/组距,小矩形的面积为频率,所有小矩形的面积之和为1;3。分析两个变量间的相关关系,通过独立性检验判断两个变量是否相关。本节内容在高考中分值为17分左右,属中档题.破考点【考点集训】考点一抽样方法1。(2018山东烟台11月联考,4)《中国诗词大会》的播出引发了全民的读书热,某小学语文老师在班里开展了一次诗词默写比赛,班里40名学生得分数据的茎叶图如图所示.若规定得分不小于85分的学生得到“诗词达人”的称号,小于85分且不小于70分的学生得到“诗词能手”的称号,其他学生得到“诗词爱好者”的称号,根据该次比赛的成绩,按照称号的不同进行分层抽样抽选10名学生,则抽选的学生中获得“诗词能手”称号的人数为()A。2 B。4 C。5 D。6答案B2.(2018宁夏银川一中月考,4)用系统抽样的方法从300名学生中抽取容量为20的样本,将300名学生从1~300编号,按编号顺序平均分组.若第16组应抽出的号码为232,则第一组中抽出的号码是()A。5 B.6 C.7 D。8答案C考点二统计图表1。(2018四川达州模拟,4)某8人一次比赛得分的茎叶图如图所示,这组数据的中位数和众数分别是()A.85和92 B。87和92 C。84和92 D。85和90答案B2。(2017河南新乡第一次调研,3)统计新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重在(2700,3000]克内的频率为()A.0。001 B.0。1 C。0。2 D.0。3答案D考点三样本的数字特征1.(2018湖北华师一附中月考,3)某人到甲、乙两市各7个小区调查空置房情况,将调查得到的小区空置房的套数绘成了如图所示的茎叶图,则调查中甲市空置房套数的中位数与乙市空置房套数的中位数之差为()A。4 B。3 C。2 D。1答案B2。(2018山东济南一模,3)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x,方差为s2,则()A.x=4,s2〈2 B。x=4,s2>2C。x>4,s2〈2 D。x>4,s2〉2答案A考点四变量间的相关性1.(2018河南焦作四模,3)已知变量x和y的统计数据如下表:x34567y2。5344.56根据上表可得回归直线方程为y^=b^x-0。25,据此可以预测当x=8时,A。6.4 B.6。25 C。6。55 D.6。45答案C2。(2018湖南张家界三模,4)已知变量x,y之间的线性回归方程为y^=—0.7x+10.3,且变量x,y之间的一组相关数据如下表所示,则下列说法错误x681012y6m32A.变量x,y之间成负相关关系B。可以预测,当x=20时,y^C。m=4D。该回归直线必过点(9,4)答案C考点五独立性检验1。(2017江西九校一模,7)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表。非一线城市一线城市总计愿生452065不愿生132235总计5842100附表:P(K2≥k0)0。0500.0100.001k03。8416。63510.828由K2=n(ad-bc)A。在犯错误的概率不超过0。1%的前提下,认为“生育意愿与城市级别有关"B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C。有99%以上的把握认为“生育意愿与城市级别有关”D.有99%以上的把握认为“生育意愿与城市级别无关”答案C2。(2018贵州六校12月联考,18)海南大学某餐饮中心为了解新生的饮食习惯,在全校新生中进行了抽样调查,调查结果如下表所示:喜欢甜品不喜欢甜品合计南方学生602080北方学生101020合计7030100(1)根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”?(2)已知在被调查的北方学生中有5名中文系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率。P(K2≥k0)0。100.050.010k02。7063。8416。635附:K2=n(解析(1)将2×2列联表中的数据代入公式计算,得K2=100×(60×10-由于4。762〉3。841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”。(2)从5名中文系学生中任取3人的所有可能结果所组成的基本事件空间Ω={(a1,a2,b1),(a1,a2,b2),(a1,a2,b3),(a1,b1,b2),(a1,b1,b3),(a1,b2,b3),(a2,b1,b2),(a2,b1,b3),(a2,b2,b3),(b1,b2,b3)},其中ai表示喜欢甜品的学生,i=1,2,bj表示不喜欢甜品的学生,j=1,2,3.Ω由10个基本事件组成,且这些基本事件的出现是等可能的.用A表示“3人中至多有1人喜欢甜品"这一事件,则A={(a1,b1,b2),(a1,b1,b3),(a1,b2,b3),(a2,b1,b2),(a2,b1,b3),(a2,b2,b3),(b1,b2,b3)}。事件A由7个基本事件组成,因而P(A)=710炼技法【方法集训】方法1解与频率分布直方图有关问题的方法1。(2016山东,3,5分)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22。5),[22。5,25),[25,27。5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56 B。60 C。120 D。140答案D2.(2017江苏南京调研,3)为了解某一段公路汽车通过时的车速情况,现随机抽测了通过这段公路的200辆汽车的时速,所得数据均在区间[40,80]内,其频率分布直方图如图所示,则在抽测的200辆汽车中,时速在区间[40,60)内的汽车有辆.

答案80方法2样本的数字特征的求解及其应用1.(2015山东,6,5分)为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图。考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差。其中根据茎叶图能得到的统计结论的编号为()A。①③ B。①④ C.②③ D.②④答案B2.(2018四川德阳模拟,13)为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(10分制)的频数分布直方图如图所示,如果得分的中位数为a,众数为b,平均数为c,则a、b、c中的最大者是。

答案c方法3回归直线方程的求解与运用1。(2017安徽合肥一中等四校联考,6)某品牌牛奶的广告费用x(万元)与销售额y(万元)的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程y^=b^x+a^A。74.9万元 B。65.5万元C。67.7万元 D.72.0万元答案A2。(2018湘东五校12月联考,18)某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:日期1月10日2月10日3月10日4月10日5月10日6月10日昼夜温差x(℃)1011131286就诊人数y222529261612该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻两个月数据的概率;(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据求出y关于x的线性回归方程y^=b^x+(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?参考公式:b^=∑i=1nxiyi-参考数据:11×25+13×29+12×26+8×16=1092,112+132+122+82=498。解析(1)设抽到相邻两个月的数据为事件A。因为从6组数据中选取2组数据共有15种情况,每种情况都是等可能出现的,其中,抽到相邻两个月的数据的情况有5种,所以P(A)=515=1(2)由数据求得x=11,y=24,由公式求得b^=18则a^=y-b^x所以y关于x的线性回归方程为y^=187x-(3)由(2)知,当x=10时,y^=1507,当x=6时,y^=787,所以,该小组所得线性回归方程是理想的.方法4独立性检验的思想方法1.(2018山西太原五中12月模拟,18)网购是当前民众购物的新方式,某公司为改进营销方式,随机调查了100名市民,统计其周平均网购的次数,并整理得到如下的频数直方图。这100名市民中,年龄不超过40岁的有65人.将所抽样中周平均网购次数不少于4次的市民称为网购迷,且已知其中有5名市民的年龄超过40岁。(1)根据已知条件完成下面的2×2列联表,能否在犯错的概率不超过0.10的前提条件下认为网购迷与年龄不超过40岁有关?网购迷非网购迷合计年龄不超过40岁年龄超过40岁合计(2)现将所抽取样本中周平均网购次数不少于5次的市民称为超级网购迷,且已知超级网购迷中有2名年龄超过40岁,若从超级网购迷中任意挑选2名,求至少有1名市民年龄超过40岁的概率。附:K2=n(解析(1)根据已知条件完成2×2列联表如下:网购迷非网购迷合计年龄不超过40岁204565年龄超过40岁53035合计2575100K2=100×((2)由频数分布直方图知,超级网购迷共有10人,记其中年龄超过40岁的2名市民为A、B,其余8名市民记为c、d、e、f、g、h、m、n,现从10人中任取2人,基本事件有AB、Ac、Ad、Ae、Af、Ag、Ah、Am、An、Bc、Bd、Be、Bf、Bg、Bh、Bm、Bn、cd、ce、cf、cg、ch、cm、cn、de、df、dg、dh、dm、dn、ef、eg、eh、em、en、fg、fh、fm、fn、gh、gm、gn、hm、hn、mn,共有45种,其中至少有1名市民年龄超过40岁的基本事件是AB、Ac、Ad、Ae、Af、Ag、Ah、Am、An、Bc、Bd、Be、Bf、Bg、Bh、Bm、Bn,共17种,故所求的概率P=17452。(2017江西红色七校第一次联考,18)某学校为了了解学生使用手机的情况,分别在高一和高二两个年级中各随机抽取了100名学生进行调查.下面是根据调查结果绘制的学生日均使用手机时间的频数分布表和频率分布直方图,将使用手机时间不低于80分钟的学生称为“手机迷”。高一年级的学生日均使用手机时间的频数分布表时间分组[0,20)[20,40)[40,60)[60,80)[80,100)[100,120]频数12202418224高二年级的学生日均使用手机时间的频率分布直方图(1)将频率视为概率,估计哪个年级的学生是“手机迷”的概率大,请说明理由;(2)在对高二年级学生的抽查中,已知随机抽到的女生有55名,其中10名为“手机迷”。根据已知条件完成下面的2×2列联表,并据此资料,你有多大的把握认为“手机迷”与性别有关?非手机迷手机迷合计男女合计附:K2=n(参考数据P(K2≥k0)0。150。100。050.025k02.0722。7063。8415.024解析(1)估计高一年级的学生是“手机迷”的概率大.理由:由频数分布表可知,高一年级的学生是“手机迷"的概率为22+4100由频率分布直方图可知,高二年级的学生是“手机迷”的概率为(0。0025+0.010)×20=0.25,因为0.26>0。25,所以高一年级的学生是“手机迷”的概率大.(2)由频率分布直方图可知,在抽取的100人中,“手机迷"有(0。010+0。0025)×20×100=25人,“非手机迷”有100-25=75人.2×2列联表如下:非手机迷手机迷合计男301545女451055合计7525100将2×2列联表中的数据代入公式计算,得K2=100×(30×10-因为3。030〉2。706,所以有90%的把握认为“手机迷”与性别有关。过专题【五年高考】A组统一命题·课标卷题组考点一抽样方法(2018课标全国Ⅲ,14,5分)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异。为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是。

答案分层抽样考点二统计图表1.(2018课标全国Ⅰ,3,5分)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A。新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C。新农村建设后,养殖收入增加了一倍D。新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案A2.(2017课标全国Ⅲ,3,5分)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A。月接待游客量逐月增加B。年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D。各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案A3.(2015课标Ⅱ,3,5分)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B。2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D。2006年以来我国二氧化硫年排放量与年份正相关答案D4.(2018课标全国Ⅰ,19,12分)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0。1,0.2)[0。2,0.3)[0。3,0.4)[0。4,0。5)[0.5,0。6)[0。6,0.7)频数13249265使用了节水龙头50天的日用水量频数分布表日用水量[0,0。1)[0.1,0。2)[0.2,0.3)[0。3,0.4)[0。4,0。5)[0.5,0.6)频数151310165(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于0.35m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水.(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)解析(1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35m3的频率为0.2×0。1+1×0.1+2。6×0。1+2×0。05=0.48,因此该家庭使用节水龙头后日用水量小于0.35m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为x1=1该家庭使用了节水龙头后50天日用水量的平均数为x2=1估计使用节水龙头后,一年可节省水(0.48—0.35)×365=47。45(m3).考点三样本的数字特征1.(2017课标全国Ⅰ,2,5分)为评估一种农作物的种植效果,选了n块地作试验田。这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差C.x1,x2,…,xn的最大值 D。x1,x2,…,xn的中位数答案B2。(2014课标Ⅰ,18,12分)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125)频数62638228(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解析(1)频率分布直方图如图。(2)质量指标值的样本平均数为x=80×0。06+90×0.26+100×0。38+110×0。22+120×0。08=100。质量指标值的样本方差为s2=(—20)2×0.06+(-10)2×0。26+0×0.38+102×0。22+202×0。08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0。38+0。22+0.08=0。68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定。考点四变量间的相关性1.(2017课标全国Ⅰ,19,12分)为了监控某种零件的一条生产线的生产过程,检验员每隔30min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm)。下面是检验员在一天内依次抽取的16个零件的尺寸:抽取次序12345678零件尺寸9.9510。129.969。9610。019.929.9810。04抽取次序910111213141516零件尺寸10。269。9110。1310.029.2210.0410.059。95经计算得x=116∑i=1=116(≈18.439,∑i=116(xi-x(1)求(xi,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在(x-3s,x+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(i)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ii)在(x—3s,x+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0。01)附:样本(xi,yi)(i=1,2,…,n)的相关系数r=∑i0.解析(1)由样本数据得(xi,i)(i=1,2,…,16)的相关系数为r=∑=-2由于|r|〈0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)(i)由于x=9。97,s≈0.212,由样本数据可以看出抽取的第13个零件的尺寸在(x—3s,x+3s)以外,因此需对当天的生产过程进行检查.(ii)剔除离群值,即第13个数据,剩下数据的平均数为115这条生产线当天生产的零件尺寸的均值的估计值为10.02。∑i=116xi剔除第13个数据,剩下数据的样本方差为115×(1591。134—9.222-15×10。022这条生产线当天生产的零件尺寸的标准差的估计值为0.2.(2016课标全国Ⅲ,18,12分)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图。(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量。附注:参考数据:∑i=17yi=9.32,∑i=17tiy参考公式:相关系数r=∑i回归方程y^=a^+b^=∑i=1n(ti解析(1)由折线图中数据和附注中参考数据得t=4,∑i=17(ti—t)2∑i=17(ti-t)(yi-y)=∑i=17tiyr≈2.因为y与t的相关系数近似为0。99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系。(6分)(2)由y=9.327≈1。331及(1)得b^=a^=y—b所以y关于t的回归方程为y^将2016年对应的t=9代入回归方程得:y^所以预测2016年我国生活垃圾无害化处理量将约为1.83亿吨。(12分)考点五独立性检验1.(2018课标全国Ⅲ,18,12分)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式。为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人。第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高,并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表;超过m不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2=n(P(K2≥k)0。0500。0100.001k3.8416。63510.828.解析(1)第二种生产方式的效率更高。理由如下:(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高。(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高。(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟。因此第二种生产方式的效率更高.(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少。因此第二种生产方式的效率更高.以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分。(2)由茎叶图知m=79+812列联表如下:超过m不超过m第一种生产方式155第二种生产方式515(3)由于K2=40×(2.(2017课标全国Ⅱ,19,12分)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50kg",估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量<50kg箱产量≥50kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.附:P(K2≥k)0。0500.0100.001k3.8416。63510.828,K2=n(解析(1)旧养殖法的箱产量低于50kg的频率为(0。012+0。014+0。024+0.034+0.040)×5=0。62。因此,事件A的概率估计值为0.62.(2)根据箱产量的频率分布直方图得列联表:箱产量〈50kg箱产量≥50kg旧养殖法6238新养殖法3466K2=200×(由于15.705〉6。635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50kg到55kg之间,旧养殖法的箱产量平均值(或中位数)在45kg到50kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.B组自主命题·省(区、市)卷题组考点一抽样方法1。(2015湖南,2,5分)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是()A.3 B.4 C.5 D。6答案B2。(2017江苏,3,5分)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件。

答案18考点二统计图表1.(2015湖北,14,5分)某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=;

(2)在这些购物者中,消费金额在区间[0.5,0。9]内的购物者的人数为.

答案(1)3(2)60002.(2017北京,17,13分)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等。试估计总体中男生和女生人数的比例.解析(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0。04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0。4。所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0。4。(2)根据题意,样本中分数不小于50的频率为(0.01+0。02+0.04+0。02)×10=0。9,分数在区间[40,50)内的人数为100—100×0。9-5=5。所以总体中分数在区间[40,50)内的人数估计为400×5100(3)由题意可知,样本中分数不小于70的学生人数为(0。02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×12所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.考点三样本的数字特征1.(2017山东,8,5分)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件)。若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A。3,5 B。5,5 C。3,7 D。5,7答案A2。(2018江苏,3,5分)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为。

8999011答案903.(2016江苏,4,5分)已知一组数据4.7,4.8,5.1,5.4,5。5,则该组数据的方差是。

答案0。1考点四变量间的相关性1.(2015湖北,4,5分)已知变量x和y满足关系y=—0。1x+1,变量y与z正相关。下列结论中正确的是()A.x与y正相关,x与z负相关 B.x与y正相关,x与z正相关C。x与y负相关,x与z负相关 D。x与y负相关,x与z正相关答案C2。(2015重庆,17,13分)随着我国经济的发展,居民的储蓄存款逐年增长。设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份20102011201220132014时间代号t12345储蓄存款y(千亿元)567810(1)求y关于t的回归方程y^=b^t+(2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款。附:回归方程y^=b^t+a^中,b^=∑i解析(1)列表计算如下:itiyittiyi11515226412337921448163255102550∑153655120这里n=5,t=1n∑i=1nti=155=3,y=又ltt=∑i=1nti2—nt2=55—5×32=10,lty=∑i=1ntiyi-nty=120-5×3×7.2=12,从而b^故所求回归方程为y^(2)将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为y^考点五独立性检验1.(2014江西,7,5分)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()表1成绩性别不及格及格总计男61420女102232总计163652表2视力性别好差总计男41620女122032总计163652表3智商性别偏高正常总计男81220女82432总计163652

表4阅读量性别丰富不丰富总计男14620女23032总计163652A.成绩 B。视力 C。智商 D。阅读量答案D2.(2014安徽,17,12分)某高校共有学生15000人,其中男生10500人,女生4500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率;(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”。附:K2=nP(K2≥k0)0.100。050。0100.005k02.7063.8416。6357.879解析(1)300×4(2)由频率分布直方图得1—2×(0.100+0.025)=0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75。(3)由(2)知,300位学生中有300×0.75=225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时。又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下:每周平均体育运动时间与性别列联表男生女生总计每周平均体育运动时间不超过4小时453075每周平均体育运动时间超过4小时16560225总计21090300结合列联表可算得K2=300×(45×60-所以,有95%的把握认为“该校学生的每周平均体育运动时间与性别有关"。C组教师专用题组考点一抽样方法1.(2015湖北,2,5分)我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()A。134石 B.169石 C.338石 D.1365石答案B2。(2015北京,4,5分)某校老年、中年和青年教师的人数见下表。采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为()类别人数老年教师900中年教师1800青年教师1600合计4300A。90 B.100 C.180 D。300答案C3.(2014四川,2,5分)在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5000名居民的阅读时间的全体是()A.总体 B.个体C.样本的容量 D.从总体中抽取的一个样本答案A4.(2014重庆,3,5分)某中学有高中生3500人,初中生1500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A。100 B.150 C.200 D。250答案A5。(2014广东,6,5分)为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A.50 B.40 C。25 D.20答案C6。(2014湖南,3,5分)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()A.p1=p2<p3 B.p2=p3<p1 C。p1=p3<p2 D.p1=p2=p3答案D7。(2015福建,13,4分)某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为.

答案258。(2014湖北,11,5分)甲、乙两套设备生产的同类型产品共4800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测。若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为件.

答案18009.(2014天津,9,5分)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查。已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取名学生。

答案6010.(2014山东,16,12分)海关对同时从A,B,C三个不同地区进口的某种商品进行抽样检测,从各地区进口此种商品的数量(单位:件)如下表所示.工作人员用分层抽样的方法从这些商品中共抽取6件样品进行检测。(1)求这6件样品中来自A,B,C各地区商品的数量;(2)若在这6件样品中随机抽取2件送往甲机构进行进一步检测,求这2件商品来自相同地区的概率.地区ABC数量50150100解析(1)因为样本容量与总体中的个体数的比是650+150+100=1所以样本中包含三个地区的个体数量分别是:50×150=1,150×150=3,100×所以A,B,C三个地区的商品被选取的件数分别为1,3,2.(2)设6件来自A,B,C三个地区的样品分别为:A;B1,B2,B3;C1,C2,则抽取的这2件商品构成的所有基本事件为:{A,B1},{A,B2},{A,B3},{A,C1},{A,C2},{B1,B2},{B1,B3},{B1,C1},{B1,C2},{B2,B3},{B2,C1},{B2,C2},{B3,C1},{B3,C2},{C1,C2},共15个.每个样品被抽到的机会均等,因此这些基本事件的出现是等可能的.记事件D:“抽取的这2件商品来自相同地区”,则事件D包含的基本事件有{B1,B2},{B1,B3},{B2,B3},{C1,C2},共4个。所以P(D)=415,即这2件商品来自相同地区的概率为4考点二统计图表1.(2014山东,8,5分)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.如图是根据试验数据制成的频率分布直方图。已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6 B。8 C。12 D。18答案C2.(2016课标全国Ⅰ,19,12分)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),n表示购机的同时购买的易损零件数.(1)若n=19,求y与x的函数解析式;(2)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n的最小值;(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?解析(1)当x≤19时,y=3800;当x〉19时,y=3800+500(x-19)=500x-5700,所以y与x的函数解析式为y=3(2)由柱状图知,需更换的零件数不大于18的频率为0。46,不大于19的频率为0.7,故n的最小值为19.(5分)(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3800元,20台的费用为4300元,10台的费用为4800元,因此这100台机器在购买易损零件上所需费用的平均数为1100若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4000元,10台的费用为4500元,因此这100台机器在购买易损零件上所需费用的平均数为1100比较两个平均数可知,购买1台机器的同时应购买19个易损零件.(12分)3.(2016北京,17,13分)某市居民用水拟实行阶梯水价.每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费。解析(1)由用水量的频率分布直方图知,该市居民该月用水量在区间[0.5,1],(1,1。5],(1。5,2],(2,2。5],(2.5,3]内的频率依次为0.1,0。15,0。2,0。25,0。15.(3分)所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%。(5分)依题意,w至少定为3。(6分)(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:组号12345678分组[2,4](4,6](6,8](8,10](10,12](12,17](17,22](22,27]频率0。10。150。20。250.150。050.050。05(10分)根据题意,该市居民该月的人均水费估计为:4×0。1+6×0.15+8×0。2+10×0.25+12×0.15+17×0。05+22×0.05+27×0。05=10.5(元)。(13分)4.(2015课标Ⅱ,18,12分)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表。B地区用户满意度评分的频数分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100]频数2814106(1)作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大,说明理由。解析(1)通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散。(2)A地区用户的满意度等级为不满意的概率大。记CA表示事件:“A地区用户的满意度等级为不满意”;CB表示事件:“B地区用户的满意度等级为不满意”。由直方图得P(CA)的估计值为(0。01+0。02+0。03)×10=0.6,P(CB)的估计值为(0。005+0.02)×10=0.25。所以A地区用户的满意度等级为不满意的概率大。5。(2015安徽,17,12分)某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工,根据这50名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为:[40,50),[50,60),…,[80,90),[90,100].(1)求频率分布直方图中a的值;(2)估计该企业的职工对该部门评分不低于80的概率;(3)从评分在[40,60)的受访职工中,随机抽取2人,求此2人的评分都在[40,50)的概率.解析(1)因为(0。004+a+0.018+0.022×2+0.028)×10=1,所以a=0.006。(2)由所给频率分布直方图知,50名受访职工评分不低于80的频率为(0。022+0。018)×10=0.4,所以该企业职工对该部门评分不低于80的概率的估计值为0。4。(3)受访职工中评分在[50,60)的有50×0。006×10=3(人),记为A1,A2,A3;受访职工中评分在[40,50)的有50×0。004×10=2(人),记为B1,B2.从这5名受访职工中随机抽取2人,所有可能的结果共有10种,它们是{A1,A2},{A1,A3},{A1,B1},{A1,B2},{A2,A3},{A2,B1},{A2,B2},{A3,B1},{A3,B2},{B1,B2},又因为所抽取2人的评分都在[40,50)的结果有1种,即{B1,B2},故所求的概率为P=1106。(2014重庆,17,13分)20名学生某次数学考试成绩(单位:分)的频率分布直方图如下:(1)求频率分布直方图中a的值;(2)分别求出成绩落在[50,60)与[60,70)中的学生人数;(3)从成绩在[50,70)的学生中任选2人,求此2人的成绩都在[60,70)中的概率。解析(1)据题中直方图知组距=10,由(2a+3a+6a+7a+2a)×10=1,解得a=1200(2)成绩落在[50,60)中的学生人数为2×0。005×10×20=2.成绩落在[60,70)中的学生人数为3×0。005×10×20=3.(3)记成绩落在[50,60)中的2人为A1,A2,成绩落在[60,70)中的3人为B1,B2,B3,则从成绩在[50,70)的学生中任选2人的基本事件共有10个:(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),(B1,B2),(B1,B3),(B2,B3),其中2人的成绩都在[60,70)中的基本事件有3个:(B1,B2),(B1,B3),(B2,B3),故所求概率为P=3107.(2014北京,18,13分)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:组号分组频数1[0,2)62[2,4)83[4,6)174[6,8)225[8,10)256[10,12)127[12,14)68[14,16)29[16,18)2合计100(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的a,b的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.(只需写出结论)解析(1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10名,所以样本中的学生一周课外阅读时间少于12小时的频率是1-10100故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0。9。(2)课外阅读时间落在组[4,6)内的有17人,频率为0。17,所以a=频率组距=0课外阅读时间落在组[8,10)内的有25人,频率为0。25,所以b=频率组距=0(3)样本中的100名学生该周课外阅读时间的平均数在第4组。8.(2013课标Ⅱ,19,12分)经销商经销某种农产品,在一个销售季度内,每售出1t该产品获利润500元,未售出的产品,每1t亏损300元。根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示。经销商为下一个销售季度购进了130t该农产品,以X(单位:t,100≤X≤150)表示下一个销售季度内的市场需求量,T(单位:元)表示下一个销售季度内经销该农产品的利润.(1)将T表示为X的函数;(2)根据直方图估计利润T不少于57000元的概率。解析(1)当X∈[100,130)时,T=500X—300(130—X)=800X—39000.当X∈[130,150]时,T=500×130=65000。所以T=800(2)由(1)知利润T不少于57000元当且仅当120≤X≤150。由直方图知需求量X∈[120,150]的频率为0.7,所以下一个销售季度内的利润T不少于57000元的概率的估计值为0。7。考点三样本的数字特征1.(2015重庆,4,5分)重庆市2013年各月的平均气温(℃)数据的茎叶图如下:0891258200338312则这组数据的中位数是()A.19 B。20 C.21。5 D。23答案B2.(2014陕西,9,5分)某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其均值和方差分别为x和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为()A.x,s2+1002 B.x+100,s2+1002C。x,s2 D。x+100,s2答案D3。(2016四川,16,12分)我国是世界上严重缺水的国家,某市为了制订合理的节水方案,对居民用水情况进行了调查。通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0。5,1),…,[4,4。5]分成9组,制成了如图所示的频率分布直方图。(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.解析(1)由频率分布直方图,可知:月均用水量在[0,0.5)的频率为0.08×0.5=0.04。同理,在[0.5,1),[1。5,2),[2,2.5),[3,3。5),[3.5,4),[4,4.5]等组的频率分别为0.08,0.21,0。25,0.06,0.04,0。02.由1-(0。04+0。08+0.21+0。25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0。30。(2)由(1),100位居民月均用水量不低于3吨的频率为0。06+0。04+0。02=0。12,由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300000×0.12=36000。(3)设中位数为x吨.因为前5组的频率之和为0。04+0。08+0。15+0。21+0.25=0.73〉0.5,而前4组的频率之和为0。04+0.08+0.15+0.21=0。48〈0.5,所以2≤x<2.5。由0。50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨。4。(2015广东,17,12分)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?解析(1)由已知得,20×(0.002+0.0095+0。011+0.0125+x+0。005+0。0025)=1,解得x=0。0075。(2)由题图可知,面积最大的矩形对应的月平均用电量区间为[220,240),所以月平均用电量的众数的估计值为230;因为20×(0。002+0。0095+0。011)=0。45<0。5,20×(0.002+0.0095+0.011+0。0125)=0.7〉0.5,所以中位数在区间[220,240)内.设中位数为m,则20×(0。002+0.0095+0。011)+0。0125×(m-220)=0.5,解得m=224.所以月平均用电量的中位数为224。(3)由题图知,月平均用电量为[220,240)的用户数为(240-220)×0。0125×100=25,同理可得,月平均用电量为[240,260),[260,280),[280,300]的用户数分别为15,10,5.故用分层抽样的方式抽取11户居民,月平均用电量在[220,240)的用户中应抽取11×2525+15+10+55.(2014广东,17,13分)某车间20名工人年龄数据如下表:年龄(岁)工人数(人)191283293305314323401合计20(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.解析(1)由题表中的数据易知,这20名工人年龄的众数是30,极差为40—19=21.(2)这20名工人年龄的茎叶图如下:123498889990000011112220(3)这20名工人年龄的平均数x=120故方差s2=120×[1×(19—30)2+3×(28-30)2+3×(29-30)2+5×(30-30)2+4×(31-30)2+3×(32—30)2+1×(40-30)2]=16。(2014湖南,17,12分)某企业有甲、乙两个研发小组,为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),其中a,a分别表示甲组研发成功和失败;b,b分别表示乙组研发成功和失败。(1)若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平;(2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率.解析(1)甲组研发新产品的成绩为1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,其平均数为x甲=1015=方差为s甲2=115乙组研发新产品的成绩为1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,其平均数为x乙=915=方差为s乙2=115因为x甲>x乙,s甲所以甲组的研发水平优于乙组.(2)记E={恰有一组研发成功}.在所抽得的15个结果中,恰有一组研发成功的结果是(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),共7个,故事件E发生的频率为715将频率视为概率,即得所求概率为P(E)=7157.(2014课标Ⅱ,19,12分)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民。根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:甲部门乙部门4979766533211098877766555554443332100665520063222034567891059044812245667778901123468800113449123345011456000(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.解析(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0。1,8(3)解法一:由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大。解法二:由所给茎叶图知,市民对甲部门的评分的平均数高于对乙部门的评分的平均数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.8。(2013课标Ⅰ,18,12分)为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.61。22。71.52。81。82。22。33.23。52。52。61。22。71.52。93.03。12。32.4服用B药的20位患者日平均增加的睡眠时间:3.21.71.90。80.92。41.22。61.31。41.60。51。80.62。11。12.51。22.70。5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?解析(1)设A药观测数据的平均数为x,B药观测数据的平均数为y,由观测结果可得x=120y=120由以上计算结果可得x>y,因此可看出A药的疗效更好。(2)由观测结果可绘制如下茎叶图:从以上茎叶图可以看出,A药疗效的试验结果有710的叶集中在茎2,3上,而B药疗效的试验结果有7考点四变量间的相关性1。(2012课标全国,3,5分)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=12A.-1 B。0C。12答案D2.(2014湖北,6,5分)根据如下样本数据x345678y4.02.5—0.50。5-2。0-3。0得到的回归方程为y^A.a〉0,b<0 B。a>0,b〉0C.a<0,b<0 D。a〈0,b>0答案A3。(2015课标Ⅰ,19,12分)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响。对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.xyw∑i=18(xi-∑i=18(wi—∑i=18(xi—x)(yi∑i=18(wi-w)(yi46。65636。8289。81。61469108.8表中wi=xi,w=18∑(1)根据散点图判断,y=a+bx与y=c+dx哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x。根据(2)的结果回答下列问题:(i)年宣传费x=49时,年销售量及年利润的预报值是多少?(ii)年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为β^=∑i=1n(ui-u解析(1)由散点图可以判断,y=c+dx适宜作为年销售量y关于年宣传费x的回归方程类型.(2分)(2)令w=x,先建立y关于w的线性回归方程.由于d^=∑i=1c^=y-d^所以y关于w的线性回归方程为y^因此y关于x的回归方程为y^=100。6+68x(3)(i)由(2)知,当x=49时,年销售量y的预报值y^=100.6+6849年利润z的预报值z^(ii)根据(2)的结果知,年利润z的预报值z^=0.2(100.6+68x)-x=-x+13.6x所以当x=13.62故年宣传费为46。24千元时,年利润的预报值最大。(12分)4.(2014课标Ⅱ,19,12分)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年份2007200820092010201120122013年份代号t1234567人均纯收入y2.93。33。64。44。85。25。9(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:b^=∑i=1n(ti解析(1)由所给数据计算得t=17y=17∑i=17(ti—t∑i=17(ti-t)(yib^=∑i=1a^=y—b^t(2)由(1)知,b^将2015年的年份代号t=9代入(1)中的回归方程,得y^故预测该地区2015年农村居民家庭人均纯收入为6。8千元。考点五独立性检验(2010课标全国,19,12分)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别是否需要志愿者男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.附:P(K2≥k)0。0500.0100.001k3.8416.63510。828K2=n(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为70500(2)K2=500×(由于9.967〉6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关。(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.【三年模拟】时间:60分钟分值:70分一、选择题(每小题5分,共20分)1。(2017安徽合肥四校联考,4)设样本数据x1,x2,…,x20的均值和方差分别为1和8,若yi=2xi+3(i=1,2,…,20),则y1,y2,…,y20的均值和方差分别是()A.5,32 B.5,19 C.1,32 D.4,35答案A2。(2017山西大学附中第二次模拟,3)某校高二(1)班一次阶段考试数学成绩的茎叶图和频率分布直方图的可见部分如图,根据图中的信息,可确定被抽测的人数及分数在[90,100]内的人数分别为()A。20,2 B.24,4 C。25,2 D.25,4答案C3。(2018江西南昌一模,10)已知线性相关的五个样本点A1(0,0),A2(2,2),A3(3,2),A4(4,2),A5(6,4),用最小二乘法得到回归直线方程l1:y^=b^x+a^,过点A1,A2①m>b^,a^〉n;②直线l1过点A3;③∑i=15(yi—b^xi—a^)2≥∑i=15(yi-mxi-n)2;④∑i=15|yi参考公式:b^=∑其中正确的命题有()A.1个 B。2个 C。3个 D.4个答案B4.(2018广东五校联考,3)下表是我国某城市在2017年1月份至10月份10个月的最低气温与最高气温(℃)的数据一览表.月份12345678910最高气温59911172427303121最低气温-12-31—271719232510已知该城市各月的最低气温与最高气温具有相关关系,根据表格下列结论错误的是()A。最低气温与最高气温为正相关B.每月最高气温和最低气温的平均值在前8个月逐月增加C。月温差(最高气温减最低气温)的最大值出现在1月D.1月至4月的月温差(最高气温减最低气温)相对于7月至10月,波动性更大答案B二、解答题(共50分)5。(2017湖南百所重点中学阶段性诊断,18)已知某企业近3年的前7个月的月利润(单位:百万元)如下面的折线图所示:(1)试问这3年的前7个月中哪个月的月平均利润较高?(2)通过计算判断这3年的前7个月的总利润的发展趋势;(3)试以第3年的前4个月的数据(如下表),用线性回归的拟合模式估计第3年8月份的利

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论