高考数学(文)一轮复习教师用书第十章第四节变量间的相关关系统计案例_第1页
高考数学(文)一轮复习教师用书第十章第四节变量间的相关关系统计案例_第2页
高考数学(文)一轮复习教师用书第十章第四节变量间的相关关系统计案例_第3页
高考数学(文)一轮复习教师用书第十章第四节变量间的相关关系统计案例_第4页
高考数学(文)一轮复习教师用书第十章第四节变量间的相关关系统计案例_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十章eq\b\lc\|\rc\(\a\vs4\al\co1(,,,,,,,,))算法初步、统计、统计案例第四节变量间的相关关系、统计案例1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点散布在左上角到右下角的区域内,两个变量的这种相关关系为负相关.2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),其中eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x).(3)通过求eq\a\vs4\al(Q=\i\su(i=1,n,)yi-bxi-a2)的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小,这一方法叫做最小二乘法.(4)相关系数:当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.3.独立性检验假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+dK2=eq\f(nad-bc2,a+ba+cb+dc+d)(其中n=a+b+c+d为样本容量).1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)散点图是判断两个变量是否相关的一种重要方法和手段.()(2)回归直线方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点.()(3)若事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越小.()(4)两个变量的相关系数的绝对值越接近于1,它们的相关性越强.()答案:(1)√(2)×(3)×(4)√2.为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是()A.l1和l2必定平行B.l1与l2必定重合C.l1和l2一定有公共点(s,t)D.l1与l2相交,但交点不一定是(s,t)解析:选C注意到回归直线必经过样本中心点.3.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为eq\o(y,\s\up6(^))=0.85x-85.71,则下列结论中不正确的是()A.y与x具有正的线性相关关系B.回归直线过样本点的中心(eq\x\to(x),eq\x\to(y))C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重必为58.79kg解析:选D由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故A正确;又线性回归方程必过样本中心点(eq\x\to(x),eq\x\to(y)),故B正确;由线性回归方程中系数的意义知,x每增加1cm,其体重约增加0.85kg,故C正确;当某女生的身高为170cm时,其体重估计值是58.79kg,而不是具体值,故D不正确.4.(教材习题改编)已知x,y的取值如下表,从散点图可以看出y与x具有线性相关关系,且回归方程为eq\o(y,\s\up6(^))=0.95x+eq\o(a,\s\up6(^)),则eq\o(a,\s\up6(^))=________.x0134y2.24.34.86.7解析:∵回归直线必过样本点的中心(eq\x\to(x),eq\x\to(y)),又eq\x\to(x)=2,eq\x\to(y)=4.5,代入回归方程,得eq\o(a,\s\up6(^))=2.6.答案:2.65.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下列联表:理科文科男1310女720已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到K2的观测值k=eq\f(50×13×20-10×72,23×27×20×30)≈4.844.则认为选修文科与性别有关系出错的可能性为________.解析:K2的观测值k≈4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.答案:5%eq\a\vs4\al(考点一相关关系的判断)eq\a\vs4\al(基础送分型考点——自主练透)[考什么·怎么考]高考对相关关系判断的直接考查较少,多与线性回归分析等综合出现在解答题中,难度较小.1.两个变量的相关关系有①正相关,②负相关,③不相关,则下列散点图从左到右分别反映的变量间的相关关系是()A.①②③ B.②③①C.②①③ D.①③②解析:选D第一个散点图中,散点图中的点是从左下角区域分布到右上角区域,则是正相关;第三个散点图中,散点图中的点是从左上角区域分布到右下角区域,则是负相关;第二个散点图中,散点图中的点的分布没有什么规律,则是不相关,所以应该是①③②.2.已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关解析:选C因为y=-0.1x+1的斜率小于0,故x与y负相关.因为y与z正相关,可设z=eq\o(b,\s\up6(^))y+eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^))>0,则z=eq\o(b,\s\up6(^))y+eq\o(a,\s\up6(^))=-0.1eq\o(b,\s\up6(^))x+eq\o(b,\s\up6(^))+eq\o(a,\s\up6(^)),故x与z负相关.3.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3解析:选A由相关系数的定义以及散点图所表达的含义可知r2<r4<0<r3<r1.[怎样快解·准解]判断相关关系的2种方法(1)散点图法:如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.(2)相关系数法:利用相关系数判定,当|r|越趋近于1相关性越强.eq\a\vs4\al(考点二回归分析)eq\a\vs4\al(题点多变型考点——追根溯源)eq\x(\a\al(回归分析是每年高考的热点,既有选择题、填空题,也有解答题,难度中等以上.,常见的命题角度有:,1线性回归方程及应用;2相关系数及应用.))[题点全练]角度(一)线性回归方程及应用1.(2017·山东高考)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),已知eq\i\su(i=1,10,x)i=225,eq\i\su(i=1,10,y)i=1600,eq\o(b,\s\up6(^))=4.该班某学生的脚长为24,据此估计其身高为()A.160 B.163C.166 D.170解析:选C由题意可知eq\o(y,\s\up6(^))=4x+eq\o(a,\s\up6(^)),又eq\x\to(x)=22.5,eq\x\to(y)=160,因此160=22.5×4+eq\o(a,\s\up6(^)),解得eq\o(a,\s\up6(^))=70,所以eq\o(y,\s\up6(^))=4x+70.当x=24时,eq\o(y,\s\up6(^))=4×24+70=166.2.(2018·山西四校联考)某地随着经济的发展,居民收入逐年增长,下表是该地某银行连续五年的储蓄存款(年底余额),如下表1:年份x20132014201520162017储蓄存款y(千亿元)567810表1为了研究计算的方便,工作人员将上表的数据进行了处理,t=x-2012,z=y-5得到下表2:时间代号t12345z01235表2(1)求z关于t的线性回归方程;(2)通过(1)中的方程,求出y关于x的回归方程;(3)用所求回归方程预测到2020年年底,该地储蓄存款额可达多少?(附:对于线性回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),其中eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x))解:(1)由已知,得eq\x\to(t)=3,eq\x\to(z)=2.2,eq\i\su(i=1,5,t)izi=45,eq\i\su(i=1,5,t)eq\o\al(2,i)=55,eq\o(b,\s\up6(^))=eq\f(45-5×3×2.2,55-5×9)=1.2,eq\o(a,\s\up6(^))=eq\x\to(z)-eq\o(b,\s\up6(^))eq\x\to(t)=2.2-1.2×3=-1.4,∴eq\o(z,\s\up6(^))=1.2t-1.4.(2)将t=x-2012,z=y-5,代入eq\o(z,\s\up6(^))=1.2t-1.4,得y-5=1.2(x-2012)-1.4,即eq\o(y,\s\up6(^))=1.2x-2410.8.(3)∵eq\o(y,\s\up6(^))=1.2×2020-2410.8=13.2,∴预测到2020年年底,该地储蓄存款额可达13.2千亿元.[题型技法]1.回归直线方程中系数的2种求法(1)公式法:利用公式,求出回归系数eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^)).(2)待定系数法:利用回归直线过样本点中心(eq\x\to(x),eq\x\to(y))求系数.2.回归分析的2种策略(1)利用回归方程进行预测:把回归直线方程看作一次函数,求函数值.(2)利用回归直线判断正、负相关:决定正相关还是负相关的是回归系数eq\o(b,\s\up6(^)).角度(二)相关系数及应用3.(2017·全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每隔30min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:抽取次序12345678零件尺寸9.9510.129.969.9610.019.929.9810.04抽取次序910111213141516零件尺寸10.269.9110.1310.029.2210.0410.059.95经计算得eq\x\to(x)=eq\f(1,16)eq\i\su(i=1,16,x)i=9.97,s=eq\r(\f(1,16)\i\su(i=1,16,)xi-\x\to(x)2)=eq\r(\f(1,16)\b\lc\(\rc\)(\a\vs4\al\co1(\i\su(i=1,16,x)\o\al(2,i)-16\x\to(x)2)))≈0.212,eq\r(\i\su(i=1,16,)i-8.52)≈18.439,eq\i\su(i=1,16,)(xi-eq\x\to(x))(i-8.5)=-2.78,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.(1)求(xi,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(2)一天内抽检零件中,如果出现了尺寸在(eq\x\to(x)-3s,eq\x\to(x)+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①从这一天抽检的结果看,是否需对当天的生产过程进行检查?②在(eq\x\to(x)-3s,eq\x\to(x)+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(xi,yi)(i=1,2,…,n)的相关系数r=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\r(\i\su(i=1,n,)xi-\x\to(x)2)\r(\i\su(i=1,n,)yi-\x\to(y)2)),eq\r(0.008)≈0.09.[学审题]①判断这一天生产的零件尺寸是否随生产过程的进行而系统的变大或变小的方法就是判断|r|与0.25的大小关系;②根据题目条件求出eq\x\to(x),s的值,然后验证题干表格中的数据与区间(eq\x\to(x)-3s,eq\x\to(x)+3s)的关系即可.解:(1)由样本数据得(xi,i)(i=1,2,…,16)的相关系数为r=eq\f(\i\su(i=1,16,)xi-\x\to(x)i-8.5,\r(\i\su(i=1,16,)xi-\x\to(x)2)\r(\i\su(i=1,16,)i-8.52))=eq\f(-2.78,0.212×\r(16)×18.439)≈-0.18.由于|r|<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)①由于eq\x\to(x)=9.97,s≈0.212,由样本数据可以看出抽取的第13个零件的尺寸在(eq\x\to(x)-3s,eq\x\to(x)+3s)以外,因此需对当天的生产过程进行检查.②剔除离群值,即第13个数据,剩下数据的平均数为eq\f(1,15)(16×9.97-9.22)=10.02,所以这条生产线当天生产的零件尺寸的均值的估计值为10.02,eq\i\su(i=1,16,x)eq\o\al(2,i)=16×0.2122+16×9.972≈1591.134,剔除第13个数据,剩下数据的样本方差为eq\f(1,15)(1591.134-9.222-15×10.022)≈0.008,所以这条生产线当天生产的零件尺寸的标准差的估计值为eq\r(0.008)≈0.09.[题型技法]样本数据的均值反映样本数据的平均水平;样本数据的方差反映样本数据的稳定性,方差越小,数据越稳定;样本数据的标准差为方差的算术平方根.[冲关演练](2018·湖北八校联考)由某种设备的使用年限xi(年)与所支出的维修费yi(万元)的数据资料算得如下结果,eq\i\su(i=1,5,x)eq\o\al(2,i)=90,eq\i\su(i=1,5,x)iyi=112,eq\i\su(i=1,5,x)i=20,eq\i\su(i=1,5,y)i=25.(1)求所支出的维修费y对使用年限x的线性回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^));(2)①判断变量x与y之间是正相关还是负相关;②当使用年限为8年时,试估计支出的维修费是多少.(附:在线性回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))中,eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x),其中eq\x\to(x),eq\x\to(y)为样本平均值)解:(1)∵eq\i\su(i=1,5,x)i=20,eq\i\su(i=1,5,y)i=25,∴eq\x\to(x)=eq\f(1,5)eq\i\su(i=1,5,x)i=4,eq\x\to(y)=eq\f(1,5)eq\i\su(i=1,5,y)i=5,∴eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,5,x)iyi-5\x\to(x)\x\to(y),\i\su(i=1,5,x)\o\al(2,i)-5\x\to(x)2)=eq\f(112-5×4×5,90-5×42)=1.2,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=5-1.2×4=0.2.∴线性回归方程为eq\o(y,\s\up6(^))=1.2x+0.2.(2)①由(1)知eq\o(b,\s\up6(^))=1.2>0,∴变量x与y之间是正相关.②由(1)知,当x=8时,eq\o(y,\s\up6(^))=1.2×8+0.2=9.8,即使用年限为8年时,支出维修费约是9.8万元.eq\a\vs4\al(考点三独立性检验)eq\a\vs4\al(重点保分型考点——师生共研)独立性检验是高考的常考内容,但是很少单独考查,多与频率分布直方图、概率等知识综合考查,难度适中.[典题领悟](2017·全国卷Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量<50kg箱产量≥50kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.附:P(K2≥k0)0.0500.0100.001k03.8416.63510.828K2=eq\f(nad-bc2,a+bc+da+cb+d).解:(1)旧养殖法的箱产量低于50kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62.因此,事件A的概率估计值为0.62.(2)根据箱产量的频率分布直方图得列联表箱产量<50kg箱产量≥50kg旧养殖法6238新养殖法3466根据表中数据及K2的计算公式得,K2=eq\f(200×62×66-34×382,100×100×96×104)≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50kg到55kg之间,旧养殖法的箱产量平均值(或中位数)在45kg到50kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.[解题师说]2个明确(1)明确两类主体;(2)明确研究的两个问题2个关键(1)准确画出2×2列联表;(2)准确求解K23个步骤(1)根据样本数据制成2×2列联表;(2)根据公式K2=eq\f(nad-bc2,a+bc+da+cb+d),计算K2的值;(3)查表比较K2与临界值的大小关系,作统计判断[冲关演练]1.某校拟在高一年级开设英语口语选修课,该年级男生600人,女生480人.按性别分层抽样,抽取90名同学做意向调查.(1)求抽取的90名同学中的男生人数;(2)将下列2×2列联表补充完整,并判断能否在犯错误的概率不超过0.025的前提下认为“该校高一学生是否愿意选修英语口语课程与性别有关”?愿意选修英语口语课程不愿意选修英语口语课程总计男生25女生总计35附:K2=eq\f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.P(K2≥k0)0.1000.0500.0250.0100.005k02.7063.8415.0246.6357.879解:(1)该校高一年级的男、女生之比为600∶480=5∶4,所以按照分层抽样,男生应抽取50名.(2)2×2列联表如下:愿意选修英语口语课程不愿意选修英语口语课程总计男生252550女生301040总计553590由K2=eq\f(nad-bc2,a+bc+da+cb+d),代入数据得K2=eq\f(90×25×10-25×302,50×40×55×35)=eq\f(450,77)≈5.844>5.024.所以在犯错误的概率不超过0.025的前提下可以认为“该校高一学生是否愿意选修英语口语课程与性别有关”.2.已知某班n名同学的数学测试成绩(单位:分,满分100分)的频率分布直方图如图所示,其中a,b,c成等差数列,且成绩在[90,100]内的有6人.(1)求n的值;(2)规定60分以下为不及格,若不及格的人中女生有4人,而及格的人中,男生比女生少4人,借助独立性检验分析能否在犯错误的概率不超过0.010的前提下认为“本次测试的及格情况与性别有关”?附:P(K2≥k0)0.100.050.0100.005k02.7063.8416.6357.879K2=eq\f(nad-bc2,a+bc+da+cb+d).解:(1)依题意得eq\b\lc\{\rc\(\a\vs4\al\co1(100.035+0.025+c+2b+a=1,,2b=a+c,))解得b=0.01.因为成绩在[90,100]内的有6人,所以n=eq\f(6,0.01×10)=60.(2)由于2b=a+c,而b=0.01,可得a+c=0.02,则不及格的人数为0.02×10×60=12,及格的人数为60-12=48,设及格的人中,女生有x人,则男生有x-4人,于是x+x-4=48,解得x=26,故及格的人中,女生有26人,男生有22人.于是本次测试的及格情况与性别的2×2列联表如下:及格不及格总计男22830女26430总计481260所以K2=eq\f(60×22×4-8×262,30×30×48×12)=1.667<2.706,故不能在犯错误的概率不超过0.010的前提下认为“本次测试的及格情况与性别有关”.(一)普通高中适用作业A级——基础小题练熟练快1.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y与x负相关且eq\o(y,\s\up6(^))=2.347x-6.423;②y与x负相关且eq\o(y,\s\up6(^))=-3.476x+5.648;③y与x正相关且eq\o(y,\s\up6(^))=5.437x+8.493;④y与x正相关且eq\o(y,\s\up6(^))=-4.326x-4.578.其中一定不正确的结论的序号是()A.①② B.②③C.③④ D.①④解析:选D正相关指的是y随x的增大而增大,负相关指的是y随x的增大而减小,故不正确的为①④.2.下列说法错误的是()A.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B.在线性回归分析中,相关系数r的值越大,变量间的相关性越强C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D.在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好解析:选B根据相关关系的概念知A正确;当r>0时,r越大,相关性越强,当r<0时,r越大,相关性越弱,故B不正确;对于一组数据的拟合程度的好坏的评价,一是残差点分布的带状区域越窄,拟合效果越好.二是R2越大,拟合效果越好,所以R2为0.98的模型比R2为0.80的模型拟合的效果好,C、D正确,故选B.3.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=eq\f(1,2)x+1上,则这组样本数据的样本相关系数为()A.-1 B.0C.eq\f(1,2) D.1解析:选D因为所有样本点都在直线y=eq\f(1,2)x+1上,所以这组样本数据完全正相关,故其相关系数为1.4.某考察团对10个城市的职工人均工资x(千元)与居民人均消费y(千元)进行调查统计,得出y与x具有线性相关关系,且线性回归方程为eq\o(y,\s\up6(^))=0.6x+1.2.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为()A.66% B.67%C.79% D.84%解析:选D∵y与x具有线性相关关系,且满足回归方程eq\o(y,\s\up6(^))=0.6x+1.2,该城市居民人均工资为eq\x\to(x)=5,∴可以估计该城市的职工人均消费水平eq\x\to(y)=0.6×5+1.2=4.2,∴可以估计该城市人均消费额占人均工资收入的百分比为eq\f(4.2,5)=84%.5.某产品生产厂家的市场部在对4家商场进行调研时,获得该产品售价x(单位:元)和销售量y(单位:件)之间的四组数据如下表:售价x(元)44.55.56销售量y(件)1211109为决策产品的市场指导价,用最小二乘法求得销售量y与售价x之间的线性回归方程为eq\o(y,\s\up6(^))=-1.4x+eq\o(a,\s\up6(^)),那么方程中的eq\o(a,\s\up6(^))值为()A.17 B.17.5C.18 D.18.5解析:选Beq\x\to(x)=eq\f(4+4.5+5.5+6,4)=5,eq\x\to(y)=eq\f(12+11+10+9,4)=10.5,∵回归直线过样本点的中心(eq\x\to(x),eq\x\to(y)),代入线性回归方程eq\o(y,\s\up6(^))=-1.4x+eq\o(a,\s\up6(^)),得eq\o(a,\s\up6(^))=10.5+1.4×5=17.5.6.(2018·江西九校联考)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.非一线一线总计愿生452065不愿生132235总计5842100由K2=eq\f(nad-bc2,a+bc+da+cb+d),得K2=eq\f(100×45×22-20×132,65×35×58×42)≈9.616.参照下表,P(K2≥k0)0.0500.0100.001k03.8416.63510.828下列说法中,正确的结论是()A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C.有99%以上的把握认为“生育意愿与城市级别有关”D.有99%以上的把握认为“生育意愿与城市级别无关”解析:选C∵K2≈9.616>6.635,∴有99%以上的把握认为“生育意愿与城市级别有关”.7.经调查某地若干户家庭的年收入x(万元)和年饮食支出y(万元)具有线性相关关系,并得到y关于x的线性回归直线方程:eq\o(y,\s\up6(^))=0.245x+0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:x变为x+1,eq\o(y,\s\up6(^))=0.245(x+1)+0.321=0.245x+0.321+0.245,因此家庭年收入每增加1万元,年饮食支出平均增加0.245万元.答案:0.2458.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了如下对照表:气温(℃)181310-1用电量(度)24343864由表中数据得线性回归直线方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))中的eq\o(b,\s\up6(^))=-2,预测当气温为-4℃时,用电量为________度.解析:回归直线过点(eq\x\to(x),eq\x\to(y)),根据题意得eq\x\to(x)=eq\f(18+13+10+-1,4)=10,eq\x\to(y)=eq\f(24+34+38+64,4)=40,将(10,40)代入eq\o(y,\s\up6(^))=-2x+eq\o(a,\s\up6(^)),解得eq\o(a,\s\up6(^))=60,则eq\o(y,\s\up6(^))=-2x+60,当x=-4时,eq\o(y,\s\up6(^))=(-2)×(-4)+60=68,即当气温为-4℃时,用电量约为68度.答案:689.已知某次考试之后,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩(单位:分)对应如下表:学生编号12345678数学成绩6065707580859095物理成绩7277808488909395给出散点图如下:根据以上信息,判断下列结论:①根据散点图,可以判断数学成绩与物理成绩具有线性相关关系;②根据散点图,可以判断数学成绩与物理成绩具有一次函数关系;③从全班随机抽取甲、乙两名同学,若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩一定比乙同学的物理成绩高.其中正确的个数为________.解析:由散点图知,各点都分布在一条直线附近,故可以判断数学成绩与物理成绩具有线性相关关系,但不能判断数学成绩与物理成绩具有一次函数关系,故①正确,②错误;若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩可能比乙同学的物理成绩高,故③错误.综上,正确的个数为1.答案:1B级——中档题目练通抓牢1.为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班学生的两科成绩得到如图所示的散点图(x轴,y轴的单位长度相同),用回归直线方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))近似地刻画其相关关系,根据图形,以下结论最有可能成立的是()A.线性相关关系较强,eq\o(b,\s\up6(^))的值为1.25B.线性相关关系较强,eq\o(b,\s\up6(^))的值为0.83C.线性相关关系较强,eq\o(b,\s\up6(^))的值为-0.87D.线性相关关系较弱,无研究价值解析:选B由散点图可以看出两个变量所构成的点在一条直线附近,所以线性相关关系较强,且应为正相关,所以回归直线方程的斜率应为正数,且从散点图观察,回归直线方程的斜率应该比y=x的斜率要小一些,综上可知应选B.2.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元)8.28.610.011.311.9支出y(万元)6.27.58.08.59.8根据上表可得回归直线方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),其中eq\o(b,\s\up6(^))=0.76,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x).据此估计,该社区一户年收入为15万元家庭的年支出为()A.11.4万元 B.11.8万元C.12.0万元 D.12.2万元解析:选B由题意知,eq\x\to(x)=eq\f(8.2+8.6+10.0+11.3+11.9,5)=10,eq\x\to(y)=eq\f(6.2+7.5+8.0+8.5+9.8,5)=8,∴eq\o(a,\s\up6(^))=8-0.76×10=0.4,∴当x=15时,eq\o(y,\s\up6(^))=0.76×15+0.4=11.8(万元).3.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘”能做到“光盘”男4510女3015则下面的正确结论是()附表及公式:P(K2≥k0)0.1000.0500.0100.001k02.7063.8416.63510.828K2=eq\f(nad-bc2,a+bc+da+cb+d),n=a+b+c+d.A.有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”D.有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”解析:选A由列联表得到a=45,b=10,c=30,d=15,则a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100,计算得K2的观测值k=eq\f(nad-bc2,a+bc+da+cb+d)=eq\f(100×675-3002,55×45×75×25)≈3.030.因为2.706<3.030<3.841,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”.4.在2018年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如下表所示:价格x(元)99.5m10.511销售量y(件)11n865由散点图可知,销售量y与价格x之间有较强的线性相关关系,其线性回归方程是eq\o(y,\s\up6(^))=-3.2x+40,且m+n=20,则其中的n=________.解析:eq\x\to(x)=eq\f(9+9.5+m+10.5+11,5)=8+eq\f(m,5),eq\x\to(y)=eq\f(11+n+8+6+5,5)=6+eq\f(n,5),回归直线一定经过样本点中心(eq\x\to(x),eq\x\to(y)),即6+eq\f(n,5)=-3.2eq\b\lc\(\rc\)(\a\vs4\al\co1(8+\f(m,5)))+40,即3.2m+n=42.又因为m+n=20,即eq\b\lc\{\rc\(\a\vs4\al\co1(3.2m+n=42,,m+n=20,))解得eq\b\lc\{\rc\(\a\vs4\al\co1(m=10,,n=10,))故n=10.答案:105.某炼钢厂废品率x(%)与成本y(元/吨)的线性回归直线方程为eq\o(y,\s\up6(^))=105.492+42.569x.当成本控制在176.5元/吨时,可以预计生产的1000吨钢中,约有________吨钢是废品(结果保留两位小数).解析:因为176.5=105.492+42.569x,解得x≈1.668,即当成本控制在176.5元/吨时,废品率约为1.668%,所以生产的1000吨钢中,约有1000×1.668%=16.68吨是废品.答案:16.686.(2018·合肥模拟)某校计划面向高一年级1200名学生开设校本选修课程,为确保工作的顺利实施,先按性别进行分层抽样,抽取了180名学生对社会科学类、自然科学类这两大类校本选修课程进行选课意向调查,其中男生有105人.在这180名学生中选择社会科学类的男生、女生均为45人.(1)分别计算抽取的样本中男生及女生选择社会科学类的频率,并以统计的频率作为概率,估计实际选课中选择社会科学类学生的人数;(2)根据抽取的180名学生的调查结果,完成下列2×2列联表.并判断能否在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关?选择自然科学类选择社会科学类总计男生女生总计附:K2=eq\f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.P(K2≥k0)0.100.050.0250.0100.0050.001k02.7063.8415.0246.6357.87910.828解:(1)由条件知,抽取的男生有105人,女生有180-105=75(人).男生选择社会科学类的频率为eq\f(45,105)=eq\f(3,7),女生选择社会科学类的频率为eq\f(45,75)=eq\f(3,5).由题意,男生总人数为1200×eq\f(105,180)=700,女生总人数为1200×eq\f(75,180)=500.所以估计实际选课中选择社会科学类的学生人数为700×eq\f(3,7)+500×eq\f(3,5)=600.(2)根据统计数据,可得2×2列联表如下:选择自然科学类选择社会科学类总计男生6045105女生304575总计9090180所以K2=eq\f(180×60×45-30×452,105×75×90×90)≈5.143>5.024,所以在犯错误的概率不超过0.025的前提下可以认为科类的选择与性别有关.7.某地区2011年至2017年农村居民家庭纯收入y(单位:万元)的数据如下表:年份2011201220132014201520162017年份代号t(年)1234567人均纯收入y(万元)2.93.33.64.44.85.25.9(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2011年至2017年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2019年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:eq\o(b,\s\up6(^))=eq\f(\a\vs4\al(\i\su(i=1,n,)ti-\x\to(t)yi-\x\to(y)),\a\vs4\al(\i\su(i=1,n,)ti-\x\to(t)2)),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(t).解:(1)由所给数据计算得eq\x\to(t)=eq\f(1,7)(1+2+3+4+5+6+7)=4,eq\x\to(y)=eq\f(1,7)(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,eq\i\su(i=1,7,)(ti-eq\x\to(t))2=9+4+1+0+1+4+9=28,eq\i\su(i=1,7,)(ti-eq\x\to(t))(yi-eq\x\to(y))=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,eq\o(b,\s\up6(^))=eq\f(\a\vs4\al(\i\su(i=1,7,)ti-\x\to(t)yi-\x\to(y)),\a\vs4\al(\i\su(i=1,7,)ti-\x\to(t)2))=eq\f(14,28)=0.5,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(t)=4.3-0.5×4=2.3,所求回归方程为eq\o(y,\s\up6(^))=0.5t+2.3.(2)由(1)知,eq\o(b,\s\up6(^))=0.5>0,故2011年至2017年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5万元.将2019年的年份代号t=9代入(1)中的回归方程,得eq\o(y,\s\up6(^))=0.5×9+2.3=6.8,故预测该地区2019年农村居民家庭人均纯收入为6.8万元.C级——重难题目自主选做1.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.eq\x\to(x)eq\x\to(y)eq\x\to(w)eq\i\su(i=1,8,)(xi-eq\x\to(x))2eq\i\su(i=1,8,)(wi-eq\x\to(w))2eq\i\su(i=1,8,)(xi-eq\x\to(x))(yi-eq\x\to(y))eq\i\su(i=1,8,)(wi-eq\x\to(w))(yi-eq\x\to(y))46.65636.8289.81.61469108.8表中wi=eq\r(xi),eq\x\to(w)=eq\f(1,8)eq\i\su(i=1,8,w)i.(1)根据散点图判断,y=a+bx与y=c+deq\r(x)哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程.(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:①年宣传费x=49时,年销售量及年利润的预报值是多少?②年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为eq\o(β,\s\up6(^))=eq\f(\i\su(i=1,n,)ui-\x\to(u)vi-\x\to(v),\i\su(i=1,n,)ui-\x\to(u)2),eq\o(α,\s\up6(^))=eq\x\to(v)-eq\o(β,\s\up6(^))eq\x\to(u).解:(1)由散点图可以判断,y=c+deq\r(x)适宜作为年销售量y关于年宣传费x的回归方程类型.(2)令w=eq\r(x),先建立y关于w的线性回归方程.由于eq\o(d,\s\up6(^))=eq\f(\i\su(i=1,8,)wi-\x\to(w)yi-\x\to(y),\i\su(i=1,8,)wi-\x\to(w)2)=eq\f(108.8,1.6)=68,eq\o(c,\s\up6(^))=eq\x\to(y)-eq\o(d,\s\up6(^))eq\x\to(w)=563-68×6.8=100.6,所以y关于w的线性回归方程eq\o(y,\s\up6(^))=100.6+68w,因此y关于x的回归方程为eq\o(y,\s\up6(^))=100.6+68eq\r(x).(3)①由(2)知,当x=49时,年销售量y的预报值eq\o(y,\s\up6(^))=100.6+68eq\r(49)=576.6,年利润z的预报值eq\o(z,\s\up6(^))=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z的预报值eq\o(z,\s\up6(^))=0.2(100.6+68eq\r(x))-x=-x+13.6eq\r(x)+20.12.所以当eq\r(x)=eq\f(13.6,2)=6.8,即x=46.24时,eq\o(z,\s\up6(^))取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.2.为了了解某学校高二年级学生的物理成绩,从中抽取n名学生的物理成绩(百分制)作为样本,按成绩分成5组:[50,60),[60,70),[70,80),[80,90),[90,100],频率分布直方图如图所示,成绩落在[70,80)中的人数为20.(1)求a和n的值;(2)根据样本估计总体的思想,估计该校高二学生物理成绩的平均数eq\o(x,\s\up6(-))和中位数m;(3)成绩在80分以上(含80分)为优秀,样本中成绩落在[50,80)中的男、女生人数比为1∶2,成绩落在[80,100)中的男、女生人数比为3∶2,完成2×2列联表,并判断能否在犯错误的概率不超过0.05的前提下认为物理成绩优秀与性别有关.男生女生合计优秀不优秀合计附:参考公式和数据:K2=eq\f(nad-bc2,a+bc+da+cb+d),P(K2≥k0)0.500.050.0250.005k00.4553.8415.0247.879解:(1)由题意得10a=1-(0.005+0.01+0.015+0.02)×解得a=0.05,则n=eq\f(20,10×0.05)=40.(2)由频率分布直方图可知各组的频率分别为0.05,0.2,0.5,0.15,0.1,所以eq\o(x,\s\up6(-))=55×0.05+65×0.2+75×0.5+85×0.15+95×0.1=75.5,(m-70)×0.05=0.5-(0.05+0.2),得m=75.(3)由频率分布直方图可知成绩优秀的人数为40×(0.015+0.01)×10=10,则不优秀的人数为40-10=30.所以优秀的男生为6人,女生为4人;不优秀的男生为10人,女生为20人.所以2×2列联表如下:男生女生总计优秀6410不优秀102030总计162440所以K2=eq\f(40×6×20-4×102,16×24×10×30)≈2.222<3.841,所以在犯错误的概率不超0.05的前提下不能认为物理成绩优秀与性别有关.(二)重点高中适用作业A级——保分题目巧做快做1.在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,并制作成如图所示的人体脂肪含量与年龄关系的散点图.根据该图,下列结论中正确的是()A.人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%B.人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%C.人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%D.人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%解析:选B因为散点图呈现上升趋势,故人体脂肪含量与年龄正相关;因为中间两个数据大约介于15%到20%之间,故脂肪含量的中位数小于20%.2.某同学为了解自己记忆成语的个数与所花费的时间(单位:秒)的关系,做了5次试验,收集到的数据如表所示,由最小二乘法求得的回归直线方程为eq\o(y,\s\up6(^))=0.74x+50.成语个数x(个)1020304050记忆时间y(秒)61mn8189则m+n的值为()A.130 B.129C.121 D.118解析:选A由表中数据得,eq\x\to(x)=30,eq\x\to(y)=eq\f(1,5)(61+m+n+81+89)=eq\f(1,5)(231+m+n),将eq\x\to(x)=30,eq\x\to(y)=eq\f(1,5)(231+m+n)代入回归直线方程,得m+n=130.3.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=eq\f(1,2)x+1上,则这组样本数据的样本相关系数为()A.-1 B.0C.eq\f(1,2) D.1解析:选D因为所有样本点都在直线y=eq\f(1,2)x+1上,所以这组样本数据完全正相关,故其相关系数为1.4.某考察团对10个城市的职工人均工资x(千元)与居民人均消费y(千元)进行调查统计,得出y与x具有线性相关关系,且线性回归方程为eq\o(y,\s\up6(^))=0.6x+1.2.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为()A.66% B.67%C.79% D.84%解析:选D∵y与x具有线性相关关系,且满足回归方程eq\o(y,\s\up6(^))=0.6x+1.2,该城市居民人均工资为eq\x\to(x)=5,∴可以估计该城市的职工人均消费水平eq\x\to(y)=0.6×5+1.2=4.2,∴可以估计该城市人均消费额占人均工资收入的百分比为eq\f(4.2,5)=84%.5.(2018·长沙一模)某研究型学习小组调查研究学生使用智能对学习的影响,部分统计数据如下表:使用智能不使用智能总计学习成绩优秀4812学习成绩不优秀16218总计201030附表:P(K2≥k0)0.100.050.0100.0050.001k02.7063.8416.6357.87910.828经计算K2=10,则下列选项正确的是()A.有99.5%的把握认为使用智能对学习有影响B.有99.5%的把握认为使用智能对学习无影响C.有99.9%的把握认为使用智能对学习有影响D.有99.9%的把握认为使用智能对学习无影响解析:选A依题意,注意到7.879<K2<10.828,因此有99.5%的把握认为使用智能对学习有影响.6.经调查某地若干户家庭的年收入x(万元)和年饮食支出y(万元)具有线性相关关系,并得到y关于x的线性回归直线方程:eq\o(y,\s\up6(^))=0.245x+0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:x变为x+1,eq\o(y,\s\up6(^))=0.245(x+1)+0.321=0.245x+0.321+0.245,因此家庭年收入每增加1万元,年饮食支出平均增加0.245万元.答案:0.2457.已知某次考试之后,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩(单位:分)对应如下表:学生编号12345678数学成绩6065707580859095物理成绩7277808488909395给出散点图如下:根据以上信息,判断下列结论:①根据散点图,可以判断数学成绩与物理成绩具有线性相关关系;②根据散点图,可以判断数学成绩与物理成绩具有一次函数关系;③从全班随机抽取甲、乙两名同学,若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩一定比乙同学的物理成绩高.其中正确的个数为________.解析:由散点图知,各点都分布在一条直线附近,故可以判断数学成绩与物理成绩具有线性相关关系,但不能判断数学成绩与物理成绩具有一次函数关系,故①正确,②错误;若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩可能比乙同学的物理成绩高,故③错误.综上,正确的个数为1.答案:18.某品牌牛奶的广告费用x与销售额的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))中的eq\o(b,\s\up6(^))为9.4,据此模型预报广告费用为7万元时销售额为________万元.解析:因为eq\x\to(x)=eq\f(4+2+3+5,4)=eq\f(7,2),eq\x\to(y)=eq\f(49+26+39+54,4)=42,由题意可得回归方程为eq\o(y,\s\up6(^))=9.4x+eq\o(a,\s\up6(^)),因为回归直线一定经过样本中心(eq\x\to(x),eq\x\to(y)),所以42=9.4×eq\f(7,2)+eq\o(a,\s\up6(^)),解得eq\o(a,\s\up6(^))=9.1,所以回归方程为eq\o(y,\s\up6(^))=9.4x+9.1,当x=7时,销售额为eq\o(y,\s\up6(^))=9.4×7+9.1=74.9(万元).答案:74.99.(2018·长春质检)为了打好脱贫攻坚战,某贫困县农科院针对玉米种植情况进行调研,力争有效地改良玉米品种,为农民提供技术支援.现对已选出的一组玉米的茎高进行统计,获得茎叶图如图(单位:厘米),设茎高大于或等于180厘米的玉米为高茎玉米,否则为矮茎玉米.(1)列出2×2列联表,并判断能否在犯错误的概率不超过0.01的前提下,认为抗倒伏与玉米矮茎有关系?(2)为了改良玉米品种,现采用分层抽样的方法从抗倒伏的玉米中抽出5株,再从这5株玉米中选取2株进行杂交试验,则选取的植株均为矮茎的概率是多少?附:P(K2≥k0)0.100.050.0100.0050.001k02.7063.8416.6357.87910.828附:K2=eq\f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.解:(1)根据统计数据得2×2列联表如下:抗倒伏易倒伏总计矮茎15419高茎101626总计252045由于K2=eq\f(45×15×16-4×102,19×26×25×20)≈7.287>6.635,因此能在犯错误的概率不超过0.01的前提下,认为抗倒伏与玉米矮茎有关.(2)由题意得,抽到的高茎玉米有2株,设为A,B,抽到的矮茎玉米有3株,设为a,b,c,从这5株玉米中取出2株的取法有AB,Aa,Ab,Ac,Ba,Bb,Bc,ab,ac,bc,共10种,其中均为矮茎的选取方法有ab,ac,bc,共3种,因此选取的植株均为矮茎的概率是eq\f(3,10).10.某测试团队为了研究“饮酒”对“驾车安全”的影响,随机选取100名驾驶员先后在无酒状态、酒后状态下进行“停车距离”测试.测试的方案:电脑模拟驾驶,以某速度匀速行驶,记录下驾驶员的“停车距离”(驾驶员从看到意外情况到车子完全停下所需要的距离).无酒状态与酒后状态下的试验数据分别列于表1和表2.表1:无酒状态停车距离d(米)(10,20](20,30](30,40](40,50](50,60]频数26mn82表2:酒后状态平均每毫升血液酒精含量x(毫克)1030507090平均停车距离y(米)3050607090已知表1数据的中位数估计值为26,回答以下问题.(1)求m,n的值,并估计驾驶员无酒状态下停车距离的平均数;(2)根据最小二乘法,由表2的数据计算y关于x的回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^));(3)该测试团队认为:驾驶员酒后驾车的平均“停车距离”y大于(1)中无酒状态下的停车距离平均数的3倍,则认定驾驶员是“醉驾”.请根据(2)中的回归方程,预测当每毫升血液酒精含量大于多少毫克时为“醉驾”?(附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))的斜率和截距的最小二乘估计分别为eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,n,)xi-\x\to(x)2)=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x))解:(1)依题意,得eq\f(6,10)m=50-26,解得m=40,又m+n+36=100,解得n=24.故停车距离的平均数为15×eq\f(26,100)+25×eq\f(40,100)+35×eq\f(24,100)+45×eq\f(8,100)+55×eq\f(2,100)=27.(2)依题意,可知eq\x\to(x)=50,eq\x\to(y)=60,eq\i\su(i=1,5,x)iyi=10×30+30×50+50×60+70×70+90×90=17800,eq\i\su(i=1,5,x)eq\o\al(2,i)=102+302+502+702+902=16500,所以eq\o(b,\s\up6(^))=eq\f(17800-5×50×60,16500-5×502)=0.7,eq\o(a,\s\up6(^))=60-0.7×50=25,所以回归直线方程为eq\o(y,\s\up6(^))=0.7x+25.(3)由(1)知当y>81时认定驾驶员是“醉驾”.令eq\o(y,\s\up6(^))>81,得0.7x+25>81,解得x>80,当每毫升血液酒精含量大于80毫克时认定为“醉驾”.B级——拔高题目稳做准做1.为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班学生的两科成绩得到如图所示的散点图(x轴,y轴的单位长度相同),用回归直线方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))近似地刻画其相关关系,根据图形,以下结论最有可能成立的是()A.线性相关关系较强,eq\o(b,\s\up6(^))的值为1.25B.线性相关关系较强,eq\o(b,\s\up6(^))的值为0.83C.线性相关关系较强,eq\o(b,\s\up6(^))的值为-0.87D.线性相关关系较弱,无研究价值解析:选B由散点图可以看出两个变量所构成的点在一条直线附近,所以线性相关关系较强,且应为正相关,所以回归直线方程的斜率应为正数,且从散点图观察,回归直线方程的斜率应该比y=x的斜率要小一些,综上可知应选B.2.已知某产品的广告费用x(单位:万元)与销售额y(单位:万元)具有线性相关关系,其统计数据如下表:x3456y25304045由上表可得线性回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),据此模型预测广告费用为8万元时的销售额是()A.59.5万元 B.52.5万元C.56万元 D.63.5万元解析:选A由表可得,eq\x\to(x)=4.5,eq\x\to(y)=35,eq\i\su(i=1,4,)(xi-eq\x\to(x))(yi-eq\x\to(y))=(-1.5)×(-10)+(-0.5)×(-5)+0.5×5+1.5×10=35,eq\i\su(i=1,4,)(xi-eq\x\to(x))2=(-1.5)2+(-0.5)2+0.52+1.52=5,所以eq\o(b,\s\up6(^))=eq\f(35,5)=7,eq\o(a,\s\up6(^))=35-7×4.5=3.5,故其线性回归直线方程为eq\o(y,\s\up6(^))=7x+3.5,当x=8时,eq\o(y,\s\up6(^))=7×8+3.5=59.5.3.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘”能做到“光盘”男4510女3015则下面的正确结论是()附表及公式:P(K2≥k0)0.1000.0500.0100.001k02.7063.8416.63510.828K2=eq\f(nad-bc2,a+bc+da+cb+d),n=a+b+c+d.A.有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”D.有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”解析:选A由列联表得到a=45,b=10,c=30,d=15,则a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100,计算得K2的观测值k=eq\f(nad-bc2,a+bc+da+cb+d)=eq\f(100×675-3002,55×45×75×25)≈3.030.因为2.706<3.030<3.841,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”.4.在2018年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如下表所示:价格x(元)99.5m10.511销售量y(件)11n865由散点图可知,销售量y与价格x之间有较强的线性相关关系,其线性回归方程是eq\o(y,\s\up6(^))=-3.2x+40,且m+n=20,则其中的n=________.解析:eq\x\to(x)=eq\f(9+9.5+m+10.5+11,5)=8+eq\f(m,5),eq\x\to(y)=eq\f(11+n+8+6+5,5)=6+eq\f(n,5),回归直线一定经过样本点中心(eq\x\to(x),eq\x\to(y)),即6+eq\f(n,5)=-3.2eq\b\lc\(\rc\)(\a\vs4\al\co1(8+\f(m,5)))+40,即3.2m+n=42.又因为m+n=20,即eq\b\lc\{\rc\(\a\vs4\al\co1(3.2m+n=42,,m+n=20,))解得eq\b\lc\{\rc\(\a\vs4\al\co1(m=10,,n=10,))故n=10.答案:105.从2009年淘宝创立“双十一”以来,到2017年,“双十一”已经走过了九个年头,随着消费者消费水平越来越高,低价已经不再是最核心的要素,消费者对于品质的追求也越来越高.据美国《福布斯》双周刊网站2017年11月15日报道,“双十一”当天中国的线上交易额比巴西2017年全年的预估电子商务交易额都要多.某公司对“双十一”当天在淘宝购物的男、女各1000名消费者的消费金额(单位:千元)进行统计,得到了消费金额的频率分布直方图如下:(1)根据频率分布直方图,从在淘宝购物的这2000名消费者中任选一人,估计消费金额在2000元以上(包括2000元)的概率;(2)若“双十一”当天在淘宝上至少购买3000元商品,就称此消费者为“酷爱淘宝者”.列出“酷爱淘宝者”人数与消费者性别的2×2列联表,并确定能否

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论