旧教材适用2023高考数学一轮总复习第十章统计统计案例第3讲变量间的相关关系与统计案例_第1页
旧教材适用2023高考数学一轮总复习第十章统计统计案例第3讲变量间的相关关系与统计案例_第2页
旧教材适用2023高考数学一轮总复习第十章统计统计案例第3讲变量间的相关关系与统计案例_第3页
旧教材适用2023高考数学一轮总复习第十章统计统计案例第3讲变量间的相关关系与统计案例_第4页
旧教材适用2023高考数学一轮总复习第十章统计统计案例第3讲变量间的相关关系与统计案例_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3讲变量间的相关关系与统计案例1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非eq\o(□,\s\up3(01))确定性关系.(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为eq\o(□,\s\up3(02))正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为eq\o(□,\s\up3(03))负相关.2.回归方程与回归分析(1)线性相关关系与回归直线如果散点图中点的分布从整体上看大致在eq\o(□,\s\up3(04))一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程①最小二乘法:求回归直线使得样本数据的点到回归直线的eq\o(□,\s\up3(05))距离的平方和最小的方法叫做最小二乘法.②回归方程:方程eq\o(y,\s\up10(^))=eq\o(b,\s\up10(^))x+eq\o(a,\s\up10(^))是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中eq\o(a,\s\up10(^)),eq\o(b,\s\up10(^))是待定数.eq\b\lc\{\rc\(\a\vs4\al\co1(\o(b,\s\up10(^))=\f(\i\su(i=1,n,)xi-\o(x,\s\up10(-))yi-\o(y,\s\up10(-)),\i\su(i=1,n,)xi-\o(x,\s\up10(-))2)=\f(\i\su(i=1,n,x)iyi-n\o(x,\s\up10(-))\o(y,\s\up10(-)),\i\su(i=1,n,x)\o\al(2,i)-n\o(x,\s\up10(-))2),,\o(a,\s\up10(^))=\o(y,\s\up10(-))-\o(b,\s\up10(^))\o(x,\s\up10(-)).))(3)回归分析①定义:对具有eq\o(□,\s\up3(06))相关关系的两个变量进行统计分析的一种常用方法.②样本点的中心:在具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn)中,eq\o(x,\s\up10(-))=eq\f(1,n)(x1+…+xn),eq\o(y,\s\up10(-))=eq\f(1,n)(y1+…+yn),eq\o(a,\s\up10(^))=eq\o(y,\s\up10(-))-eq\o(b,\s\up10(^))eq\o(x,\s\up10(-)),(eq\o(x,\s\up10(-)),eq\o(y,\s\up10(-)))称为样本点的中心.③相关系数r=eq\f(\i\su(i=1,n,)xi-\o(x,\s\up10(-))yi-\o(y,\s\up10(-)),\r(\i\su(i=1,n,)xi-\o(x,\s\up10(-))2\i\su(i=1,n,)yi-\o(y,\s\up10(-))2)),当r>0时,两变量eq\o(□,\s\up3(07))正相关;当r<0时,两变量eq\o(□,\s\up3(08))负相关;当|r|≤1且|r|越接近于1时,相关程度eq\o(□,\s\up3(09))越强;当|r|≤1且|r|越接近于0时,相关程度eq\o(□,\s\up3(10))越弱.3.独立性检验(1)独立性检验的有关概念①分类变量可用变量的不同“值”表示个体所属的eq\o(□,\s\up3(11))不同类别的变量称为分类变量.②2×2列联表假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d(2)独立性检验利用随机变量K2=eq\f(nad-bc2,a+bc+da+cb+d)(其中n=a+b+c+d为样本容量)来判断“两个变量有关系”的方法称为独立性检验.步骤如下:①计算随机变量K2的观测值k,查表确定临界值k0:P(K2≥k0)0.50.400.250.150.10k00.4550.7081.3232.0722.706P(K2≥k0)0.050.0250.0100.0050.001k03.8415.0246.6357.87910.828②如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过P(K2≥k0);否则,就认为在犯错误的概率不超过P(K2≥k0)的前提下不能推断“X与Y有关系”.1.求解回归方程的关键是确定eq\o(a,\s\up10(^)),eq\o(b,\s\up10(^)),应充分利用回归直线过样本点的中心(eq\o(x,\s\up10(-)),eq\o(y,\s\up10(-))).2.根据回归方程计算的eq\o(y,\s\up10(^))值,仅是一个预报值,不是真实发生的值.3.根据K2的值可以判断两个分类变量有关的可信程度,若K2越大,则两分类变量有关的把握越大.1.下面是一个2×2列联表:y1y2总计x1a2173x2222547总计b46120其中a,b处填的值分别为()A.94,72 B.52,50C.52,74 D.74,52答案C解析由a+21=73,得a=52,a+22=b,得b=74.故选C.2.甲、乙、丙、丁四位同学各自对A,B两个变量的线性相关性做了试验,并用回归分析方法分别求得相关系数r与残差平方和m,如下表:甲乙丙丁r0.820.780.690.85m106115124103则哪位同学的试验结果体现的A,B两变量有更强的线性相关性()A.甲 B.乙C.丙 D.丁答案D解析r越大,m越小,线性相关性越强,故选D.3.(2022·郑州一中月考)变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()A.r2<r1<0 B.0<r2<r1C.r2<0<r1 D.r2=r1答案C解析对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关,即r1>0;对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r2<0,故选C.4.通过随机询问110名不同的大学生是否爱好某项运动,得到了如下的列联表.参照附表,能得到的正确结论是()男女总计爱好402060不爱好203050总计6050110A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”附:K2=eq\f(nad-bc2,a+bc+da+cb+d),n=a+b+c+d.P(K2≥k0)0.050.0100.001k03.8416.63510.828答案A解析由列联表中的数据可得K2=eq\f(110×40×30-20×202,60×50×60×50)≈7.822>6.635,故有99%以上的把握认为“爱好该项运动与性别有关”.故选A.5.(2021·山西太原模拟)某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程eq\o(y,\s\up10(^))=eq\o(b,\s\up10(^))x+eq\o(a,\s\up10(^))中的eq\o(b,\s\up10(^))为9.4,据此模型预测广告费用为6万元时销售额约为________万元.答案65.5解析由表可计算eq\o(x,\s\up10(-))=eq\f(4+2+3+5,4)=3.5,eq\o(y,\s\up10(-))=eq\f(49+26+39+54,4)=42,因为点(3.5,42)在回归直线eq\o(y,\s\up10(^))=eq\o(b,\s\up10(^))x+eq\o(a,\s\up10(^))上,且eq\o(b,\s\up10(^))=9.4,所以42=9.4×3.5+eq\o(a,\s\up10(^)),解得eq\o(a,\s\up10(^))=9.1.故回归方程为eq\o(y,\s\up10(^))=9.4x+9.1.令x=6,得eq\o(y,\s\up10(^))=65.5.故预测广告费用为6万元时销售额约为65.5万元.6.(2021·安徽马鞍山模拟)某企业为了调查其产品在国内和国际市场的发展情况,随机抽取国内、国外各100名客户代表,了解他们对该企业产品的发展前景所持的态度,得到如图所示的等高条形图,则________(填“能”或“不能”)有99%的把握认为是否持乐观态度与国内外差异有关.P(K2≥k0)0.0500.0100.0050.001k03.8416.6357.87910.828附:K2=eq\f(nad-bc2,a+bc+da+cb+d).答案能解析根据题目所给数据得到如下2×2列联表:乐观不乐观总计国内代表6040100国外代表4060100总计100100200则K2=eq\f(200×60×60-40×402,100×100×100×100)=8>6.635,所以有99%的把握认为是否持乐观态度与国内外差异有关.精准设计考向,多角度探究突破考向一两个变量的相关性角度相关关系的判断例1观察下图所示的散点图,其中对两个变量的相关关系判断正确的是()A.a为正相关,b为负相关,c为不相关B.a为负相关,b为不相关,c为正相关C.a为负相关,b为正相关,c为不相关D.a为正相关,b为不相关,c为负相关答案D解析根据散点图,由相关性可知,a中各点分布在从左下角到右上角的区域里,是正相关;b中各点分布不是带状的,相关性不明确,所以不相关;c中各点分布在从左上角到右下角的区域里,是负相关.角度相关系数的意义例2(2021·南宁一中期末)某公司为了准确地把握市场,做好产品生产计划,对过去四年的数据进行整理得到了第x年与年销售量y(单位:万件)之间的关系如下表:x1234y12284256(1)在图中画出表中数据的散点图;(2)根据(1)中的散点图拟合y与x的回归模型,并用相关系数加以说明;(3)建立y关于x的回归方程,预测第5年的销售量约为多少?参考数据:eq\r(\o(∑,\s\up10(4),\s\do7(i=1))yi-\o(y,\s\up10(-))2)≈32.7,eq\r(5)≈2.24,eq\o(∑,\s\up10(4),\s\do7(i=1))xiyi=418.参考公式:相关系数r=eq\f(\o(∑,\s\up10(n),\s\do7(i=1))xi-\o(x,\s\up10(-))yi-\o(y,\s\up10(-)),\r(\o(∑,\s\up10(n),\s\do7(i=1))xi-\o(x,\s\up10(-))2\o(∑,\s\up10(n),\s\do7(i=1))yi-\o(y,\s\up10(-))2)),回归方程eq\o(y,\s\up10(^))=eq\o(a,\s\up10(^))+eq\o(b,\s\up10(^))x的斜率和截距的最小二乘估计分别为eq\o(b,\s\up10(^))=eq\f(\o(∑,\s\up10(n),\s\do7(i=1))xi-\o(x,\s\up10(-))yi-\o(y,\s\up10(-)),\o(∑,\s\up10(n),\s\do7(i=1))xi-\o(x,\s\up10(-))2)=eq\f(\o(∑,\s\up10(n),\s\do7(i=1))xiyi-n\o(x,\s\up10(-))\o(y,\s\up10(-)),\o(∑,\s\up10(n),\s\do7(i=1))x\o\al(2,i)-n\o(x,\s\up10(-))2),eq\o(a,\s\up10(^))=eq\o(y,\s\up10(-))-eq\o(b,\s\up10(^))eq\o(x,\s\up10(-)).解(1)作出散点图如图:(2)由(1)中的散点图可知,各点大致分布在一条直线附近,由题中所给表格及参考数据,得eq\o(x,\s\up10(-))=eq\f(5,2),eq\o(y,\s\up10(-))=eq\f(69,2),eq\o(∑,\s\up10(4),\s\do7(i=1))xiyi=418,eq\r(\o(∑,\s\up10(4),\s\do7(i=1))yi-\o(y,\s\up10(-))2)≈32.7,eq\o(∑,\s\up10(4),\s\do7(i=1))xeq\o\al(2,i)=30,eq\o(∑,\s\up10(4),\s\do7(i=1))(xi-eq\o(x,\s\up10(-)))(yi-eq\o(y,\s\up10(-)))=eq\o(∑,\s\up10(4),\s\do7(i=1))xiyi-4eq\o(x,\s\up10(-))eq\o(y,\s\up10(-))=418-4×eq\f(5,2)×eq\f(69,2)=73,eq\r(\o(∑,\s\up10(4),\s\do7(i=1))xi-\o(x,\s\up10(-))2)=eq\r(\o(∑,\s\up10(4),\s\do7(i=1))x\o\al(2,i)-4\o(x,\s\up10(-))2)=eq\r(30-4×\b\lc\(\rc\)(\a\vs4\al\co1(\f(5,2)))2)=eq\r(5)≈2.24,∴r=eq\f(\o(∑,\s\up10(4),\s\do7(i=1))xi-\o(x,\s\up10(-))yi-\o(y,\s\up10(-)),\r(\o(∑,\s\up10(4),\s\do7(i=1))xi-\o(x,\s\up10(-))2\o(∑,\s\up10(4),\s\do7(i=1))yi-\o(y,\s\up10(-))2))≈eq\f(73,2.24×32.7)≈0.9966.∵y与x的相关系数近似为0.9966,说明y与x的线性相关程度相当强,∴可以用线性回归模型拟合y与x的关系.(3)由(2),知eq\o(x,\s\up10(-))=eq\f(5,2),eq\o(y,\s\up10(-))=eq\f(69,2),eq\o(∑,\s\up10(4),\s\do7(i=1))xiyi=418,eq\o(∑,\s\up10(4),\s\do7(i=1))xeq\o\al(2,i)=30,∴eq\o(b,\s\up10(^))=eq\f(\o(∑,\s\up10(4),\s\do7(i=1))xiyi-4\o(x,\s\up10(-))\o(y,\s\up10(-)),\o(∑,\s\up10(4),\s\do7(i=1))x\o\al(2,i)-4\o(x,\s\up10(-))2)=eq\f(73,5),eq\o(a,\s\up10(^))=eq\o(y,\s\up10(-))-eq\o(b,\s\up10(^))eq\o(x,\s\up10(-))=eq\f(69,2)-eq\f(73,5)×eq\f(5,2)=-2.故y关于x的回归方程为eq\o(y,\s\up10(^))=eq\f(73,5)x-2.当x=5时,eq\o(y,\s\up10(^))=eq\f(73,5)×5-2=71,∴预测第5年的销售量约为71万件.判断相关关系的两种方法(1)散点图法:如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.(2)相关系数法:利用相关系数判定,|r|越趋近于1相关性越强.1.(2021·江西六校联考)对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3答案A解析易知题中图①与图③是正相关,图②与图④是负相关,且图①与图②中的样本点集中分布在一条直线附近,则r2<r4<0<r3<r1.2.为了监控某种零件的一条生产线的生产过程,检验员每隔30min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:抽取次序12345678零件尺寸9.9510.129.969.9610.019.929.9810.04抽取次序910111213141516零件尺寸10.269.9110.1310.029.2210.0410.059.95经计算得eq\o(x,\s\up10(-))=eq\f(1,16)eq\i\su(i=1,16,x)i=9.97,s=eq\r(\f(1,16)\i\su(i=1,16,)xi-\o(x,\s\up10(-))2)=eq\r(\f(1,16)\i\su(i=1,16,x)\o\al(2,i)-16\o(x,\s\up10(-))2)≈0.212,eq\r(\i\su(i=1,16,)i-8.52)≈18.439,eq\i\su(i=1,16,)(xi-eq\o(x,\s\up10(-)))(i-8.5)=-2.78,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.(1)求(xi,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在(eq\o(x,\s\up10(-))-3s,eq\o(x,\s\up10(-))+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①从这一天抽检的结果看,是否需对当天的生产过程进行检查?②在(eq\o(x,\s\up10(-))-3s,eq\o(x,\s\up10(-))+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(xi,yi)(i=1,2,…,n)的相关系数r=eq\f(\i\su(i=1,n,)xi-\o(x,\s\up10(-))yi-\o(y,\s\up10(-)),\r(\i\su(i=1,n,)xi-\o(x,\s\up10(-))2)\r(\i\su(i=1,n,)yi-\o(y,\s\up10(-))2)).参考数据:eq\r(0.008)≈0.09.解(1)由样本数据,得(xi,i)(i=1,2,…,16)的相关系数r=eq\f(\i\su(i=1,16,)xi-\o(x,\s\up10(-))i-8.5,\r(\i\su(i=1,16,)xi-\o(x,\s\up10(-))2)\r(\i\su(i=1,16,)i-8.52))≈eq\f(-2.78,0.212×\r(16)×18.439)≈-0.18.由于|r|<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)①由于eq\o(x,\s\up10(-))=9.97,s≈0.212,因此由样本数据可以看出抽取的第13个零件的尺寸在(eq\o(x,\s\up10(-))-3s,eq\o(x,\s\up10(-))+3s)以外,因此需对当天的生产过程进行检查.②剔除离群值,即第13个数据,剩下数据的平均数为eq\f(1,15)×(16×9.97-9.22)=10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02.eq\i\su(i=1,16,x)eq\o\al(2,i)≈16×0.2122+16×9.972≈1591.134,剔除第13个数据,剩下数据的样本方差为eq\f(1,15)×(1591.134-9.222-15×10.022)≈0.008,这条生产线当天生产的零件尺寸的标准差的估计值为eq\r(0.008)≈0.09.考向二回归分析例3在红外线照射下,组织温度升高,毛细血管扩张,血流加快,物质代谢增强,组织细胞活力及再生能力提高,因此红外线治疗仪对某些疾病的治疗有着很好的作用.某药店兼营某红外线治疗仪,经过近5个月的营销,对销售状况进行相关数据分析,发现月销售量与销售价格有关,统计数据如下表:每台红外线治疗仪的销售价格x/元140150160170180红外线治疗仪的月销售量y/台6455453526(1)根据表中数据求y关于x的线性回归方程;(2)①每台红外线治疗仪的价格为165元时,预测红外线治疗仪的月销售量;(四舍五入为整数)②若该红外线治疗仪的成本为120元/台,要使每月获得最大的纯收益,利用(1)中结论,问每台红外线治疗仪的销售价格应定为多少?(四舍五入,精确到1元)参考公式:回归方程eq\o(y,\s\up10(^))=eq\o(b,\s\up10(^))x+eq\o(a,\s\up10(^)),其中eq\o(b,\s\up10(^))=eq\f(\o(\o(∑,\s\up10(n)),\s\do7(i=1))xi-\o(x,\s\up10(-))yi-\o(y,\s\up10(-)),\o(\o(∑,\s\up10(n)),\s\do7(i=1))xi-\o(x,\s\up10(-))2),eq\o(a,\s\up10(^))=eq\o(y,\s\up10(-))-eq\o(b,\s\up10(^))eq\o(x,\s\up10(-)).解(1)eq\o(x,\s\up10(-))=eq\f(140+150+160+170+180,5)=160,eq\o(y,\s\up10(-))=eq\f(64+55+45+35+26,5)=45,eq\i\su(i=1,5,)(xi-eq\o(x,\s\up10(-)))2=(140-160)2+(150-160)2+(160-160)2+(170-160)2+(180-160)2=1000,eq\i\su(i=1,5,)(xi-eq\o(x,\s\up10(-)))(yi-eq\o(y,\s\up10(-)))=-20×19-10×10+0×0-10×10-20×19=-960,∴eq\o(b,\s\up10(^))=eq\f(eq\i\su(i=1,5,)xi-\o(x,\s\up10(-))yi-\o(y,\s\up10(-)),eq\i\su(i=1,5,)xi-\o(x,\s\up10(-))2)=eq\f(-960,1000)=-0.96,∴eq\o(a,\s\up10(^))=eq\o(y,\s\up10(-))-eq\o(b,\s\up10(^))eq\o(x,\s\up10(-))=45+0.96×160=198.6,∴y关于x的线性回归方程为eq\o(y,\s\up10(^))=-0.96x+198.6.(2)①由(1)知,当x=165时,eq\o(y,\s\up10(^))=-0.96×165+198.6=40.2≈40,即每台红外线治疗仪的价格为165元时,红外线治疗仪的月销售量约为40台.②药店每月获得的纯收益Q(x)=(-0.96x+198.6)(x-120)=-0.96x2+313.8x-23832,∴当x=eq\f(313.8,2×0.96)≈163时,Q(x)取得最大值,即要使每月获得最大的纯收益,每台红外线治疗仪的销售价格应定为163元.(1)正确理解计算eq\o(b,\s\up10(^)),eq\o(a,\s\up10(^))的公式和准确的计算是求线性回归方程的关键.(2)回归方程eq\o(y,\s\up10(^))=eq\o(b,\s\up10(^))x+eq\o(a,\s\up10(^))必过样本点中心(eq\o(x,\s\up10(-)),eq\o(y,\s\up10(-))).(3)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.(4)对非线性回归分析问题可通过适当的换元转化为线性回归分析问题求解.3.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.eq\o(x,\s\up10(-))eq\o(y,\s\up10(-))eq\o(w,\s\up10(-))eq\o(∑,\s\up10(8),\s\do7(i=1))(xi-eq\o(x,\s\up10(-)))2eq\o(∑,\s\up10(8),\s\do7(i=1))(wi-eq\o(w,\s\up10(-)))2eq\o(∑,\s\up10(8),\s\do7(i=1))(xi-eq\o(x,\s\up10(-)))·(yi-eq\o(y,\s\up10(-)))eq\o(∑,\s\up10(8),\s\do7(i=1))(wi-eq\o(w,\s\up10(-)))·(yi-eq\o(y,\s\up10(-)))46.65636.8289.81.61469108.8表中wi=eq\r(xi),eq\o(w,\s\up10(-))=eq\f(1,8)eq\o(∑,\s\up10(8),\s\do7(i=1))wi.(1)根据散点图判断,y=a+bx与y=c+deq\r(x)哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:①年宣传费x=49时,年销售量及年利润的预报值是多少?②年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线eq\o(v,\s\up10(^))=eq\o(α,\s\up10(^))+eq\o(β,\s\up10(^))u的斜率和截距的最小二乘估计分别为eq\o(β,\s\up10(^))=eq\f(\o(∑,\s\up10(n),\s\do7(i=1))ui-\o(u,\s\up10(-))vi-\o(v,\s\up10(-)),\o(∑,\s\up10(n),\s\do7(i=1))ui-\o(u,\s\up10(-))2),eq\o(α,\s\up10(^))=eq\o(v,\s\up10(-))-eq\o(β,\s\up10(^))eq\o(u,\s\up10(-)).解(1)由散点图可以判断,y=c+deq\r(x)适宜作为年销售量y关于年宣传费x的回归方程类型.(2)令w=eq\r(x),先建立y关于w的线性回归方程.由于eq\o(d,\s\up10(^))=eq\f(\o(∑,\s\up10(8),\s\do7(i=1))wi-\o(w,\s\up10(-))yi-\o(y,\s\up10(-)),\o(∑,\s\up10(8),\s\do7(i=1))wi-\o(w,\s\up10(-))2)=eq\f(108.8,1.6)=68,eq\o(c,\s\up10(^))=eq\o(y,\s\up10(-))-eq\o(d,\s\up10(^))eq\o(w,\s\up10(-))=563-68×6.8=100.6,所以y关于w的线性回归方程为eq\o(y,\s\up10(^))=100.6+68w,因此y关于x的回归方程为eq\a\vs4\al(\o(y,\s\up10(^)))=100.6+68eq\r(x).(3)①由(2)知,当x=49时,年销售量y的预报值eq\a\vs4\al(\o(y,\s\up10(^)))=100.6+68eq\r(49)=576.6,年利润z的预报值eq\o(z,\s\up10(^))=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z的预报值eq\o(z,\s\up10(^))=0.2(100.6+68eq\r(x))-x=-x+13.6eq\r(x)+20.12.所以当eq\r(x)=eq\f(13.6,2)=6.8,即x=46.24时,eq\o(z,\s\up10(^))取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.考向三独立性检验例4(1)党的十九大报告明确提出:在共享经济等领域培育增长点、形成新动能.共享经济是公众将闲置资源通过社会化平台与他人共享,进而获得收入的经济现象.为考察共享经济对企业经济活跃度的影响,在四个不同的企业各取两个部门进行共享经济对比试验,根据四个企业得到的试验数据画出如下四个等高条形图,最能体现共享经济对该部门的发展有显著效果的图形是()答案D解析根据四个选项中的等高条形图可知,选项D中共享与不共享的企业经济活跃度的差异较大,且最能体现共享经济对该部门的发展有显著效果,故选D.(2)(2021·全国甲卷)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品二级品合计甲机床15050200乙机床12080200合计270130400①甲机床、乙机床生产的产品中一级品的频率分别是多少?②能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:K2=eq\f(nad-bc2,a+bc+da+cb+d),P(K2≥k)0.0500.0100.001k3.8416.63510.828解①设甲机床、乙机床生产的产品中一级品的频率分别为P1,P2,则P1=eq\f(150,200)=0.75,P2=eq\f(120,200)=0.6.②根据题表中的数据,得K2=eq\f(400×150×80-50×1202,200×200×270×130)=eq\f(400,39)≈10.256.因为10.256>6.635,所以有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异.1.比较几个分类变量有关联的可能性大小的方法(1)通过计算K2的大小判断:K2越大,两变量有关联的可能性越大.(2)通过计算|ad-bc|的大小判断:|ad-bc|越大,两变量有关联的可能性越大.(3)通过计算eq\f(a,a+b)与eq\f(c,c+d)的大小判断:相差越大,两变量有关联的可能性越大.2.独立性检验的一般步骤(1)根据样本数据制成2×2列联表.(2)根据公式K2=eq\f(nad-bc2,a+bc+da+cb+d)计算K2的观测值k.(3)比较k与临界值的大小关系,作统计推断.4.(2021·南阳市一中第一次目标考试)为考察A,B两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图.根据图中信息,在下列各项中,说法最佳的一项是()A.药物B的预防效果优于药物A的预防效果B.药物A的预防效果优于药物B的预防效果C.药物A,B对该疾病均有显著的预防效果D.药物A,B对该疾病均没有预防效果答案B解析由题图可得服用药物A的患病比例少于服用药物B的患病比例,而服用药物A的未患病比例多于服用药物B的未患病比例,所以药物A的预防效果优于药物B的预防效果.故选B.5.(2022·广西柳州高三摸底考试)随着我国老龄化进程不断加快,养老将会是未来每个人要面对的问题,而如何养老则是我国逐渐进入老龄化社会后,整个社会需要回答的问题.为了调查某地区老年人是否愿意参加个性化社区型医养结合型养老机构,用简单随机抽样方法从该地区调查了500位老人,结果如下:男女不愿意参加4030愿意参加160270(1)估计该地区老年人中,愿意参加个性化社区型医养结合型养老机构的男性老年人的比例以及女性老年人的比例;(2)根据统计数据能有多大的把握认为该地区的老年人是否愿意参加个性化社区型医养结合型养老机构与性别有关?请说明理由.参考公式:K2=eq\f(nad-bc2,a+bc+da+cb+d)参考数据:P(K2≥k0)0.0500.0250.0100.0050.001k03.8415.0246.6357.87910.828解(1)由统计数据可知愿意参加个性化社区型医养结合型养老机构的男性老年人人数为160,调查的男性老年人总人数为200,故愿意参加个性化社区型医养结合型养老机构的男性老年人的比例为eq\f(160,200)=eq\f(4,5);由统计数据可知愿意参加个性化社区型医养结合型养老机构的女性老年人人数为270,调查的女性老年人总人数为300,故愿意参加个性化社区型医养结合型养老机构的女性老年人的比例为eq\f(270,300)=eq\f(9,10).(2)结合列联表的数据计算K2=eq\f(500×40×270-30×1602,70×430×200×300)=eq\f(3000,301)≈9.967>7.879,所以有99.5%的把握认为该地区的老年人是否愿意参加个性化社区型医养结合型养老机构与性别有关.

1.为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了100次和150次试验,并且利用线性回归方法,求得回归直线分别为l1和l2,已知两个人在试验中发现变量x的观测数据的平均值都是s,变量y的观测数据的平均值都是t,那么下列说法正确的是()A.l1和l2有交点(s,t)B.l1与l2相关,但交点不一定是(s,t)C.l1与l2必定平行D.l1与l2必定重合答案A解析由题意知(s,t)是甲、乙两位同学所做试验的样本点的中心,而线性回归直线恒过样本点的中心,故选A.2.某互联网公司借助手机微信平台推广自己的产品,对今年前5个月的月微信推广费用x与月利润额y(单位:百万元)进行了初步统计,得到下列表格中的数据:x24568y304060p70经计算,月微信推广费用x与月利润额y满足线性回归方程eq\o(y,\s\up10(^))=6.5x+17.5,则p的值为()A.50 B.56.5C.60 D.70答案A解析由于回归直线过样本中心点,eq\o(x,\s\up10(-))=5,eq\o(y,\s\up10(-))=eq\f(200+p,5),代入线性回归方程得eq\f(200+p,5)=6.5×5+17.5,解得p=50.故选A.3.(2020·全国Ⅰ卷)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()A.y=a+bx B.y=a+bx2C.y=a+bex D.y=a+blnx答案D解析由散点图可知,实验数据分布在一个对数型函数图象的附近,因此最适宜作为发芽率y和温度x的回归方程类型的是y=a+blnx.故选D.4.以下四个命题:①在回归分析中,可用相关指数R2的值判断模型的拟合效果,R2越大,模型的拟合效果越好;②回归模型中残差是实际值yi与估计值eq\o(y,\s\up10(^))的差,残差点所在的带状区域宽度越窄,说明模型拟合精度越高;③在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-eq\f(1,2)x+1上,则这组样本数据的线性相关系数为-eq\f(1,2);④对分类变量x与y的随机变量K2的观测值k来说,k越小,判断“x与y有关系”的把握程度越大.其中真命题的个数为()A.1 B.2C.3 D.4答案B解析根据相关指数的意义可知①正确;由残差的定义和残差图的绘制可以知道②正确;相关系数req\b\lc\(\rc\)(\a\vs4\al\co1(r=\f(\i\su(i=1,n,)xi-\o(x,\s\up10(-))yi-\o(y,\s\up10(-)),\r(\i\su(i=1,n,)xi-\o(x,\s\up10(-))2\i\su(i=1,n,)yi-\o(y,\s\up10(-))2))))反映的是两变量之间线性相关程度的强弱,与回归直线斜率eq\o(b,\s\up10(^))=eq\f(\i\su(i=1,n,)xi-\o(x,\s\up10(-))yi-\o(y,\s\up10(-)),\i\su(i=1,n,)xi-\o(x,\s\up10(-))2)无关,因为所有样本点都在直线y=-eq\f(1,2)x+1上,所以样本数据的线性相关系数为-1,故③错误;K2的观测值k越小,x与y有关系的把握程度越小,故④错误.故选B.5.(2021·山西大同模拟)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的eq\f(1,2),男生追星的人数占男生人数的eq\f(1,6),女生追星的人数占女生人数的eq\f(2,3).若有95%的把握认为是否追星和性别有关,则男生至少有()A.11人 B.12人C.18人 D.24人附表及公式:K2=eq\f(nad-bc2,a+bc+da+cb+d),n=a+b+c+d.P(K2≥k0)0.0500.0250.0100.005k03.8415.0246.6357.879答案B解析设男生人数为x,依题意可得2×2列联表如下:追星不追星总计男生eq\f(x,6)eq\f(5x,6)x女生eq\f(x,3)eq\f(x,6)eq\f(x,2)总计eq\f(x,2)xeq\f(3x,2)若有95%的把握认为是否追星和性别有关,则K2>3.841,即eq\f(\f(3x,2)\b\lc\(\rc\)(\a\vs4\al\co1(\f(x2,36)-\f(5x2,18)))2,x·\f(x,2)·\f(x,2)·x)=eq\f(3x,8)>3.841,则x>10.24,∵eq\f(x,2),eq\f(x,6)为整数,∴若有95%的把握认为是否追星和性别有关,则男生至少有12人,故选B.6.高三年级267位学生参加期末考试,某班37位学生的语文成绩、数学成绩与总成绩在全年级中的排名情况如图所示,甲、乙、丙为该班三位学生.从这次考试成绩看,(1)在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是________;(2)在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是________.答案(1)乙(2)数学解析(1)由图分析,甲的语文成绩名次比其总成绩名次靠后,乙的语文成绩名次比其总成绩名次靠前,故填乙.(2)根据丙在两个图中对应的点的纵坐标,观察易得,丙同学成绩名次更靠前的科目是数学.7.某数学老师身高176cm,他爷爷、父亲和儿子的身高分别是173cm、170cm和182cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高约为________cm.eq\b\lc\(\rc\)(\a\vs4\al\co1(\o(b,\s\up10(^))=\f(\i\su(i=1,n,)xi-\o(x,\s\up10(-))yi-\o(y,\s\up10(-)),\i\su(i=1,n,)xi-\o(x,\s\up10(-))2),\o(a,\s\up10(^))=\o(y,\s\up10(-))-\o(b,\s\up10(^))\o(x,\s\up10(-))))答案185解析设父亲身高为xcm,儿子身高为ycm,则x173170176y170176182eq\o(x,\s\up10(-))=173,eq\o(y,\s\up10(-))=176,eq\o(b,\s\up10(^))=eq\f(0×-6+-3×0+3×6,02+9+9)=1,eq\o(a,\s\up10(^))=eq\o(y,\s\up10(-))-eq\o(b,\s\up10(^))eq\o(x,\s\up10(-))=176-1×173=3,所以eq\o(y,\s\up10(^))=x+3,当x=182时,eq\o(y,\s\up10(^))=185.8.(2022·北京海淀模拟)如图是某地区2004年至2020年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2022年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2004年至2020年的数据(时间变量t的值依次为1,2,…,17)建立模型①:eq\o(y,\s\up10(^))=-30.4+13.5t;根据2014年至2020年的数据(时间变量t的值依次为1,2,…,7)建立模型②:eq\o(y,\s\up10(^))=99+17.5t.利用这两个模型,该地区2022年的环境基础设施投资额的预测值分别为________,________;并且可以判断利用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论