2021高三数学教师用书:第10章 第3讲变量相关关系与统计案例含解析_第1页
2021高三数学教师用书:第10章 第3讲变量相关关系与统计案例含解析_第2页
2021高三数学教师用书:第10章 第3讲变量相关关系与统计案例含解析_第3页
2021高三数学教师用书:第10章 第3讲变量相关关系与统计案例含解析_第4页
2021高三数学教师用书:第10章 第3讲变量相关关系与统计案例含解析_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学必求其心得,业必贵于专精学必求其心得,业必贵于专精学必求其心得,业必贵于专精2021高三人教B版数学一轮(经典版)教师用书:第10章第3讲变量相关关系与统计案例含解析第3讲变量相关关系与统计案例基础知识整合1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非eq\x(\s\up1(01))确定性关系.(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为eq\x(\s\up1(02))正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为eq\x(\s\up1(03))负相关.2.回归方程与回归分析(1)线性相关关系与回归直线如果散点图中点的分布从整体上看大致在eq\x(\s\up1(04))一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程①最小二乘法:求回归直线使得样本数据的点到回归直线的eq\x(\s\up1(05))距离的平方和最小的方法叫做最小二乘法.②回归方程:方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^))是待定数.(3)回归分析①定义:对具有eq\x(\s\up1(06))相关关系的两个变量进行统计分析的一种常用方法.②样本点的中心:在具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn)中,eq\o(x,\s\up6(-))=eq\f(1,n)(x1+…+xn),eq\o(y,\s\up6(-))=eq\f(1,n)(y1+…+yn),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)),(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-)))称为样本点的中心.③相关系数,当r>0时,两变量eq\x(\s\up1(07))正相关;当r<0时,两变量eq\x(\s\up1(08))负相关;当|r|≤1且|r|越接近于1,相关程度eq\x(\s\up1(09))越强;当|r|≤1且|r|越接近于0,相关程度eq\x(\s\up1(10))越弱.3.独立性检验(1)独立性检验的有关概念①分类变量可用变量的不同“值”表示个体所属的eq\x(\s\up1(11))不同类别的变量称为分类变量.②2×2列联表假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d(2)独立性检验利用随机变量(其中n=a+b+c+d为样本容量)来判断“两个变量有关系"的方法称为独立性检验.步骤如下:①计算随机变量K2的观测值k,查表确定临界值k0:P(K2≥k0)0。50。400.250.150。100。050。0250.0100。0050。001k00.4550.7081.3232。0722.7063。8415。0246.6357.87910。828②如果k≥k0,就推断“X与Y有关系",这种推断犯错误的概率不超过P(K2≥k0);否则,就认为在犯错误的概率不超过P(K2≥k0)的前提下不能推断“X与Y有关系”.1.相关关系与函数关系的异同共同点:二者都是指两个变量间的关系;不同点:函数关系是一种确定性关系,体现的是因果关系,而相关关系是一种非确定性关系,体现的不一定是因果关系,也可能是伴随关系.2.从散点图看相关性正相关:样本点分布在从左下角到右上角的区域内;负相关:样本点分布在从左上角到右下角的区域内.3.回归直线eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))必过样本点的中心.1.下面是一个2×2列联表:y1y2总计x1a2173x2222547合计b46120其中a,b处填的值分别为()A.9472 B.5250C.5274 D.7452答案C解析由a+21=73,得a=52,a+22=b,得b=74。故选C。2.(2019·湖南衡阳联考)甲、乙、丙、丁四位同学各自对A,B两个变量的线性相关性做了试验,并用回归分析方法分别求得相关系数r与残差平方和m,如下表:甲乙丙丁r0。820.780。690.85m106115124103则哪位同学的试验结果体现的A,B两变量有更强的线性相关性()A.甲 B.乙C.丙 D.丁答案D解析r越大,m越小,线性相关性越强,故选D。3.(2019·湖北荆州模拟)已知相关变量x和y满足关系y=-0。1x+1,相关变量y与z负相关.下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关答案D解析因为y=-0.1x+1的斜率小于0,故x与y负相关.因为y与z负相关,可设z=eq\o(b,\s\up6(^))y+eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^))〈0,则z=eq\o(b,\s\up6(^))y+eq\o(a,\s\up6(^))=-0。1eq\o(b,\s\up6(^))x+eq\o(b,\s\up6(^))+eq\o(a,\s\up6(^)),故x与z正相关.4.通过随机询问110名不同的大学生是否爱好某项运动,得到了如下的列联表.参照附表,能得到的正确结论是()男女总计爱好402060不爱好203050总计6050110A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0。1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0。1%的前提下,认为“爱好该项运动与性别无关”附:,n=a+b+c+d.P(K2≥k0)0。050。0100.001k03.8416.63510。828答案A解析由列联表中的数据可得≈7。822>6.635,故有99%以上的把握认为“爱好该项运动与性别有关”.故选A.5.(2020·山西太原摸底)某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))中的eq\o(b,\s\up6(^))为9。4,据此模型预测广告费用为6万元时销售额约为________万元.答案65。5解析由表可计算eq\o(x,\s\up6(-))=eq\f(4+2+3+5,4)=3.5,eq\o(y,\s\up6(-))=eq\f(49+26+39+54,4)=42,因为点(3。5,42)在回归直线eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))上,且eq\o(b,\s\up6(^))=9.4,所以42=9.4×3。5+eq\o(a,\s\up6(^)),解得eq\o(a,\s\up6(^))=9.1。故回归方程为eq\o(y,\s\up6(^))=9。4x+9.1.令x=6,得eq\o(y,\s\up6(^))=65。5.故预测广告费用为6万元时销售额约为65.5万元.核心考向突破考向一两个变量的相关性角度eq\o(\s\up7(),\s\do5(1))相关关系的判断例1为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班学生的两科成绩得到如图所示的散点图(x轴、y轴的单位长度相同),用回归直线方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))近似地刻画其相关关系,根据图形,以下结论最有可能成立的是()A.线性相关关系较强,b的值为1.25B.线性相关关系较强,b的值为0。83C.线性相关关系较强,b的值为-0.87D.线性相关关系较弱,无研究价值答案B解析由散点图可以看出两个变量所构成的点在一条直线附近,所以线性相关关系较强,且应为正相关,所以回归直线方程的斜率应为正数,且从散点图观察,回归直线方程的斜率应该比y=x的斜率要小一些,综上可知应选B.角度eq\o(\s\up7(),\s\do5(2))相关系数的意义例2(2019·广西联考)某公司为了准确地把握市场,做好产品生产计划,对过去四年的数据进行整理得到了第x年与年销售量y(单位:万件)之间的关系如表:x1234y12284256(1)在图中画出表中数据的散点图;(2)根据(1)中的散点图拟合y与x的回归模型,并用相关系数加以说明;(3)建立y关于x的回归方程,预测第5年的销售量约为多少?参考数据:,eq\r(5)≈2.24,eq\o(∑,\s\up6(4),\s\do4(i=1))xiyi=418。参考公式:相关系数,回归方程y=a+bx的斜率和截距的最小二乘估计分别为解(1)作出散点图如图:(2)由(1)中的散点图可知,各点大致分布在一条直线附近,由题中所给表格及参考数据,得∵y与x的相关系数近似为0。9966,说明y与x的线性相关程度相当强,∴可以用线性回归模型拟合y与x的关系.(3)由(2),知eq\o(x,\s\up6(-))=eq\f(5,2),eq\o(y,\s\up6(-))=eq\f(69,2),eq\o(∑,\s\up6(4),\s\do4(i=1))xiyi=418,eq\o(∑,\s\up6(4),\s\do4(i=1))xeq\o\al(2,i)=30,∴eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(4),\s\do4(i=1))xiyi-4\o(x,\s\up6(-))\o(y,\s\up6(-)),\o(∑,\s\up6(4),\s\do4(i=1))x\o\al(2,i)-4\o(x,\s\up6(-))2)=eq\f(73,5),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-))=eq\f(69,2)-eq\f(73,5)×eq\f(5,2)=-2.故y关于x的回归直线方程为eq\o(y,\s\up6(^))=eq\f(73,5)x-2,当x=5时,eq\o(y,\s\up6(^))=eq\f(73,5)×5-2=71,∴预测第5年的销售量约为71万件.判断相关关系的两种方法(1)散点图法:如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.(2)相关系数法:利用相关系数判定,|r|越趋近于1相关性越强.[即时训练]1。(2020·贵阳摸底)对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()A.r2<r4<0〈r3<r1 B.r4〈r2<0〈r1〈r3C.r4<r2<0〈r3<r1 D.r2<r4〈0<r1<r3答案A解析易知题中图①与图③是正相关,图②与图④是负相关,且图①与图②中的样本点集中分布在一条直线附近,则r2〈r4<0〈r3〈r1.2.为了监控某种零件的一条生产线的生产过程,检验员每隔30min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:抽取次序12345678零件尺寸9.9510.129。969。9610。019.929.9810。04抽取次序910111213141516零件尺寸10。269。9110。1310.029.2210。0410.059。95(1)求(xi,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|〈0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在(eq\o(x,\s\up6(-))-3s,eq\o(x,\s\up6(-))+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①从这一天抽检的结果看,是否需对当天的生产过程进行检查?②在(eq\o(x,\s\up6(-))-3s,eq\o(x,\s\up6(-))+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0。01)附:样本(xi,yi)(i=1,2,…,n)的相关系数参考数据:eq\r(0.008)≈0.09.解(1)由样本数据,得(xi,i)(i=1,2,…,16)的相关系数≈eq\f(-2。78,0。212×\r(16)×18.439)≈-0。18。由于|r|〈0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)①由于eq\o(x,\s\up6(-))=9。97,s≈0。212,因此由样本数据可以看出抽取的第13个零件的尺寸在(eq\o(x,\s\up6(-))-3s,eq\o(x,\s\up6(-))+3s)以外,因此需对当天的生产过程进行检查.②剔除离群值,即第13个数据,剩下数据的平均数为eq\f(1,15)×(16×9.97-9.22)=10。02,这条生产线当天生产的零件尺寸的均值的估计值为10。02。eq\i\su(i=1,16,x)eq\o\al(2,i)≈16×0.2122+16×9.972≈1591.134,剔除第13个数据,剩下数据的样本方差为eq\f(1,15)×(1591。134-9.222-15×10.022)≈0.008,这条生产线当天生产的零件尺寸的标准差的估计值为eq\r(0。008)≈0.09.考向二回归分析例3(2019·昆明模拟)某县畜牧技术员张三和李四9年来一直对该县山羊养殖业的规模进行着跟踪调查,张三提供了该县某山羊养殖场年养殖数量y(单位:万只)与相应年份x(序号)的数据表和散点图(如图所示),根据散点图,发现y与x有较强的线性相关关系,李四提供了该县山羊养殖场的个数z(单位:个)关于x的回归方程eq\o(z,\s\up6(^))=-2x+30.年份序号x123456789年养殖山羊y/万只1。21.51。61。61.82.52。52。62。7(1)根据表中的数据和所给统计量,求y关于x的线性回归方程;(2)试估计:①该县第一年养殖山羊多少万只?②到第几年,该县养殖山羊的数量与第1年相比减少了?参考统计量:eq\o(∑,\s\up6(9),\s\do4(i=1))(xi-eq\o(x,\s\up6(-)))2=60,eq\o(∑,\s\up6(9),\s\do4(i=1))(xi-eq\o(x,\s\up6(-)))(yi-eq\o(y,\s\up6(-)))=12.附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=βu+α的斜率和截距的最小二乘估计分别为.解(1)设y关于x的线性回归方程为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),因为eq\o(x,\s\up6(-))=eq\f(1+2+3+4+5+6+7+8+9,9)=5,eq\o(y,\s\up6(-))=eq\f(1.2+1.5+1。6+1.6+1。8+2.5+2.5+2.6+2。7,9)=2,=2-0。2×5=1。所以y关于x的线性回归方程为eq\o(y,\s\up6(^))=0.2x+1.(2)①估计第x年山羊养殖的只数为eq\o(z,\s\up6(^))·eq\o(y,\s\up6(^))=(0。2x+1)·(-2x+30)=-0.4x2+4x+30.令x=1,则-0.4+4+30=33。6,故该县第一年养殖山羊约33.6万只.②由题意,得-0.4x2+4x+30〈33.6,整理得(x-9)(x-1)>0,解得x〉9或x〈1(舍去),所以到第10年该县养殖山羊的数量与第1年相比减少了.(1)正确理解计算eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^))的公式和准确的计算是求线性回归方程的关键.(2)回归直线方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))必过样本点中心(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-))).(3)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.(4)对非线性回归分析问题可通过适当的换元转化为线性回归分析问题求解.[即时训练]3。某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.eq\o(x,\s\up6(-))eq\o(y,\s\up6(-))eq\o(w,\s\up6(-))eq\o(∑,\s\up6(8),\s\do4(i=1))(xi-eq\o(x,\s\up6(-)))2eq\o(∑,\s\up6(8),\s\do4(i=1))(wi-eq\o(w,\s\up6(-)))2eq\o(∑,\s\up6(8),\s\do4(i=1))(xi-eq\o(x,\s\up6(-)))(yi-eq\o(y,\s\up6(-)))eq\o(∑,\s\up6(8),\s\do4(i=1))(wi-eq\o(w,\s\up6(-)))(yi-eq\o(y,\s\up6(-)))46。65636.8289.81。61469108。8表中wi=eq\r(xi),eq\o(w,\s\up6(-))=eq\f(1,8)eq\o(∑,\s\up6(8),\s\do4(i=1))wi.(1)根据散点图判断,y=a+bx与y=c+deq\r(x)哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:①年宣传费x=49时,年销售量及年利润的预报值是多少?②年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为解(1)由散点图可以判断,y=c+deq\r(x)适宜作为年销售量y关于年宣传费x的回归方程类型.(2)令w=eq\r(x),先建立y关于w的线性回归方程.由于,eq\o(c,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(d,\s\up6(^))eq\o(w,\s\up6(-))=563-68×6.8=100。6,所以y关于w的线性回归方程为eq\o(y,\s\up6(^))=100。6+68w,因此y关于x的回归方程为eq\o(y,\s\up6(^))=100。6+68eq\r(x)。(3)①由(2)知,当x=49时,年销售量y的预报值eq\o(y,\s\up6(^))=100。6+68eq\r(49)=576.6,年利润z的预报值eq\o(z,\s\up6(^))=576.6×0。2-49=66。32。②根据(2)的结果知,年利润z的预报值eq\o(z,\s\up6(^))=0.2(100.6+68eq\r(x))-x=-x+13。6eq\r(x)+20.12。所以当eq\r(x)=eq\f(13.6,2)=6。8,即x=46.24时,eq\o(z,\s\up6(^))取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.

考向三独立性检验例4(1)为考察某种药物对预防禽流感的效果,在四个不同的实验室取相同的个体进行动物试验,根据四个实验室得到的列联表画出如下四个等高条形图,最能体现该药物对预防禽流感有效果的图形是()答案D解析在频率等高条形图中,eq\f(a,a+b)与eq\f(c,c+d)相差很大时,我们认为两个分类变量有关系,在四个选项中(等高的条形图)中,选项D中不服药样本中患病的频率与服药样本中患病的频率相差最大,故选D.(2)(2019·全国卷Ⅰ)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020①分别估计男、女顾客对该商场服务满意的概率;②能否有95%的把握认为男、女顾客对该商场服务的评价有差异?P(K2≥k0)0。0500。0100。001k03。8416。63510。828解①由调查数据,得男顾客中对该商场服务满意的比率为eq\f(40,50)=0.8,因此男顾客对该商场服务满意的概率的估计值为0。8.女顾客中对该商场服务满意的比率为eq\f(30,50)=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6。由于4.762>3。841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.1.比较几个分类变量有关联的可能性大小的方法(1)通过计算K2的大小判断:K2越大,两变量有关联的可能性越大.(2)通过计算|ad-bc|的大小判断:|ad-bc|越大,两变量有关联的可能性越大.(3)通过计算eq\f(a,a+b)与eq\f(c,c+d)的大小判断:相差越大,两变量有关联的可能性越大.2.独立性检验的一般步骤(1)根据样本数据制成2×2列联表.(2)根据公式计算K2的观测值k.(3)比较k与临界值的大小关系,作统计推断.[即时训练]4.(2020·南阳市一中第一次目标考试)为考察A,B两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图.根据图中信息,在下列各项中,说法最佳的一项是()A.药物B的预防效果优于药物A的预防效果B.药物A的预防效果优于药物B的预防效果C.药物A,B对该疾病均有显著的预防效果D.药物A,B对该疾病均没有预防效果答案B解析由题图可得服用药物A的患病数量少于服用药物B的患病数量,而服用药物A的未患病数量多于服用药物B的未患病数量,所以药物A的预防效果优于药物B的预防效果.故选B.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论