2025版高考数学一轮复习第十章统计统计案例第三讲变量间的相关关系统计案例学案新人教版_第1页
2025版高考数学一轮复习第十章统计统计案例第三讲变量间的相关关系统计案例学案新人教版_第2页
2025版高考数学一轮复习第十章统计统计案例第三讲变量间的相关关系统计案例学案新人教版_第3页
2025版高考数学一轮复习第十章统计统计案例第三讲变量间的相关关系统计案例学案新人教版_第4页
2025版高考数学一轮复习第十章统计统计案例第三讲变量间的相关关系统计案例学案新人教版_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGE第三讲变量间的相关关系、统计案例学问梳理·双基自测eq\x(知)eq\x(识)eq\x(梳)eq\x(理)学问点一回来分析(1)相关关系:当自变量取值肯定时,因变量的取值带有肯定随机性的两个变量之间的关系叫做相关关系.与函数关系不同,相关关系是一种_非确定性关系__.(2)散点图:表示具有_相关__关系的两个变量的一组数据的图形叫做散点图,它可直观地推断两变量的关系是否可以用线性关系表示.若这些散点有y随x增大而增大的趋势,则称两个变量_正相关__;若这些散点有y随x增大而减小的趋势,则称两个变量_负相关__.(3)回来方程:eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),其中eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\o(∑,\s\up6(n),\s\do4(i=1))x\o\al(2,i)-n\x\to(x)2),eq\o(a,\s\up6(^))=_eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\x\to(x)__,它主要用来估计和预料取值,从而获得对这两个变量之间整体关系的了解.(4)相关系数:r=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\r(\o(∑,\s\up6(n),\s\do4(i=1))x\o\al(2,i)-n\x\to(x)2\o(∑,\s\up6(n),\s\do4(i=1))y\o\al(2,i)-n\x\to(y)2))它主要用于相关量的显著性检验,以衡量它们之间的线性相关程度.当r>0时表示两个变量正相关,当r<0时表示两个变量负相关.|r|越接近1,表明两个变量的线性相关性_越强__;当|r|接近0时,表明两个变量间几乎不存在相关关系,相关性_越弱__.学问点二独立性检验(1)2×2列联表设X,Y为两个分类变量,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2列联表)如下:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d(2)独立性检验利用随机变量K2(也可表示为X2)=eq\f(nad-bc2,a+bc+da+cb+d)(其中n=a+b+c+d为样本容量)来推断“两个变量有关系”的方法称为独立性检验.(3)独立性检验的一般步骤①依据样本数据列出2×2列联表;②计算随机变量K2的观测值k,查表确定临界值k0:③假如k≥k0,就推断“X与Y有关系\”,这种推断犯错误的概率不超过P(K2≥k0);否则,就认为在犯错误的概率不超过P(K2≥k0)的前提下不能推断“X与Y有关\”.eq\x(重)eq\x(要)eq\x(结)eq\x(论)1.回来分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性分布时,求出的线性回来方程才有实际意义,否则,求出的线性回来方程毫无意义.依据回来方程进行预报,仅是一个预报值,而不是真实发生的值.2.独立性检验是对两个变量的关系的可信程度的推断,而不是对其是否有关系的推断.依据K2的值可以推断两个分类变量有关的可信程度,并用来指导科研和实际生活.eq\x(双)eq\x(基)eq\x(自)eq\x(测)题组一走出误区1.推断下列结论是否正确(请在括号中打“√”或“×”)(1)“名师出高徒”可以说明为老师的教学水平与学生的水平成正相关关系.(√)(2)两个随机变量的线性相关性越强,相关系数的肯定值越接近于0.(×)(3)只有两个变量有相关关系,所得到的回来模型才有预料价值.(√)(4)某同学探讨卖出的热饮杯数y与气温x(℃)之间的关系,得回来方程eq\o(y,\s\up6(^))=-2.352x+147.767,则气温为2℃时,肯定可卖出143杯热饮.(×)(5)事务x,y关系越亲密,则由观测数据计算得到的K2的观测值越大.(√)(6)由独立性检验可知,在犯错误的概率不超过1%的前提下认为物理成果优秀与数学成果有关,某人数学成果优秀,则他有99%的可能物理优秀.(×)题组二走进教材2.(P97T2)为调查中学生近视状况,测得某校男生150名中有80名近视,在140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有劝服力(C)A.回来分析 B.均值与方差C.独立性检验 D.概率[解析]“近视”与“性别”是两类变量,其是否有关,应用独立性检验推断.3.(P81例1)某车间为了规定工时定额,须要确定加工零件所花费的时间,为此进行了5次试验.依据收集到的数据(如下表),由最小二乘法求得回来方程eq\o(y,\s\up6(^))=0.67x+54.9.零件数x(个)1020304050加工时间y(min)62758189现发觉表中有一个数据看不清,请你推断出该数据的值为_68__.[解析]由eq\o(x,\s\up6(-))=30,得eq\o(y,\s\up6(-))=0.67×30+54.9=75.设表中的“模糊数字”为a,则62+a+75+81+89=75×5,∴a=68.题组三走向高考4.(2024·山东高考)为了探讨某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,依据测量数据的散点图可以看出y与x之间有线性相关关系,设其回来直线方程为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),已知eq\o(,\s\up6(10),\s\do4(i=1))xi=225,eq\o(,\s\up6(10),\s\do4(i=1))yi=1600,eq\o(b,\s\up6(^))=4.该班某学生的脚长为24,据此估计其身高为(C)A.160 B.163C.166 D.170[解析]由题意知eq\o(y,\s\up6(^))=4x+eq\o(a,\s\up6(^))又eq\x\to(x)=22.5,eq\x\to(y)=160,因此160=22.5×4+eq\o(a,\s\up6(^)),∴eq\o(a,\s\up6(^))=70,因此eq\o(y,\s\up6(^))=4x+70,当x=24时,eq\o(y,\s\up6(^))=4×24+70=166,故选C.5.(2024·高考全国Ⅰ卷)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满足或不满足的评价,得到下面列联表:满足不满足男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满足的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:K2=eq\f(nad-bc2,a+bc+da+cb+d).P(K2≥k)0.0500.0100.001k3.8416.63510.828[解析](1)由调查数据,男顾客中对该商场服务满足的比率为eq\f(40,50)=0.8,因此男顾客对该商场服务满足的概率的估计值为0.8.女顾客中对该商场服务满足的比率为eq\f(30,50)=0.6,因此女顾客对该商场服务满足的概率的估计值为0.6.(2)由题可得K2=eq\f(100×40×20-30×102,50×50×70×30)≈4.762.由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.考点突破·互动探究考点一相关关系的推断——自主练透例1(1)(2024·四川资阳模拟)在一次对人体脂肪含量和年龄关系的探讨中,探讨人员获得了一组样本数据,并制作成如图所示的人体脂肪含量与年龄关系的散点图.依据该图,下列结论中正确的是(B)A.人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%B.人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%C.人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%D.人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%(2)对四组数据进行统计,获得以下关于其相关系数的比较,正确的是(A)A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3[解析](1)视察图形,可知人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%,故选B.(2)由相关系数的定义及散点图所表达的含义,可知r2<r4<0<r3<r1.故选A.名师点拨推断两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:r>0时,正相关;r<0时,负相关.(3)线性回来直线方程中:eq\o(b,\s\up6(^))>0时,正相关;eq\o(b,\s\up6(^))<0时负相关.考点二线性回来分析——师生共研例2(1)(多选题)(2024·湖湘名校教化联合体联考)2024年3月15日,某市物价部门对5家商场的某商品一天的销售量及其价格进行调查,5家商场的售价x(元)和销售量y(件)之间的一组数据如表所示:价格x99.51010.511销售量y1110865按公式计算,y与x的回来直线方程是:eq\o(y,\s\up6(^))=-3.2x+eq\o(a,\s\up6(^)),相关系数|r|=0.986,则下列说法正确的有(ABC)A.变量x,y线性负相关且相关性较强B.eq\o(a,\s\up6(^))=40C.当x=8.5时,y的估计值为12.8D.相应于点(10.5,6)的残差约为0.4(2)(2024·全国Ⅱ)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简洁随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得eq\i\su(i=1,20,x)i=60,eq\i\su(i=1,20,y)i=1200,eq\i\su(i=1,20,)(xi-eq\o(x,\s\up6(-)))2=80,eq\i\su(i=1,20,)(yi-eq\o(y,\s\up6(-)))2=9000,eq\i\su(i=1,20,)(xi-eq\o(x,\s\up6(-)))(yi-eq\o(y,\s\up6(-)))=800.①求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);②求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);③依据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更精确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r=eq\f(\i\su(i=1,n,)xi-\o(x,\s\up6(-))yi-\o(y,\s\up6(-)),\r(\i\su(i=1,n,)xi-\o(x,\s\up6(-))2\i\su(i=1,n,)yi-\o(y,\s\up6(-))2)),eq\r(2)≈1.414.[解析](1)对A,由表可知y随x增大而削减,可认为变量x,y线性负相关,且相关性强,故A正确.对B,价格平均eq\o(x,\s\up6(-))=eq\f(1,5)(9+9.5+10+10.5+11)=10,销售量eq\o(y,\s\up6(-))=eq\f(1,5)(11+10+8+6+5)=8.故回来直线恒过定点(10,8),故8=-3.2×10+eq\o(a,\s\up6(^))⇒eq\o(a,\s\up6(^))=40,故B正确.对C,当x=8.5时,eq\o(y,\s\up6(^))=-3.2×8.5+40=12.8,故C正确.对D,相应于点(10,8)的残差约为eq\o(e,\s\up6(^))=6-(-3.2×10.5+40)=-0.4,故D不正确.故选ABC.(2)①样区野生动物平均数为eq\f(1,20)eq\i\su(i=1,20,y)i=eq\f(1,20)×1200=60,地块数为200,该地区这种野生动物的估计值为200×60=12000.②样本(xi,yi)的相关系数为r=eq\f(\i\su(i=1,20,)xi-\o(x,\s\up6(-))yi-\o(y,\s\up6(-)),\r(\i\su(i=1,20,)xi-\o(x,\s\up6(-))2\i\su(i=1,20,)yi-\o(y,\s\up6(-))2))=eq\f(800,\r(80×9000))=eq\f(2\r(2),3)≈0.94.③由于各地块间植物覆盖面积差异较大,为提高样本数据的代表性,应采纳分层抽样,先将植物覆盖面积按优中差分成三层,在各层内按比例抽取样本,在每层内用简洁随机抽样方法抽取样本即可.名师点拨线性回来分析问题的类型及解题方法(1)求线性回来方程:①利用公式,求出回来系数eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^)).②待定系数法:利用回来直线过样本点中心求系数.(2)利用回来方程进行预料:把回来直线方程看作一次函数,求函数值.(3)利用回来直线推断正、负相关:确定正相关还是负相关的是系数eq\o(b,\s\up6(^)).〔变式训练1〕(2024·安徽六校教化探讨会素养测试)某商场近5个月的销售额和利润额如表所示:销售额x/千万元35679利润额y/百万元13345(1)画出散点图,视察散点图,说明两个变量有怎样的相关关系;(2)求出利润额y关于销售额x的回来直线方程;(3)当销售额为4千万元时,利用(2)的结论估计该商场的利润额(百万元).eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,x)iyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\i\su(i=1,n,x)\o\al(2,i)-n\o(x,\s\up6(-))2)=eq\f(\i\su(i=1,n,)xi-\o(x,\s\up6(-))yi-\o(y,\s\up6(-)),\i\su(i=1,n,)xi-\o(x,\s\up6(-))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-beq\o(x,\s\up6(-)).[解析](1)散点图如图所示:两个变量正相关,且具有线性相关关系.(2)易求eq\o(x,\s\up6(-))=6,eq\o(y,\s\up6(-))=3.2,由公式有eq\o(b,\s\up6(^))=eq\f(3×2.2+1×0.2+0+1×0.8+3×1.8,32+12+12+32)=eq\f(13,20)=0.65,且eq\o(a,\s\up6(^))=3.2-0.65×6=-0.7,则线性回来方程为eq\o(y,\s\up6(^))=0.65x-0.7,(3)当x=4时,由(1)可求得eq\o(y,\s\up6(^))=1.9,即利润额约为1.9百万元.考点三独立性检验——师生共研例3(1)(2024·新高考Ⅰ,19)为加强环境爱护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:SO2PM2.5[0,50](50,150](150,475][0,35]32184(35,75]6812(75,115]3710①估计事务“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;②依据所给数据,完成下面的2×2列联表:SO2PM2.5[0,150](150,475][0,75](75,115]③依据②中的列联表,推断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.附:K2=eq\f(nad-bc2,a+bc+da+cb+d),P(K2≥k)0.0500.0100.001k3.8416.63510.828(2)(2024·广东深圳宝安区调研)2024年寒假是特别的寒假,因为抗击疫情全体学生只能在家进行网上在线学习,为了探讨学生在网上学习的状况,某学校在网上随机抽取120名学生对线上教学进行调查,其中男生与女生的人数之比为11∶13,其中男生30人对于线上教学满足,女生中有15名表示对线上教学不满足.①完成2×2列联表,并回答能否有99%的把握认为对“线上教学是否满足与性别有关”;满足不满足总计男生30女生15合计120②从被调查的对线上教学满足的学生中,利用分层抽样抽取8名学生,再在8名学生中抽取3名学生,作线上学习的阅历介绍,其中抽取男生的个数为ξ,求出ξ的分布列及期望值.参考公式:附:K2=eq\f(nad-bc2,a+ba+cb+dc+d)P(K2>k)0.150.100.050.0250.0100.0050.001k2.0720.7063.8415.0246.6357.87910828[解析](1)①依据抽查数据,该市100天的空气中PM2.5浓度不超过75,且SO2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150的概率的估计值为eq\f(64,100)=0.64.②依据抽查数据,可得2×2列联表:SO2PM2.5[0,150](150,475][0,75]6416(75,115]1010③依据②的列联表得K2=eq\f(100×64×10-16×102,80×20×74×26)≈7.484.由于7.484>6.635,故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.(2)①因为男生人数为:120×eq\f(11,11+13)=55,所以女生人数为120-55=65,于是可完成2×2列联表,如下:满足不满足总计男生302555女生501565合计8040120依据列联表中的数据,得到K2的观测值K2=eq\f(120×30×15-25×502,55×65×80×40)=eq\f(960,143)≈6.713>6.635,所以有99%的把握认为对“线上教学是否满足与性别有关”.②由①可知男生抽3人,女生抽5人,依题可知ξ的可能取值为0,1,2,3,并且ξ听从超几何分布,P(ξ=k)=eq\f(C\o\al(k,3)C\o\al(3-k,5),C\o\al(3,8))(k=0,1,2,3),即P(ξ=0)=eq\f(C\o\al(3,5),C\o\al(3,8))=eq\f(5,28),P(ξ=1)=eq\f(C\o\al(2,5)C\o\al(1,3),C\o\al(3,8))=eq\f(15,28)P(ξ=2)=eq\f(C\o\al(1,5)C\o\al(2,3),C\o\al(3,8))=eq\f(15,56),P(ξ=3)=eq\f(C\o\al(3,3),C\o\al(3,8))=eq\f(1,56).可得分布列为ξ0123Peq\f(5,28)eq\f(15,28)eq\f(15,56)eq\f(1,56)∴E(ξ)=0×eq\f(5,28)+1×eq\f(15,28)+2×eq\f(15,56)+3×eq\f(1,56)=eq\f(9,8).名师点拨解独立性检验的应用问题的关注点(1)两个明确:①明确两类主体.②明确探讨的两个问题.(2)两个关键:①精确列出2×2列联表:②精确理解K2.留意:查表时不是查最大允许值,而是先依据题目要求的百分比找到第一行对应的数值,再将该数值对应的k值与求得的K2相比较.另外,表中第一行数据表示两个变量没有关联的可能性p,所以其有关联的可能性为1-p.〔变式训练2〕(2024·湖北十堰调研)某土特产超市为预估2024年元旦期间游客购买土特产的状况,对2024年元旦期间的90位游客购买状况进行统计,得到如下人数分布表.购买金额(元)[0,15)[15,30)[30,45)[45,60)[60,75)[75,90]人数101520152010(1)依据以上数据完成2×2列联表,并推断是否有95%的把握认为购买金额是否少于60元与性别有关;不少于60元少于60元合计男40女18合计(2)为吸引游客,该超市推出一种实惠方案,购买金额不少于60元可抽奖3次,每次中奖概率为p(每次中奖互不影响,且p的值等于人数分布表中购买金额不少于60元的频率),中奖1次减5元,中奖2次减10元,中奖3次减15元.若游客甲安排购买80元的土特产,请列出实际付款数X(元)的分布列并求其数学期望.附:参考公式和数据:K2=eq\f(nad-bc2,a+bc+da+cb+d),n=a+b+c+d.附表:k02.0722.7063.8416.6357.879P(K2≥k0)0.1500.1000.0500.0100.005[解析](1)2×2列联表如下:不少于60元少于60元合计男124052女182038合计306090K2=eq\f(90×12×20-40×182,30×60×52×38)=eq\f(1440,247)>3.841,因此有95%的把握认为购买金额是否少于60元与性别有关.(2)X可能取值为65,70,75,80,且p=eq\f(10+20,90)=eq\f(1,3),P(X=65)=Ceq\o\al(3,3)eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(1,3)))3=eq\f(1,27),P(X=70)=Ceq\o\al(2,3)eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(1,3)))2×eq\f(2,3)=eq\f(2,9),P(X=75)=Ceq\o\al(1,3)×eq\f(1,3)×eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(2,3)))2=eq\f(4,9),P(X=80)=Ceq\o\al(0,3)eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(2,3)))3=eq\f(8,27),所以X的分布列为X65707580P(X)eq\f(1,27)eq\f(2,9)eq\f(4,9)eq\f(8,27)E(X)=65×eq\f(1,27)+70×eq\f(2,9)+75×eq\f(4,9)+80×eq\f(8,27)=75.名师讲坛·素养提升非线性回来问题例4(2024·内蒙古乌兰察布等五市调研)一个调查学生记忆的探讨团队从某中学随机选择100名学生进行记忆测试,通过讲解100个生疏单词后,相隔非常钟进行听写测试,间隔时间t(分钟)和答对人数y的统计表格如下:时间t(分钟)102030405060708090100答对人数y987052363020151155lgy1.991.851.721.561.481.301.181.040.70.7时间t与答对人数y的散点图如图:附:eq\i\su(n=1,10,t)eq\o\al(2,i)=38500,eq\i\su(n=1,10,y)i=342,eq\i\su(n=1,10,l)gyi=13.5,eq\i\su(n=1,10,t)iyi=10960,eq\i\su(n=1,10,t)ilgyi=620

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论