重难点专题47回归分析与独立性检验十三大题型汇总(解析版)_第1页
重难点专题47回归分析与独立性检验十三大题型汇总(解析版)_第2页
重难点专题47回归分析与独立性检验十三大题型汇总(解析版)_第3页
重难点专题47回归分析与独立性检验十三大题型汇总(解析版)_第4页
重难点专题47回归分析与独立性检验十三大题型汇总(解析版)_第5页
已阅读5页,还剩180页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

重难点专题47回归分析与独立性检验十三大题型汇总题型1线性回归方程 1题型2非线性之幂函数方程 11题型3非线性之指数函数方程 20题型4非线性之对数函数方程 29题型5残差相关模型 43题型6独立性检验 52题型7回归分析与二项分布 63题型8回归分析与超几何分布 72题型9回归分析与独立性检验 82题型10回归分析与正态分布 92题型11独立性检验与正态分布 103题型12独立性检验与超几何分布 114题型13独立性检验与二项分布 123题型1线性回归方程解答线性回归问题,应通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析.【例题1】(2023上·河南三门峡·高三统考期末)2021年春节前,受疫情影响,各地鼓励外来务工人员选择就地过年.某市统计了该市4个地区的外来务工人数与就地过年人数(单位:万),得到如下表格:A区B区C区D区外来务工人数x/万3456就地过年人数y/万2.5344.5(1)请用相关系数说明y与x之间的关系可用线性回归模型拟合,并求y关于x的线性回归方程y=(2)假设该市政府对外来务工人员中选择就地过年的每人发放1000元补贴.①若该市E区有2万名外来务工人员,根据(1)的结论估计该市政府需要给E区就地过年的人员发放的补贴总金额;②若A区的外来务工人员中甲、乙选择就地过年的概率分别为p,2p-1,其中12<p参考公式:相关系数r=i=1nxiy【答案】(1)y与x之间的线性相关程度非常强,y(2)①1750万元;②1【分析】(1)根据相关系数r的绝对值越接近1,线性回归模型的拟合效果越好,即可以根据直接计算相关系数r的值来判断y与x之间的线性相关程度的强弱;y关于x的线性回归方程直接用参考公式求解.(2)(i)将x=2代入(1)中的线性回归方程,即可求出E(ii)由X的所有可能取值为0,1,2,并分别求出相应的概率,即可得到分布列,然后求出期望,最后列出不等式求出p的取值范围.【详解】(1))由题,x=3+4+5+64i=1i=1i=1所以相关系数r=因为y与x之间的相关系数近似为0.99,说明y与x之间的线性相关程度非常强,所以可用线性回归模型拟合y与x之间的关系.b=66.5-4×4.5×3.586-4×故y关于x的线性回归方程为y=0.7(2)①将x=2代入y=0.7x故估计该市政府需要给E区就地过年的人员发放的补贴总金额为1.75×1000=1750(万元).②设甲、乙两人中选择就地过年的人数为X,则X的所有可能取值为0,1,2,P(P(P(所以E(所以E(1000由1000(3p-1)≤1400又12<p故p的取值范围为12【变式1-1】1.(2022·吉林·东北师大附中校考模拟预测)2015年7月31日,在吉隆坡举行的国际奥委会第128次全会上,北京获得2022年冬奥会举办权.在申冬奥过程中,中国正式向国际社会作出“带动三亿人参与冰雪运动”的庄严承诺.这一承诺,既是我国为国际奥林匹克运动做出重大贡献的大国担当展现,也是根据我国经济水平和全民健身需求做出的群众性运动的战略部署.从北京冬奥会申办成功到2021年10月,全国参与冰雪运动人数累计达到3.46亿,实现了“带动三亿人参与冰雪运动”的目标,这是北京冬奥会给予全球冬季体育运动和奥林匹克运动的最为重要的遗产,可以说是2022年北京冬奥会的第一块金牌.“冬奥热”带动“冰雪热”,也带动了冰雪经济,以冰雪运动为主要内容的冰雪旅游近年来发展迅速,2016至2022六个冰雪季的旅游人次y(单位亿)的数据如下表:年度2016—20172017—20182018—20192019—20202020—20212021—2022年度代号t123456旅游人次y1.71.972.240.942.543.15(1)求y与t的相关系数(精确到0.01),并回答y与t的线性相关关系的强弱;(2)因受疫情影响,现将2019—2020年度的异常数据剔除,用剩下的5个年度数据(年度代号不变),求y关于t的线性回归方程(系数精确到0.01),并推测没有疫情情况下,2019—2020年度冰雪旅游人次的估计值.附注:参考数据:t=16i=16ti=3.5,y=16i【答案】(1)0.55,线性相关性不强(2)y=0.26t+1.43【分析】(1)由已知数据结合相关系数公式求出相关系数,再进行判断即可,(2)由已知数据结合回归方程公式计算y关于t的线性回归方程,再将t=4代入回归方程可求出2019—2020【详解】(1)由参考数据计算得i所以r=因为0<r<0.75(2)五组数据的均值分别为t'=3.4iib^ay关于t的线性回归方程为y令t=4,则y因此,在没有疫情情况下,2019-2020年度冰雪旅游人次的估计值为2.47亿.【变式1-1】2.(2022·甘肃·统考二模)人工智能教育是将人工智能与传统教育相结合,借助人工智能和大数据技术打造的智能化教育生态.为了解我国人工智能教育发展状况,通过中国互联网数据平台得到我国2015年-2020年人工智能教育市场规模统计图.如图所示,若用x表示年份代码(2015年用1表示,2016年用2表示,依次类推),用y表示市场规模(单位:亿元),试回答:(1)根据条形统计图中数据,计算变量y与x的相关系数r,并用r判断两个变量y与x相关关系的强弱(精确到小数点后2位);(2)若y与x的相关关系拟用线性回归模型表示,试求y关于x的线性回归方程,并据此预测2022年中国人工智能教育市场规模(精确到1亿元).附:线性回归方程y=bx相关系数r=参考数据:i=1【答案】(1)r≈0.96,正相关很强(2)y=382.86x-386.01【分析】(1)根据统计图中数据计算x,y,i(2)根据统计图中数据结合公式即可求出线性回归方程,将x=8代入线性回归方程即可预测2022年中国人工智能教育市场规模.【详解】(1)∵x=16i=16x∴相关系数r=∵相关系数r≈0.96>0.75,∴y与x具有线性相关关系,且正相关很强(2)设y关于x的线性回归方程为y=其中b=a=∴y关于x的线性回归方程为y=382.86把x=8代入得y≈2677(亿元故据此预测2022年中国人工智能教育市场规模将达到约2677亿元.【变式1-1】3.(2021·全国·高三阶段练习)击鼓传花,也称传彩球,是中国民间游戏,数人或几十人围成圆圈坐下,其中一人拿花(或一小物件);另有一人背着大家或蒙眼击鼓(桌子、黑板或其他能发出声音的物体),鼓响时众人开始传花(顺序不定),至鼓停止为止.此时花在谁手中(或其座位前),谁就上台表演节目,某单位组织团建活动,9人一组,共10组,玩击鼓传花,(前五组)组号x与组内女性人数y统计结果如表:x12345y22334(Ⅰ)女性人数y与组号x(组号变量x依次为1,2,3,4,5,…)具有线性相关关系,请预测从第几组开始女性人数不低于男性人数;参考公式:b(Ⅱ)在(Ⅰ)的前提下,从10组中随机抽取3组,求若3组中女性人数不低于5人的有X组,求X的分布列与期望;(Ⅲ)游戏开始后,若传给相邻的人得1分,间隔人传得2分,每击一次鼓传一次花,得1分的概率为0.2,得2分的概率为0.8.记鼓声停止后得分恰为n分的概率为an,求a【答案】(Ⅰ)从第8组开始女性人数不低于男性人数;(Ⅱ)分布列见解析,EX=910;(【分析】(Ⅰ)根据题中表格结合参考公式即可求解;(Ⅱ)先写出X的所有可能取值,再求出对应的概率,即可求解;(Ⅲ)根据对立事件列出关系式,再利用等比数列的定义和通项公式即可求解.【详解】(Ⅰ)由题可得x=y=2+2+3+3+4i=1则b∧a=∴y=0.5当0.5x+1.3≥5时,∴预测从第8组开始女性人数不低于男性人数.(Ⅱ)由题可知X的所有可能取值为0,1,2,3,PXPXPXPX则X的分布列为X0123P72171∴EX(Ⅲ)在得分为n-1分的基础上再传一次,则得分可能为n分或n+1分,记“合计得n分”为事件A,“合计得n+1分”为事件B,事件∵PA=a∴an∴an【变式1-1】4.(2021·江苏南通·二模)网上购物就是通过互联网检索商品信息,并通过电子订购单发出购物请求,厂商通过邮购的方式发货或通过快递公司送货上门,货到后通过银行转账、微信或支付宝支付等方式在线汇款,根据2019年中国消费者信息研究,超过40%的消费者更加频繁地使用网上购物,使得网上购物和送货上门的需求量激增,越来越多的消费者也首次通过第三方APP、品牌官方网站和微信社群等平台进行购物,某天猫专营店统计了2020年8月5日至9日这5天到该专营店购物的人数yi和时间第xx12345y75849398100(1)由表中给出的数据是否可用线性回归模型拟合人数y与时间x之间的关系?若可用,估计8月10日到该专营店购物的人数(人数用四舍五入法取整数;若|r|>0.75,则线性相关程度很高,可用线性回归模型拟合,计算r时精确到参考数据:4340≈65.88.附:相关系数r=i=1n(2)运用分层抽样的方法从第1天和第5天到该专营店购物的人中随机抽取7人,再从这7人中任取3人进行奖励,求这3人取自不同天的概率.(3)该专营店为了吸引顾客,推出两种促销方案:方案一,购物金额每满100元可减10元;方案二,一次性购物金额超过800元可抽奖三次,每次中奖的概率均为13,且每次抽奖互不影响,中奖一次打9折,中奖两次打8折,中奖三次打6折.某顾客计划在此专营店购买1000元的商品,请从实际付款金额的数学期望的角度分析选哪种方案更优惠【答案】(1)可用线性回归模型拟合人数y与天数x之间的关系,8月10日到该专营店购物的人数约为109;(2)67;(3)选择方案二更划算【分析】(1)利用题中所给数据和公式,求出相关系数r的值,由此判断变量y与x具有很强的线性相关性,再求出b和a,得线性回归方程,令x=6(2)先利用分层抽样得到第1天和第5天取的人数分别为3人和4人,然后由古典概型概率计算公式即可求解;(3)分别求出方案一和方案二所需付款数,比较即可求解.【详解】解:(1)由表中数据可得x=3,y=90,i,i=1所以r=所以可用线性回归模型拟合人数y与天数x之间的关系.而b=则a=所以y=6.4令x=6,可得y答:8月10日到该专营店购物的人数约为109.(2)因为75:100=3:4,所以从第1天和第5天取的人数分别为3和4,从而3人取自不同天的种数为C3所以概率P=答:这3人取自不同天的概率为67(3)若选方案一,需付款1000-100=900元.若选方案二,设需付款X元,则X的取值可能为600,800,900,1000,则P(P(P(P(所以E(因此选择方案二更划算.题型2非线性之幂函数方程幂函数型回归模型的处理方法:幂函数型y=axn(n为常数,a,x,y均取正值),两边取常用对数1gy=1g(axn),即lgy=nlgx+lga,令y′=1gy,x′=1gx,原方程变为y′=nx′+lga,然后按线型回归模型求出n,lga.【例题2】(2021上·四川成都·高三石室中学校考期末)为帮助乡村脱贫,某勘探队计划了解当地矿脉某金属的分布情况,测得了平均金属含量y(单位:gm3)与样本对原点的距离x(单位:m)的数据,并作了初步处理,得到了下面的一些统计理的值.(表中uixyuiiiii697.900.21600.1414.1226.13-(1)利用样本相关系数的知识,判断y=a+bx与y=(2)根据(1)的结果回答下列问题:①建立y关于x的回归方程;②样本对原点的距离x=20附:对于一组数据t1,s1,t2,s【答案】(1)y=(2)①y=100-10x【分析】(1)分别求出y=a+bx与y(2)根据数据和公式即可求得y关于x的回归方程,根据回归方程代入x=20,即可求出金属含量的预报值【详解】(1)由题y=a+y=c+因为r1r2所以y=c+dx更适宜作为平均金属含量(2)①由(1)y=c+dx则y=所以d=i=1则y=100-10即y=100-②当x=20金属含量的预报值y【变式2-1】1.(2023上·全国·高三专题练习)数独是源自18世纪瑞士的一种数学游戏,玩家需要根据9×9盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(3×3)内的数字均含1~9,且不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.参考数据t=iti17500.370.55参考公式:对于一组数据(u1,v1),(1)赛前小明进行了一段时间的训练,每天解题的平均速度y(秒/题)与训练天数x(天)有关,经统计得到如下数据:x(天)1234567y(秒/题)910800600440300240210现用y=a+bx作为回归方程模型,请利用表中数据,求出该回归方程;((2)小明和小红玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,不存在平局,两人约定先胜3局者赢得比赛.若小明每局获胜的概率为23,且各局之间相互独立,设比赛X局后结束,求随机变量X【答案】(1)y=(2)分布列见解析,均值107【分析】(1)由y=a+bx,ti=(2)根据随机变量X的可能取值逐一分析,当X=3时,小明连胜3局或小红连胜3局;当X=4时,小明前3局胜2局最后一局胜或小红前3局胜2局最后一局胜;当X=5时,小明前4局胜2局最后一局胜或小红前4局胜2局最后一局胜;分别求出每个取值的概率.最后代入期望公式计算即可.【详解】(1)解:因为y=a+因为y=所以b=所以a=所以y=所以所求回归方程为y=(2)解:随机变量X的所有可能取值为3,4,5,P(P(P(所以随机变量X的分布列为X345P1108E(【变式2-1】2.(2023·四川绵阳·统考二模)抗体药物的研发是生物技术制药领域的一个重要组成部分,抗体药物的摄入量与体内抗体数量的关系成为研究抗体药物的一个重要方面.某研究团队收集了10组抗体药物的摄入量与体内抗体数量的数据,并对这些数据作了初步处理,得到了如图所示的散点图及一些统计量的值,抗体药物摄入量为x(单位:mg),体内抗体数量为y(单位:AU/mL).iiii29.2121634.4

(1)根据经验,我们选择y=cxd作为体内抗体数量y关于抗体药物摄入量x的回归方程,将y=cxd两边取对数,得lny=lnc+(2)经技术改造后,该抗体药物的有效率z大幅提高,经试验统计得z服从正态分布N∼0.48,0.032,那这种抗体药物的有效率附:①对于一组数据ui,vii=1,2,⋯,10,其回归直线②若随机变量Z~Nμ,σ2,则有③取e≈2.7【答案】(1)y=e(2)0.0228【分析】(1)用最小二乘法求解回归直线方程,再求非线性回归方程即可;(2)根据正态分布的对称性求解给定区间的概率即可.【详解】(1)将y=cx设z=lny,t由表中数据可知,z=110所以d^=i所以z=1+0.5t,即故y关于x的回归方程为y=当x=25mg时,(2)因为z服从正态分布N0.48,0.032,其中μ所以Pμ所以Pz故这种抗体药物的有效率z超过0.54的概率约为0.0228.【变式2-1】3.(2023下·重庆沙坪坝·高三重庆八中校考阶段练习)在正常生产条件下,根据经验,可以认为化肥的有效利用率近似服从正态分布N(0.54,0.02(1)假设生产条件正常,记X表示化肥的有效利用率,求P((2)课题组为研究每亩化肥施用量与某农作物亩产量之间的关系,收集了10组数据,并对这些数据作了初步处理,得到了如图所示的散点图及一些统计量的值.其中每亩化肥施用量为x(单位:公斤),粮食亩产量为y(单位:百公斤)

参考数据:iiiiiiii65091.552.51478.630.5151546.5ti=lnxi,zi=ln(i)根据散点图判断,y=a+bx与y=(ii)根据(i)的判断结果及表中数据,建立y关于x的回归方程;并预测每亩化肥施用量为27公斤时,粮食亩产量y的值.(附:①对于一组数据(ui,vi)(i=1,2,3,…,②若随机变量X∼N(μ,【答案】(1)0.15865(2)(i)y=cxd适宜作为粮食亩产量y关于每亩化肥施用量x的回归方程;(ii)【分析】(1)根据正态分布曲线的对称性,结合P((2)(i)由散点图可知y与x的关系不是线性关系,即可得到答案;(ii)由y=cxd,得到lny=dln【详解】(1)解:由X∼可得P((2)解:(i)由散点图可知y与x的关系不是线性关系,所以y=cxd适宜作为粮食亩产量(ii)因为y=cxd,所以lny由表可得t=1.5,z=1.5所以lnc=z-d当x=27时,y【变式2-1】4.(2023·云南保山·统考二模)中医药是包括汉族和少数民族医药在内的我国各民族医药的统称,是具有悠久历史传统和独特理论技术方法的医药体系,长期呵护着我们的健康,为中华文明的延续作出了突出贡献.某科研机构研究发现,某味中药的药用量x(单位:克)与药物功效y(单位:药物功效单位)之间具有关系y=10(1)估计该味中药的最佳用量与功效;(2)对一批含有这昧中药的合成药物进行检测,发现这味中药的药用量平均值为6克,标准差为2,估计这批合成药的药物功效y的平均值.【答案】(1)该药物使用量为5克时可达最大功效25.(2)20【分析】(1)根据用量x与功效y之间具有关系y=10(2)根据题意求得1ni=1nxi【详解】(1)解:由题意,某味中药的药用量x与药物功效y之间具有关系y=10可得y=10x-x2即该药物使用量为5克时可达最大功效25.(2)解:由题意,得x=1ni=1则y=1ni=1这批合成药的药物功效平均值为20.题型3非线性之指数函数方程1.直接设指数求解;2.取对数化简,再设对数求解【例题3】(2023·全国·模拟预测)一座城市的夜间经济不仅有助于拉动本地居民内需,还能延长外地游客、商务办公者等的留存时间,带动当地经济发展,是衡量一座城市生活质量、消费水平、投资环境及文化发展活力的重要指标.数据显示,近年来中国各地政府对夜间经济的扶持力度加大,夜间经济的市场发展规模保持稳定增长,下表为2017—2022年中国夜间经济的市场发展规模(单位:万亿元),其中2017—2022年对应的年份代码依次为1~6.年份代码x123456中国夜间经济的市场发展规模y/20.522.926.430.936.442.4(1)已知可用函数模型y=a⋅bx拟合y与x的关系,请建立y关于x(2)某传媒公司预测2023年中国夜间经济的市场规模将达到48.1万亿元,现用(1)中求得的回归方程预测2023年中国夜间经济的市场规模,若两个预测规模误差不超过1万亿元,则认为(1)中求得的回归方程是理想的,否则是不理想的,判断(1)中求得的回归方程是否理想.参考数据:viee1.163.36673.28217.251.162.83其中vi参考公式:对于一组数据u1,v1,【答案】(1)y=(2)是理想的【分析】(1)通过对所给的的函数模型取对数,转换为求回归直线方程即可,再结合题中所给的直线方程与数据即可得解.(2)利用(1)中求得的函数模型进行预测,结合回归方程理想的定义判断即可.【详解】(1)将y=a⋅所以v=lna而i=1所以b=i=1lna所以v=2.848+0.148x,即所以y=(2)2023年对应的年份代码为7,当x=7时,y=17.25×1.16所以(1)中求得的回归方程y=17.25×【变式3-1】1.(2023·四川内江·统考一模)某企业为响应国家号召,汇聚科研力量,加强科技创新,准备加大研发资金投入,为了解年研发资金投入额x(单位:亿元)对年盈利额y(单位:亿元)的影响,通过对“十二五”和“十三五”规划发展10年期间年研发资金投入额xi和年盈利额yi(i=1,2,⋯,10)数据进行分析,建立了两个函数模型:y=α+βx2;y=eλx+xyuviiiiii(1)请从相关系数的角度,分析哪一个模型拟合度更好?(2)根据(1)的选择及表中数据,建立y关于x的回归方程.(系数精确到0.01)附:相关系数r回归直线y=bx+a【答案】(1)模型y=(2)y【分析】(1)计算出两个模型的相关系数,判断即可;(2)根据最小二乘法计算即可.【详解】(1)设模型y=α+βx2的相关系数为对于模型y=α+βx所以r1对于模型y=eλx+t,有ln所以r2因为r1<r2(2)因为λ=i=1所以y关于x的回归方程为y=【点睛】本题考查回归方程的求解,其中第二问中,需要对y=eλx+t取对数得lny=λx+t【变式3-1】2.(2023·全国·模拟预测)近三年的新冠肺炎疫情对我们的生活产生了很大的影响,当然也影响着我们的旅游习惯,乡村游、近郊游、周边游热闹了许多,甚至出现“微度假”的概念.在国家有条不紊的防疫政策下,旅游又重新回到了老百姓的日常生活中.某乡村抓住机遇,依托良好的生态环境、厚重的民族文化,开展乡村旅游.通过文旅度假项目考察,该村推出了多款套票文旅产品,得到消费者的积极回应.该村推出了六条乡村旅游经典线路,对应六款不同价位的旅游套票,相应的价格x与购买人数y的数据如下表.旅游线路奇山秀水游古村落游慢生活游亲子游采摘游舌尖之旅套票型号ABCDEF价格x/元394958677786经数据分析、描点绘图,发现价格x与购买人数y近似满足关系式y=axba>0,b>0,即lny=blnx附:①可能用到的数据:i=16viwi=75.3②对于一组数据v1,w2,v2,w2,…,(1)根据所给数据,求y关于x的回归方程.(2)按照相关部门的指标测定,当套票价格x∈49,81时,该套票受消费者的欢迎程度更高,可以被认定为“热门套票”.现有三位游客,每人从以上六款套票中购买一款旅游,购买任意一款的可能性相等.若三人买的套票各不相同,记三人中购买“热门套票”的人数为X,求随机变量【答案】(1)y=(2)分布列见解析,EX【分析】(1)将回归方程线性化处理,应用最小二乘法求线性方程,再由已知关系求回归方程;(2)由题意确定X的可能取值,并求出对应概率,进而写出分布列,即可求期望.【详解】(1)散点vi设回归直线方程为w=bv+a则b=i=1所以回归直线方程为w=因为vi=lnxi,wi=lny综上,y关于x的回归方程为y=(2)由题意知B,C,D,E为“热门套票”,则三人中购买“热门套票”的人数X服从超几何分布,X的可能取值为1,2,3,且PX=1=C4X的分布列如下.X123P131EX【变式3-1】3.(2023上·山东淄博·高三统考期中)为传承和发扬淄博陶瓷,某陶瓷公司计划加大研发力度.为确定下一年度投资计划,需了解年研发资金xi(亿元)与年销售额yi(亿元)的关系.该公司对历史数据进行对比分析,建立了两个函数模型:①y=α+βx2,②y=eλx现该公司收集了近12年的年研发资金xi和年销售额yi的数据,i=1,2,⋯,12,并对这些数据作了初步处理,得到了散点图及一些统计量的值.令uxyiiuv20667702004604.20iiii3125000215000.30814(1)设ui和yi的相关系数为r1,xi和(2)根据(1)的选择及表中数据,建立y关于x的回归方程(计算过程中保留到0.001,最后结果精确到0.01);(3)为进一步了解人们对新款式瓷器喜爱程度(分为“比较喜欢”和“不太喜欢”)是否跟年龄(分为“小于30岁”和“不小于30岁”)有关,公司从该地区随机抽取600人进行调查,调查数据如下表:比较喜欢不太喜欢合计年龄小于30岁200100300年龄不小于30岁150150300合计350250600根据小概率α=0.001附:①相关系数r=i=1nxi-②χ2=nα0.150.10.050.0250.010.001x2.0722.7063.8415.0246.63510.828③参考数据:308=4×77.【答案】(1)模型y=(2)y(3)该地区对新款式瓷器喜爱程度与年龄有关【分析】(1)由相关系数求出两个系数,比较大小可得;(2)先建立v关于x的线性回归方程,从而得出y关于x的回归方程;(3)计算出χ2的值即可得到判断【详解】(1)r1=ir2=i则r1<r(2)先建立v关于x的线性回归方程.由y=eλx+t由于λ=t所以v关于x的线性回归方程为v=0.02x所以lny=0.02(3)零假设为H0χ2根据小概率α=0.001独立性检验,可推断H即该地区对新款式瓷器喜爱程度与年龄有关【变式3-1】4.(2023上·重庆渝中·高三统考期中)当前,新一轮科技革命和产业变革蓬勃兴起,以区块链为代表的新一代信息技术迅猛发展,现收集某地近6年区块链企业总数量相关数据,如下表:年份201720182019202020212022编号x123456企业总数量y(单位:百个)5078124121137352(1)若用模型y=aebx拟合y与x的关系,根据提供的数据,求出(2)为了促进公司间的合作与发展,区块链联合总部决定进行一次信息化技术比赛,邀请甲、乙、丙三家区块链公司参赛.比赛规则如下:①每场比赛有两个公司参加,并决出胜负;②每场比赛获胜的公司与未参加此场比赛的公司进行下一场的比赛;③在比赛中,若有一个公司首先获胜两场,则本次比赛结束,该公司获得此次信息化比赛的“优胜公司”.已知在每场比赛中,甲胜乙的概率为12,甲胜丙的概率为13,乙胜丙的概率为35,若首场由甲乙比赛,求甲公司获得“参考数据:i=16参考公式:对于一组数据xi,yi【答案】(1)y(2)3【分析】(1)令u=lny(2)由根据相互独立事件概率的乘法公式计算即可得到答案.【详解】(1)令u=x=则b=lna=4.75-0.36×3.5=3.49,所以所以y=(2)设甲公司获得“优胜公司”为事件A,则PA所以甲公司获得“优胜公司”的概率为310题型4非线性之对数函数方程1.直接设对数求解;2.对指数型取对数【例题4】(2023·福建·统考模拟预测)放行准点率是衡量机场运行效率和服务质量的重要指标之一.某机场自2012年起采取相关策略优化各个服务环节,运行效率不断提升.以下是根据近10年年份数xi与该机场飞往A地航班放行准点率yi(ixytiiii2017.580.41.540703145.01621254.227.71226.8其中ti=(1)根据散点图判断,y=bx+a与y=clnx-2012+d(2)已知2023年该机场飞往A地、B地和其他地区的航班比例分别为0.2、0.2和0.6.若以(1)中的预测值作为2023年该机场飞往A地航班放行准点率的估计值,且2023年该机场飞往B地及其他地区(不包含A、B两地)航班放行准点率的估计值分别为80%和75(i)现从2023年在该机场起飞的航班中随机抽取一个,求该航班准点放行的概率;(ii)若2023年某航班在该机场准点放行,判断该航班飞往A地、B地、其他地区等三种情况中的哪种情况的可能性最大,说明你的理由.附:(1)对于一组数据u1,v1,u2,v2,…参考数据:ln10≈2.30,ln11≈2.40,【答案】(1)y=clnx-2012(2)(i)0.778;(ii)可判断该航班飞往其他地区的可能性最大,理由见解析【分析】(1)根据线性回归方程的计算公式,选择合适的模型计算即可;(2)利用全概率公式和条件概率公式,即可根据概率判断可能性最大的情况.【详解】(1)由散点图判断y=clnx-2012+d令t=lnx-2012,先建立由于c=d=该机场飞往A地航班放行准点率y关于t的线性回归方程为y=4因此y关于年份数x的回归方程为y所以当x=2023时,该机场飞往A地航班放行准点率yy=4所以2023年该机场飞往A地航班放行准点率y的预报值为84%(2)设A1=“该航班飞往A地”,A2=“该航班飞往B地”,A3=“该航班飞往其他地区”则PA1=0.2,PPCA1=0.84,(i)由全概率公式得,P=0.84×0.2+0.8×0.2+0.75×0.6=0.778,所以该航班准点放行的概率为0.778.(ii)PAPAPA因为0.6×0.75>0.2×0.84>0.2×0.8,所以可判断该航班飞往其他地区的可能性最大.【变式4-1】1.(2023·云南昆明·高三昆明一中校考阶段练习)《中共中央国务院关于全面推进乡村振兴加快农业农村现代化的意见》,这是21世纪以来第18个指导“三农”工作的中央一号文件.文件指出,民族要复兴,乡村必振兴,要大力推进数字乡村建设,推进智慧农业发展.某乡村合作社借助互联网直播平台进行农产品销售,众多网红主播参与到直播当中,在众多网红直播中,统计了10名网红直播的观看人次xi和农产品销售量yi(1)利用散点图判断,y=a+bx和y(2)对数据作出如下处理:得到相关统计量的值如表:xyωiiii9.430.323666.6439.266其中令ωi=lnxi,ω=110i=1(3)规定:观看人次大于等于120万人次的主播为优秀主播,从这10名主播中随机抽取3名,记其中优秀主播的人数为X,求X的分布列和数学期望.参考数据和公式:ln2≈0.69,附:对于一组数据u1,v1,u2,v2,…,【答案】(1)y=(2)y=10.3+10lnx(3)分布列见解析,6【分析】(1)观察散点图,根据散点的分布规律判断应采用的模型;(2)令ω=lnx,先求y与ω的线性回归方程,由此可得y(3)确定随机变量的X的可能取值,再求取各值的概率,由此可得X的分布列,利用均值公式求其期望.【详解】(1)由散点图可知,散点分布在一条对数型曲线附近,所以选择回归方程y=(2)令ω=lnx因为i=110ω所以d=又y=30.3,ω所以c=所以y与ω的线性回归方程为y=10.3+10故y关于x的回归方程为y=10.3+10令x=28,代入回归方程可得y所以预测观看人次为280万人时的销售量约为43600件.(3)由散点图可知,这10名主播中,优秀主播的个数有4个,所以X的可能取值为0,1,2,3,所以PX=0=PX=2=所以X的分布列为:X0123P1131数学期望EX【变式4-1】2.(2023·山西·校联考模拟预测)某剧场的座位数量是固定的,管理人员统计了最近在该剧场举办的五场表演的票价xi(单位:元)和上座率yi(上座人数与总座位数的比值)的数据,其中(1)由散点图判断y=bx+a与y=(2)根据(1)所求的回归方程,预测票价为多少时,剧场的门票收入最多.参考数据:x=240,y=0.5,i=15xi2=365000,i=15xiyi参考公式:对于一组数据u1,v1,u2【答案】(1)y=clnx+d能更好地对(2)预测票价为220元时,剧场的门票收入最多.【分析】(1)由散点图知,y=clnx+d能更好地对y与x的关系进行拟合,设z=lnx,由公式求出c,再将y,z(2)设函数fx【详解】(1)y=clnx+d设z=lnx,先求y由已知得z=所以c=d=所以y关于z的线性回归方程为y=-0.5所以y关于x的回归方程为y=-0.5(2)设该剧场的总座位数为M,由题意得门票收入为M-设函数fx=-0.5x当f'(x)<0,即x>所以f(x)在所以预测票价为220元时,剧场的门票收入最多.【变式4-1】3.(2023·辽宁朝阳·校联考一模)秋天的第一杯奶茶是一个网络词汇,最早出自四川达州一位当地民警之口,民警用“秋天的第一杯奶茶”顺利救下一名女孩,由此而火爆全网.后来很多人开始在秋天里买一杯奶茶送给自己在意的人.某奶茶店主记录了入秋后前7天每天售出的奶茶数量(单位:杯)如下:日期第一天第二天第三天第四天第五天第六天第七天日期代码x1234567杯数y4152226293132(1)请根据以上数据,绘制散点图,并根据散点图判断,y=a+bx与y=(2)建立y关于x的回归方程(结果保留1位小数),并根据建立的回归方程,试预测要到哪一天售出的奶茶才能超过35杯?(3)若每天售出至少25杯即可盈利,则从第一天至第七天中任选三天,记随机变量X表示盈利的天数,求随机变量X的分布列.参考公式和数据:其中u回归直线方程y=byuiiie22.71.2759235.113.28.2【答案】(1)图见解析,y=c+dln(2)yˆ=5.7+14.2lnx,到第(3)分布列见解析.【分析】(1)根据散点图趋势即可判断;(2)利用非线性回归方程转化为线性回归方程的方法求解;(3)根据超几何分布求分布列.【详解】(1)根据散点图,知y=c+dln(2)令u=lnx由已知数据得d=c=所以y=5.7+14.2故y关于x的回归方程为yˆ进而由题意知,令5.7+14.2lnx>35,整理得ln故当x=9时,即到第9天才能超过35(3)由题意知,这7天中销售超过25杯的有4天,则随机变量X的可能取值为0,1,2,3PX=0=PX=2=则随机变量X的分布列为X0123P112184【变式4-1】4.(2022上·四川绵阳·高三绵阳中学校考期末)某创业者计划在某旅游景区附近租赁一套农房发展成特色“农家乐”,为了确定未来发展方向,此创业者对该景区附近五家“农家乐”跟踪调查了100天,这五家“农家乐”的收费标准互不相同,得到的统计数据如下表,x为收费标准(单位:元/日),t为入住天数(单位:天),以频率作为各自的“入住率”,收费标准x与“入住率”y的散点图如图.x100150200300450t9065453020(1)若从以上五家“农家乐”中随机抽取两家深入调查,记ξ为“入住率”超过0.6的农家乐的个数,求ξ的概率分布列;(2)令z=lnx,由散点图判断y=bx+a与(3)根据第(2)问所求的回归方程,试估计收费标准为多少时,100天销售额L最大?(100天销售额L=100×入住率×收费标准x)参考数据:b=i=1nxiyi-nx⋅yi=1nxi2-n【答案】(1)ξ012P331(2)y(3)150元/天【分析】(1)根据图象得出ξ的所有可能情况,利用超几何分布求得不同ξ下的概率,进而列出分布列.(2)由散点图判断出更适模型的回归方程,分别求出b和a,求出回归方程.(3)写出100天销售额L的表达式,再根据导数求得最大值,即可得出收费标准.【详解】(1)由题意,抽取两家深入调查,ξ可能为0,1,2.Pξ=0=C3∴ξ的分布列为:ξ012P331(2)由散点图可知,散点并非均匀分布在一条直线的两侧,而是大致分布在一条曲线的两侧,不符合线性回归模型要求,∴y=yb∵z∴a∴回归方程为:y(3)由题意得,Lx在LxL当L'x=0当L'x<0当L'x>0∴函数在x=e∴收费标准为150元/天时,100天销售额L最大.【变式4-1】5.(2023下·江西·高三校联考阶段练习)中医药在抗击新冠肺炎疫情中,发挥了重要作用.中药可以起到改善平常上呼吸道的症状,同时可以起到抑制病毒繁殖的效果就可以达到治疗新型冠状病毒肺炎的作用.某地种植药材收到了很好的经济效益.根据资料显示,产出的药材的箱数x(单位:十箱)与成本y(单位:千元)的关系如下:x34679y6.577.588.2y与x可用回归方程y=blgx+(1)若农户卖出的该药材的价格为500元/箱,试预测该药材10箱的利润是多少元;(利润=售价-成本)(2)据统计,4月份的连续20天中农户每天为甲地可配送的药材的箱数的频率分布直方图如图,用这20天的情况来估计相应的概率.(i)通过频率分布直方图计算农户每天平均可配送的药材的箱数(同一组中的数据以这组数据所在区间中点的值作代表);(ii)一个运输户拟购置3辆小货车专门运输农户为甲地配送的该药材,一辆货车每天只能运营一趟,每辆车每趟最多只能装载40箱该药材,满载发车,否则不发车.若发车,则每辆车每趟可获利400元;若未发车,则每辆车每天平均亏损200元.试计算此项业务每天的利润平均值的大小.参考数据:设t=tyii0.737.440.530.15参考公式:对于一组数据ui,vi乘估计分别为β=i=1【答案】(1)140(2)125;900【分析】(1)根据公式可求得b=3.53,a=4.86,从而得到y=3.53lgx(2)(i)利用频率分布直方图估计平均数的计算公式可求;(ii)根据频率分布直方图,可求该农户每天可配送的该水果的箱数的概率分布表,进而求得获利的分布列,最后根据均值的计算公式求得此项业务每天的利润平均值.【详解】(1)∵=∴∵∴∴所以a所以y又t=lg所以10箱药材,x=1时,y=3.53lg1+4.86=4.86即该水果10箱的成本为4860元,故该水果10箱的利润为5000-4860=140(元).(2)(i)60×1所以农户每天平均可配送125箱药材.(ii)根据频率分布直方图,可知该农户每天可配送的该水果的箱数的概率分布表为:箱数40,8080,120120,160160,200P1111该运输户购3辆车时每天的利润为Y元,则Y的可能取值为1200,600,0,其分布列为:Y12006000P511∴E(Y题型5残差相关模型残差计算思路如下∶先求出回归方程y=bx+a(b,a直接套公式即可),然后把表格中每一个x值通过方程算出对应的每一个y值,最后与表格中的y值对应相减即可。数据点和它在回归直线上相应位置的差异yi-yi是随机误差的效应,称ei=yi-残差计算公式∶实际观察值与估计值(拟合值)之间的差。残差平方和:i【例题5】(2023上·云南昆明·高三校考阶段练习)云南省统计局发布《全省旅游业发展情况(2015-2022年)》报告,其中2015年至2022年游客总人数y(单位:亿人次)的数据如下表:年份20152016201720182019202020212022年份代号x12345678游客总人数y3.34.35.76.98.15.36.58.4为了预测2023年云南省游客总人数,根据2015年至2022年游客总人数y的数据建立线性回归模型一,得到回归方程l1:y=0.556x+3.56,但由于受到2020年疫情影响,估计预测不准确,若用2015年至2019(1)根据l1和l2预测2023年云南省游客总人数(预测数据精确到(2)为了检验两种模型的预测效果,对两种模型作残差分析得到:模型一:总偏差平方和i=18y模型二:总偏差平方和i=15y用R2来比较模型一与模型二的拟合效果(R2精确到(3)根据2020年至2022年游客总人数y的数据建立线性回归模型三,求回归方程l3,并根据l3预测2023年云南省游客总人数(预测数据精确到0.1参考公式:R2=1-i=1nyi【答案】(1)8.6亿人次,13.0亿人次(2)模型二的拟合效果更好(3)y=1.6x+3.6【分析】(1)代入回归方程求解,(2)由参考公式计算R2(3)由参考公式求解回归方程.【详解】(1)根据l1预测2023年云南省游客总人数为y根据l2预测2023年云南省游客总人数为y=1.22×9+2=12.98≈13.0(2)模型一:R2模型二:R2因为0.998>0.591,所以模型二的拟合效果更好.(3)设2020年至2022年的年份代号x分别为1,2,3,则x=2,y=6.7,1-22+2-22+所以l3:y=1.6x+3.6,所以当所以根据l3预测2023年云南省游客总人数为10(亿人次)【变式5-1】1.(2023下·广西防城港·高三统考阶段练习)某互联网公司为了确定下季度的前期广告投人计划,收集了近6个月广告投入量x(单位:万元)和收益y(单位:万元)的数据如表:月份123456广告投入量24681012收益14.2120.3131.831.1837.8344.67他们用两种模型①y=bx+a

xyi=1i=17301464.24364(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型拟合?并说明理由;(2)残差绝对值大于2的数据被认为是异常数据,需要剔除.(i)剔除异常数据后求出(1)中所选模型的回归方程;(ii)若广告投入量x=18时,(1附:对于一组数据x1,y1【答案】(1)选择模型①,理由见解析(2)(i)y=3x+8.04;(ii【分析】(1)根据残差图的分布比较可得结论;(2)(i)求出剔除异常数据后的平均数,即可求得b和a,即得回归方程;(ii)将x=18代入回归直线方程,即可得答案【详解】(1)选择模型①,因为模型①的残差点比较均匀地落在水平的带状区域中,且模型①的带状区域比模型②的带状区域窄,所以模型①的拟合精度高,回归方程的预报精度高.(2)(i)剔除异常数据,即组号为3的数据,剩下数据的平均数为x'i=1i=1∴b∴所选模型的回归方程为y=3(ⅱ)若广告投入量x=18时,该模型收益的预报值是3×18+8.04=62.04【变式5-1】2.(2023·河北唐山·统考三模)据统计,某城市居民年收入(所有居民在一年内收入的总和,单位:亿元)与某类商品销售额(单位:亿元)的10年数据如下表所示:第n年12345678910居民年收入x32.231.132.935.737.138.039.043.044.646.0商品销售额y25.030.034.037.039.041.042.044.048.051.0依据表格数据,得到下面一些统计量的值.iiiii379.6391247.624568.9m(1)根据表中数据,得到样本相关系数r≈0.95.以此推断,y与x(2)根据统计量的值与样本相关系数r≈0.95,建立y关于x的经验回归方程(系数精确到0.01(3)根据(2)的经验回归方程,计算第1个样本点32.2,25.0对应的残差(精确到0.01);并判断若剔除这个样本点再进行回归分析,b的值将变大还是变小?(不必说明理由,直接判断即可).附:样本xi,y2.297≈1.516,b=i【答案】(1)线性相关程度很强(2)y(3)-5.81【分析】(1)根据样本相关系数r≈0.95(2)由br=i=1nyi-y(3)第一个样本点32.2,25.0的残差为:25.0-1.44×32.2-15.56,计算即可;由于该点在回归直线的左下方,故将其剔除后,b的值将变小【详解】(1)根据样本相关系数r≈0.95,可以推断线性相关程度很强(2)由r=i=1可得br=i所以b=又因为x=37.96,所以a=所以y与x的线性回归方程y=1.44(3)第一个样本点32.2,25.0的残差为:25.0-1.44×32.2-15.56由于该点在回归直线的左下方,故将其剔除后,b的值将变小.【变式5-1】3.(2023·黑龙江哈尔滨·哈尔滨三中校考二模)中国共产党第二十次全国代表大会上的报告中提到,新时代十年我国经济实力实现历史性跃升,国内生产总值从54万亿元增长到114万亿元,我国经济总量稳居世界第二位.建立年份编号为解释变量,地区生产总值为响应变量的一元线性回归模型,现就2012-2016某市的地区生产总值统计如下:年份20122013201420152016年份编号12345地区生产总值(亿元)2.83.13.94.65.6(1)求出回归方程,并计算2016年地区生产总值的残差;(2)随着我国打赢了人类历史上规模最大的脱贫攻坚战,该市2017-2022的地区生产总值持续增长,现对这11年的数据有三种经验回归模型y=1.017x+1.200、y=3.816x-1.645、y=0.107x2+2.365,它们的R(3)若2012-2022该市的人口数(单位:百万)与年份编号的回归模型为y=0.2x+1.2,结合(2参考公式:b=i=1【答案】(1)y=0.71x(2)选用y=0.107x2(3)逐年递增【分析】(1)应用最小二乘法求回归直线方程即可;(2)由相关指数的大小,结合其的实际意义确定较好模型,进而估计2023年该市的地区生产总值;(3)由题设可得该市人均地区生产总值φ=0.535(x+6)+31.085【详解】(1)由数据,x=1+2+3+4+55而i=15x所以b=67.1-5×3×455-5×综上,回归方程为y=0.71当x=5时,y=0.71×5+1.87=5.42,故2016年地区生产总值残差为(2)根据相关指数越大拟合越好,由于0.985>0.976>0.880,故y=0.107因2023年对应x=12,则y=0.107×(3)由(2)及题设知:该市人均地区生产总值φ=令t=x+6≥18,且y所以y2而t2-t1>0,所以y=0.535t+31.085t在[18,+所以该市人均地区生产总值逐年递增.【变式5-1】4.(2023·陕西咸阳·武功县普集高级中学统考二模)2021年,党中央、国务院印发了《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》,也就是我们现在所称的“双减”政策.某地为了检测双减的落实情况,从某高中选了6名同学,检测课外学习时长(单位:分钟),相关数据如下表所示.学生序号123456学习时长/分220180210220200230(1)若从被抽中的6名同学中随机抽出2名,则抽出的2名同学课外学习时长都不小于210分钟的概率;(2)下表是某班统计了本班同学2022年1-7月份的人均月课外劳动时间(单位:小时),并建立了人均月课外劳动时间y关于月份x的线性回归方程y=bx+4,月份x1234567人均月劳动时间y89m12n1922由于某些原因导致部分数据丢失,但已知i=1(i)求m,n的值;(ii)求该班6月份人均月劳动时间数据的残差值(残差即样本数据与预测值之差).附:y=bx+a【答案】(1)2(2)(i)m=10,n=16;(ii【分析】(1)根据古典概型运算公式,结合列举法进行求解即可;(2)(i)根据题中所给的公式进行求解即可;(ii)利用代入法,结合残差的定义进行求解即可.【详解】(1)用x,y表示从被抽中的6名同学中随机抽出2名同学的序号分别为x和y,则基本事件有1,2,1,3,1,4,1,5,1,6,2,3,2,4,2,5,2,6,3,4,3,5,3,6,4,5,4,6,5,6,共将“抽出的2名同学的课外学习时长都不小于210分钟”记为事件,由已知,序号为1,3,4,6的同学课外学习时长都不小于210分钟,∴事件A中基本事件有1,3,1,4,1,6,3,4,3,6,4,6,共6个,∴PA(2)(i)由表知x=y=∴i=1∴b=i=17∵回归直线恒过样本点的中心x,y,∴70+m+由①②,得b=177,∵i=17xiy由③④,得m=10,n(ii)∵线性回归方程为y=∴当x=6时,预测值y=17题型6独立性检验独立性检验的步骤(1)根据实际问题的需要确定允许推断“事件A与B有关系”犯错误的概率的上界α,然后查表确定临界值k.(2)利用公式χ2=eq\f(nad-bc2,a+bc+da+cb+d)计算随机变量χ2.【例题6】(2023上·贵州贵阳·高三贵阳一中校考阶段练习)“村BA”后,贵州“村超”又火出圈!所谓“村超”,其实是目前火爆全网的贵州乡村体育赛事一一榕江(三宝侗寨)和美乡村足球超级联赛,被大家简称为“村超”.“村超”的民族风、乡土味、欢乐感,让每个人尽情享受着足球带来的快乐.某校为了丰富学生课余生活,组建了足球社团.足球社团为了解学生喜欢足球是否与性别有关,随机抽取了男、女同学各50名进行调查,部分数据如表所示:喜欢足球不喜欢足球合计男生20女生15合计100附:χ2α0.10.050.010.0050.001x2.7063.8416.6357.87910.828(1)根据所给数据完成上表,依据α=0.005的独立性检验,能否有99.5(2)社团指导老师从喜欢足球的学生中抽取了2名男生和1名女生示范定点射门.据统计,这两名男生进球的概率均为23,这名女生进球的概率为12,每人射门一次,假设各人进球相互独立,求3人进球总次数X【答案】(1)有99.5%(2)分布列见解析,E【分析】(1)根据男女生各50名及表中数据即可填写2×2列联表,然后根据计算χ2=(2)根据题意可知X的所有可能取值为0,1,2,3,列出分布列,计算出期望从而求解.【详解】(1)依题意,2×2列联表如下:喜欢足球不喜欢足球合计男生302050女生153550合计4555100零假设H0χ2的观测值为χ9.091>7.879=x0.005,根据小概率值α=0.005所以有99.5%的把握认为该中学学生喜欢足球与性别有关(2)依题意,X的所有可能取值为0,1,2,3,PXP所以X的分布列为:X0123P1542数学期EX【变式6-1】1.(2023·全国·模拟预测)中秋节起源于我国,是我国的传统节日之一,吃月饼是中秋节的重要习俗.某超市为了解月饼销售情况,随机调研了某日来店购买月饼的200位顾客,并将调研结果整理如下:年龄购买袋装月饼购买礼盒月饼50岁及以上8020不超过50岁6040(1)根据已知条件,试判断是否有99%(2)假设A表示事件“在该超市购买月饼礼盒赠送玉兔望月挂件”,B表示事件“顾客在该超市购买月饼礼盒”,P(A)>0附:K2=n参考数据:P0.100.050.0250.010k2.7063.8415.0246.635【答案】(1)有(2)证明见解析【分析】(1)根据题意补全列联表,计算出K2后,与6.635比较大小即可判断是否有99(2)根据条件概率计算公式,结合事件间的基本关系证明即可.【详解】(1)补全2×2列联表如下:年龄购买袋装月饼购买礼盒月饼总计50岁及以上8020100不超过50岁6040100总计14060200K2∴有99%(2)由题知,PB∴P∴P∴P∴P∴P∴P即P【变式6-1】2.(2023·全国·模拟预测)某平台为了解当代大学生对“网络公序良俗”的认知情况,设计了一份调查表,题目分为必答题和选答题.其中必答题是①、②、③共三道题,选答题为④、⑤、⑥、⑦、⑧、⑨、⑩共七道题,被调查者在选答题中自主选择其中4道题目回答即可.为了调查当代大学生对④、⑥、⑧、⑩四道选答题的答题情况,从同济大学在④、⑥、⑧、⑩四个题目中至少选答一道的学生中随机抽取100名学生进行调查,他们选答④、⑥、⑧、⑩的题目数及人数统计如表:选答④、⑥、⑧、⑩的题目数1道2道3道4道人数20303020(1)从这100名学生中任选3名,求他们选答④、⑥、⑧、⑩题目数量之和为5的概率;(2)从这100名学生中任选2名,记X表示这2名学生选答④、⑥、⑧、⑩的题目数之差的绝对值,求随机变量X的数学期望;(3)学校还调查了这100位学生的性别情况,研究男女生中“公序良俗”达人的大概比例,得到的数据如下表:(规定同时选答④、⑥、⑧、⑩的学生为“公序良俗”达人)性别“公序良俗”达人非“公序良俗”达人总计男性8女性25总计100请完成上述2×2列联表,并计算回答是否有95%的把握认为“公序良俗”参考公式:χ2=n附表:α0.100.050.0100.001x2.7063.8416.63510.828【答案】(1)48(2)38(3)列联表见解析,有【分析】(1)根据3人选答④、⑥、⑧、⑩题目数量之和为5的情况有(1,1,3),(1,2,2),结合组合知识进行求解;(2)求出X的可能取值和相应的概率,求出分布列,数学期望;(3)完善列联表,计算出卡方,与3.841比较后得到结论.【详解】(1)记“所选取的3名学生选答④、⑥、⑧、⑩题目数量之和为5”为事件A,则3人选答④、⑥、⑧、⑩题目数量之和为5的情况有(1,1,3),(1,2,2),故P((2)由题意可知X的可能取值为0,1,2,3.当X=0时,2人选答④、⑥、⑧、⑩题目数量的情况为(1,1),(2,2),(3,3),(4,4)故P(当X=1时,2人选答④、⑥、⑧、⑩题目数量的情况为(1,2),(2,3),(3,4)故P(当X=2时,2人选答④、⑥、⑧、⑩题目数量的情况为(1,3),(2,4)故P(当X=3时,2人选答④、⑥、⑧、⑩题目数量的情况为(1,4)故P(则X的分布列为X0123P251488数学期望E((3)由题意可得列联表为性别“公序良俗”达人非“公序良俗”达人总计男性85563女性122537总计2080100χ2故有95%的把握认为“公序良俗”【变式6-1】3.(2023下·贵州贵阳·高三校联考阶段练习)某学校共有1000名学生参加数学知识竞赛,其中男生250人.为了了解该校学生在数学知识竞赛中的情况,采取按性别分层抽样,随机抽取了100名学生进行调查,分数分布在450~950分之间.将分数不低于750分的学生称为“高分选手”.根据调查的结果绘制的学生分数频率分布直方图如图所示.(1)求a的值,并估计该校学生分数的平均数(同一组中的数据用该组区间的中点值作代表);(2)若样本中属于“高分选手”的男生有10人,完成下列2×2列联表,并判断是否有95%的把握认为该校学生属于“高分选手”与“性别”有关?属于“高分选手”不属于“高分选手”合计男生女生合计参考公式:K2=nP0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828【答案】(1)a=0.0035,670(2)列联表见解析,有【分析】(1)根据频率之和等于“1”可以求a的值;根据平均数的定义求平均数;(2)根据独立性检验的方法求解.【详解】(1)100×(0.0015+a+0.0025+0.0015+0.0010)=1,解得平均数估计值为500×0.0015×100+600×0.0035×100+700×0.0025×100+800×0.0015×100+900×0.001×100=670(分).(2)由题意可知,样本中男生有100×2501000=25属于“高分选手”的有(0.1+0.15) ×100=25人,其中男生则高分中女生为25-10=15人,不属于“高分选手”的男生为25-10=15人,不属于“高分选手”的女生为75-15=60人,因此,得到2×2列联表如下:属于“高分选手”不属于“高分选手”合计男生101525女生156075合计2575100因此,K2的观测值k所以有95%的把握认为该校学生属于“高分选手”与“性别”有关.【变式6-1】4.(2023上·宁夏银川·高三校联考阶段练习)体育强则中国强,国运兴则体育兴,体育强国是新时期我国体育工作改革和发展的目标与任务,银川某学校体育老师决定检验高三学生的1km水平,随机抽取了100位学生进行测试,并根据该项技能的评价指标,按60,70,70,80,80,90,90,(1)求a的值,并估计评价指标的中位数(精确到0.1);(2)根据频率分布直方图求样本评价指标的平均数(同一组的数据用该组区间的中点值作代表),若平均数与中位数之差的绝对值小于1,则认为学生1km水平有显著稳定性;否则不认为有显著稳定性,请依数据给出答案;(3)在选取的100位学员中,其中男生人数与女生人数相同,若规定评价指标不低于80为优秀,低于80为良好,经统计男生中有40个学员评价指标为优秀,请列出2×2列联表,并判断是否有99%的把握认为“评价指标是否优秀与性别有关”附:K2=nP0.100.050.010k2.7063.8416.635【答案】(1)a=0.042,中位数为(2)平均数为81.6,学生1km水平有显著稳定性;(3)列联表见解析,有99%的把握认为“评价指标是否优秀与性别有关【分析】(1)根据频率和为1,求解a,再代入中位数公式,即可求解中位数;(2)首先求解平均数,再结合中位数和题意,确定是否具有稳定性;(3)首先根据频率分布直方图计算优秀和良好的人数,再根据题意,列出列联表,并根据表中数据计算K2,并与临界值比较,即可作出结论【详解】(1)由频率和为1,可得0.012+0.028+a+0.018×10=1设中位数为x,0.012×10+0.028×10+x-80所以中位数为82.4;(2)由频率分布直方图得到平均数为,65×0.012+75×0.028+85×0.042+95×0.018×10=81.6平均数与中位数之差的绝对值为82.4-81.6=0.8<1所以学生1km水平有显著稳定性;(3)由频率分布直方图可知,优秀的频率为0.042+0.018×10=0.6所以100名学生有100×0.6=60人为优秀,40人为良好,如图,列出2×2列联表男生女生合计优秀402060良好103040合计5050100K2所以有99%的把握认为“评价指标是否优秀与性别有关题型7回归分析与二项分布【例题7】(2023下·海南海口·高三统考期中)为促进全民健身更高水平发展,更好地满足人民群众的健身和健康需求,国家相关部门制定发布了《全民健身计划(2021—2025年)》.相关机构统计了我国2018年至2022年(2018年的年份序号为1,依此类推)健身人群数量(即有健身习惯的人数,单位:百万),所得数据如图所示:

(1)若每年健身人群中放弃健身习惯的人数忽略不计,从2022年的健身人群中随机抽取5人,设其中从2018年开始就有健身习惯的人数为X,求E((2)由图可知,我国健身人群数量与年份序号线性相关,请用相关系数加以说明.附:相关系数r=i=1nxi-xyi-y【答案】(1)290(2)相关系数约为1,说明见解析【分析】(1)求出从2022年的健身人群中随机抽取1人,其中从2018年开始就有健身习惯的人被抽到的概率,确定X∼(2)计算相关系数,根据相关系数的含义即可说明结论.【详解】(1)由图中数据可知从2018年开始就有健身习惯的人数有232百万,2022年的健身人数为324百万,故从2022年的健身人群中随机抽取1人,其中从2018年开始就有健身习惯的人被抽到的概率为232324则X∼B(5,(2)由题意知x=3r==229故我国健身人群数量与年份序号正线性相关且相关性很强.【变式7-1】1.(2023·河南·襄城高中校联考模拟预测)某公司是一家集无人机特种装备的研发、制造与技术服务的综合型科技创新企业.该公司生产的甲、乙两种类型无人运输机性能都比较出色,但操控水平需要十分娴熟,才能发挥更大的作用.已知在单位时间内,甲、乙两种类型的无人运输机操作成功的概率分别为23和1(1)该公司分别收集了甲型无人运输机在5个不同的地点测试的两项指标数xi,yi(地点1地点2地点3地点4地点5甲型无人运输机指标数x24568甲型无人运输机指标数y34445试求y与x间的相关系数r,并利用r说明y与x是否具有较强的线性相关关系;(若r>0.75(2)操作员连续进行两次无人机的操作有两种方案:方案一:在初次操作时,随机选择两种无人运输机中的一种,若初次操作成功,则第二次继续使用该类型设备;若初次操作不成功,则第二次使用另一类型进行操作.方案二:在初次操作时,随机选择两种无人运输机中的一种,无论初次操作是否成功,第二次均使用初次所选择的无人运输机进行操作.假定方案选择及操作不相互影响,试比较这两种方案的操作成功的次数的期望值.附:参考公式及数据:r=i=1【答案】(1)r≈0.95(2)方案一操作成功的次数的期望值大于方案二操作成功的次数的期望值【分析】(1)利用相关系数的公式计算求解,判断即可.(2)分析X,Y的取值,对于方案一,利用相互独立事件的概率逐个求概率,再求期望;对于方案二,利用二项分布的概念求期望,比较即可.【详解】(1)x=2+4+5+6+85i=15xi相关系数r=因为r>0.75,所以y与x(2)设方案一和方案二操作成功的次数分别为X,Y,则X,Y的所有可能取值均为0,1,2,方案一:PXPXPX所以EX方案二:选择其中一种操作设备后,进行2次独立重复试验,所以EY所以EX【变式7-1】2.(2023·安徽·校联考模拟预测)纯电动汽车、混合电动汽车及燃料电池电动汽车均为新能源汽车,近几年某地区新能源汽车保有量呈快速增长的态势,下表为2018~2022年该地区新能源汽车及纯电动汽车的保有量(单位:万辆),其中2018~2022年对应的年份编号依次为1~5:年份编号x12345该地区新能源汽车保有量y1.52.63.44.97.8该地区纯电动汽车保有量z1.32.12.84.06.4(1)由上表数据可知,可用指数函数模型y=a⋅bx拟合y与x的关系,请建立y关于x的回归方程(a,b的值精确到0.1(2)从表中数据可以看出2018~2022年,该地区新能源汽车保有量中纯电动汽车保有量占比均超过80%,说明纯电动汽车一直是新能源汽车的主流产品.若甲、乙、丙3人从2018~2022年中各随机选取1个年份(可以重复选取),记取到满足y-z>0.8的年份的个数为X参考数据:viee1.51.2522.621.11.511.4其中vi=ln参考公式:对一组数据u1,v1,u2,v2,⋯,【答案】(1)y=1.1×1.5x,预测2023(2)分布列见解析,数学期望为6【分析】(1)设lny=v,由已知可得∴(2)由条件确定随机变量X的所有可能取值,由条件可得X~B【详解】(1)由y=a⋅设lny=v因为x=1+2+3+4+55=3v=1.25,i所以lnb又v=lna所以lna=0.089,故所以lny则y=e0.089+0.387x,又所以y=1.1×即y关于x的回归方程为y=1.1×当x=6时,y所以预测2023年该地区新能源汽车保有量能超过10万辆.(2)X的所有可能取值为0,1,2,3,易知2018~2022年中满足y-z>0.8则每人取到满足y-z>0.8故X~∴P(XP(X=2)=∴XX0123P2754368∴E【变式7-1】3.(2023·安徽马鞍山·统考三模)强基计划主要选拔培养有志于服务国家重大战略需求且综合素质或基础学科拔尖的学生,聚焦高端芯片与软件、智能科技、新材料、先进制造和国家安全等关键领域,由有关高校结合自身办学特色,合理安排招生.强基计划的校考由试点高校自主命题,校考过程中通过笔试才能进入面试环节.(1)某研究机构为了更好地服务于高三学生,随机抽取了某校5名高三学生,对其记忆力测试指标x和分析判断力测试指标y进行统计分析,得到下表数据:x79101113y34567请用线性相关系数判断该组数据中y与x之间的关系是否可用线性回归模型进行拟合;(精确到0.01)(2)现有甲、乙两所高校的笔试环节都设有三门考试科目,某考生参加每门科目考试是否通过相互独立.若该考生报考甲高校,每门笔试科目通过的概率均为35;该考生报考乙高校,每门笔试科目通过的概率依次为m , 1参考数据:i=15xi2参考公式:线性相关系数:r=i=1【答案】(1)y与x之间的线性相关性较强,可用线性回归模型进行拟合(2)m【分析】(1)根据相关系数公式直接计算即可;(2)利用二项分布期望公式可得甲高校考试通过科目数的期望,分别求出通过乙高校的考试科目数各种可能值的概率,然后由期望公式计算,最后根据期望之间的关系求解即可.【详解】(1)由题意,可得:x=7+9+10+11+135i=1i=1n所以r=所以y与x之间的线性相关性较强,可用线性回归模型进行拟合.(2)通过甲高校的考试科目数X~B 设通过乙高校的考试科目数为Y,则Y的可能取值为0,1,2,3,则:P(P(P(P(则E(由题意知,E(X)<E又因为0<m<1,综上,m【变式7-1】4.(2023·河南洛阳·洛宁县第一高级中学校联考一模)防疫抗疫,人人有责.随着奥密克戎的全球肆虐,防疫形势越来越严峻,防疫物资需求量急增.下表是某口罩厂今年的月份x与订单y(单位:万元)的几组对应数据:月份x12345订单yyyyyy(1)求y关于x的经验回归方程,并估计该厂6月份的订单金额;(2)已知甲从该口罩厂随机购买了4箱口罩,该口罩厂质检过程中发现该批口罩的合格率为34,不合格产品需要更换.用X表示甲需要更换口罩的箱数,求随机变量X参考数据:i=1参考公式:回归直线的方程是y=bx【答案】(1)y=8.3x+10.1(2)答案见解析【分析】(1)根据已知和参考数据求出a,b即可得出经验回归方程,代入x=6(2)由题意可得X的取值可能为0,1,2,3,4,且X∼B4,【详解】(1)由数据可得xib=i故y关于x的经验回归方程为y当x=6时,估计该厂6月份的订单金额为59.9万元.(2)依题意,随机变量X的取值可能为0,1,2,3,4,且X∼P(X=0)=P(X=2)=P(随机变量X的分布列为X01234P81272731E(题型8回归分析与超几何分布【例题8】(2023·广东韶关·统考模拟预测)研究表明,如果温差本大,人们不注意保暖,可能会导致自身受到风寒刺激,增加感冒患病概率,特别是对于几童以及年老体弱的人群,要多加防范某中学数学建模社团成员研究了昼夜温差大小与某小学学生患感冒就诊人数多少之间的关系,他们记录了某六天的温差,并到校医室查阅了这六天中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论