版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
重难点专题47回归分析与独立性检验十三大题型汇总题型1线性回归方程 1题型2非线性之幂函数方程 6题型3非线性之指数函数方程 10题型4非线性之对数函数方程 15题型5残差相关模型 22题型6独立性检验 26题型7回归分析与二项分布 31题型8回归分析与超几何分布 35题型9回归分析与独立性检验 40题型10回归分析与正态分布 45题型11独立性检验与正态分布 51题型12独立性检验与超几何分布 56题型13独立性检验与二项分布 60题型1线性回归方程解答线性回归问题,应通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析.【例题1】(2023上·河南三门峡·高三统考期末)2021年春节前,受疫情影响,各地鼓励外来务工人员选择就地过年.某市统计了该市4个地区的外来务工人数与就地过年人数(单位:万),得到如下表格:A区B区C区D区外来务工人数x/万3456就地过年人数y/万2.5344.5(1)请用相关系数说明y与x之间的关系可用线性回归模型拟合,并求y关于x的线性回归方程y=(2)假设该市政府对外来务工人员中选择就地过年的每人发放1000元补贴.①若该市E区有2万名外来务工人员,根据(1)的结论估计该市政府需要给E区就地过年的人员发放的补贴总金额;②若A区的外来务工人员中甲、乙选择就地过年的概率分别为p,2p-1,其中12<p参考公式:相关系数r=i=1nxiy【变式1-1】1.(2022·吉林·东北师大附中校考模拟预测)2015年7月31日,在吉隆坡举行的国际奥委会第128次全会上,北京获得2022年冬奥会举办权.在申冬奥过程中,中国正式向国际社会作出“带动三亿人参与冰雪运动”的庄严承诺.这一承诺,既是我国为国际奥林匹克运动做出重大贡献的大国担当展现,也是根据我国经济水平和全民健身需求做出的群众性运动的战略部署.从北京冬奥会申办成功到2021年10月,全国参与冰雪运动人数累计达到3.46亿,实现了“带动三亿人参与冰雪运动”的目标,这是北京冬奥会给予全球冬季体育运动和奥林匹克运动的最为重要的遗产,可以说是2022年北京冬奥会的第一块金牌.“冬奥热”带动“冰雪热”,也带动了冰雪经济,以冰雪运动为主要内容的冰雪旅游近年来发展迅速,2016至2022六个冰雪季的旅游人次y(单位亿)的数据如下表:年度2016—20172017—20182018—20192019—20202020—20212021—2022年度代号t123456旅游人次y1.71.972.240.942.543.15(1)求y与t的相关系数(精确到0.01),并回答y与t的线性相关关系的强弱;(2)因受疫情影响,现将2019—2020年度的异常数据剔除,用剩下的5个年度数据(年度代号不变),求y关于t的线性回归方程(系数精确到0.01),并推测没有疫情情况下,2019—2020年度冰雪旅游人次的估计值.附注:参考数据:t=16i=16ti=3.5,y=16i【变式1-1】2.(2022·甘肃·统考二模)人工智能教育是将人工智能与传统教育相结合,借助人工智能和大数据技术打造的智能化教育生态.为了解我国人工智能教育发展状况,通过中国互联网数据平台得到我国2015年-2020年人工智能教育市场规模统计图.如图所示,若用x表示年份代码(2015年用1表示,2016年用2表示,依次类推),用y表示市场规模(单位:亿元),试回答:(1)根据条形统计图中数据,计算变量y与x的相关系数r,并用r判断两个变量y与x相关关系的强弱(精确到小数点后2位);(2)若y与x的相关关系拟用线性回归模型表示,试求y关于x的线性回归方程,并据此预测2022年中国人工智能教育市场规模(精确到1亿元).附:线性回归方程y=bx相关系数r=参考数据:i=1【变式1-1】3.(2021·全国·高三阶段练习)击鼓传花,也称传彩球,是中国民间游戏,数人或几十人围成圆圈坐下,其中一人拿花(或一小物件);另有一人背着大家或蒙眼击鼓(桌子、黑板或其他能发出声音的物体),鼓响时众人开始传花(顺序不定),至鼓停止为止.此时花在谁手中(或其座位前),谁就上台表演节目,某单位组织团建活动,9人一组,共10组,玩击鼓传花,(前五组)组号x与组内女性人数y统计结果如表:x12345y22334(Ⅰ)女性人数y与组号x(组号变量x依次为1,2,3,4,5,…)具有线性相关关系,请预测从第几组开始女性人数不低于男性人数;参考公式:b(Ⅱ)在(Ⅰ)的前提下,从10组中随机抽取3组,求若3组中女性人数不低于5人的有X组,求X的分布列与期望;(Ⅲ)游戏开始后,若传给相邻的人得1分,间隔人传得2分,每击一次鼓传一次花,得1分的概率为0.2,得2分的概率为0.8.记鼓声停止后得分恰为n分的概率为an,求a【变式1-1】4.(2021·江苏南通·二模)网上购物就是通过互联网检索商品信息,并通过电子订购单发出购物请求,厂商通过邮购的方式发货或通过快递公司送货上门,货到后通过银行转账、微信或支付宝支付等方式在线汇款,根据2019年中国消费者信息研究,超过40%的消费者更加频繁地使用网上购物,使得网上购物和送货上门的需求量激增,越来越多的消费者也首次通过第三方APP、品牌官方网站和微信社群等平台进行购物,某天猫专营店统计了2020年8月5日至9日这5天到该专营店购物的人数yi和时间第xx12345y75849398100(1)由表中给出的数据是否可用线性回归模型拟合人数y与时间x之间的关系?若可用,估计8月10日到该专营店购物的人数(人数用四舍五入法取整数;若|r|>0.75,则线性相关程度很高,可用线性回归模型拟合,计算r时精确到参考数据:4340≈65.88.附:相关系数r=i=1n(2)运用分层抽样的方法从第1天和第5天到该专营店购物的人中随机抽取7人,再从这7人中任取3人进行奖励,求这3人取自不同天的概率.(3)该专营店为了吸引顾客,推出两种促销方案:方案一,购物金额每满100元可减10元;方案二,一次性购物金额超过800元可抽奖三次,每次中奖的概率均为13,且每次抽奖互不影响,中奖一次打9折,中奖两次打8折,中奖三次打6折.某顾客计划在此专营店购买1000元的商品,请从实际付款金额的数学期望的角度分析选哪种方案更优惠题型2非线性之幂函数方程幂函数型回归模型的处理方法:幂函数型y=axn(n为常数,a,x,y均取正值),两边取常用对数1gy=1g(axn),即lgy=nlgx+lga,令y′=1gy,x′=1gx,原方程变为y′=nx′+lga,然后按线型回归模型求出n,lga.【例题2】(2021上·四川成都·高三石室中学校考期末)为帮助乡村脱贫,某勘探队计划了解当地矿脉某金属的分布情况,测得了平均金属含量y(单位:gm3)与样本对原点的距离x(单位:m)的数据,并作了初步处理,得到了下面的一些统计理的值.(表中uixyuiiiii697.900.21600.1414.1226.13-(1)利用样本相关系数的知识,判断y=a+bx与y=(2)根据(1)的结果回答下列问题:①建立y关于x的回归方程;②样本对原点的距离x=20附:对于一组数据t1,s1,t2,s【变式2-1】1.(2023上·全国·高三专题练习)数独是源自18世纪瑞士的一种数学游戏,玩家需要根据9×9盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(3×3)内的数字均含1~9,且不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.参考数据t=iti17500.370.55参考公式:对于一组数据(u1,v1),(1)赛前小明进行了一段时间的训练,每天解题的平均速度y(秒/题)与训练天数x(天)有关,经统计得到如下数据:x(天)1234567y(秒/题)910800600440300240210现用y=a+bx作为回归方程模型,请利用表中数据,求出该回归方程;((2)小明和小红玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,不存在平局,两人约定先胜3局者赢得比赛.若小明每局获胜的概率为23,且各局之间相互独立,设比赛X局后结束,求随机变量X【变式2-1】2.(2023·四川绵阳·统考二模)抗体药物的研发是生物技术制药领域的一个重要组成部分,抗体药物的摄入量与体内抗体数量的关系成为研究抗体药物的一个重要方面.某研究团队收集了10组抗体药物的摄入量与体内抗体数量的数据,并对这些数据作了初步处理,得到了如图所示的散点图及一些统计量的值,抗体药物摄入量为x(单位:mg),体内抗体数量为y(单位:AU/mL).iiii29.2121634.4
(1)根据经验,我们选择y=cxd作为体内抗体数量y关于抗体药物摄入量x的回归方程,将y=cxd两边取对数,得lny=lnc+(2)经技术改造后,该抗体药物的有效率z大幅提高,经试验统计得z服从正态分布N∼0.48,0.032,那这种抗体药物的有效率附:①对于一组数据ui,vii=1,2,⋯,10,其回归直线②若随机变量Z~Nμ,σ2,则有③取e≈2.7【变式2-1】3.(2023下·重庆沙坪坝·高三重庆八中校考阶段练习)在正常生产条件下,根据经验,可以认为化肥的有效利用率近似服从正态分布N(0.54,0.02(1)假设生产条件正常,记X表示化肥的有效利用率,求P((2)课题组为研究每亩化肥施用量与某农作物亩产量之间的关系,收集了10组数据,并对这些数据作了初步处理,得到了如图所示的散点图及一些统计量的值.其中每亩化肥施用量为x(单位:公斤),粮食亩产量为y(单位:百公斤)
参考数据:iiiiiiii65091.552.51478.630.5151546.5ti=lnxi,zi=ln(i)根据散点图判断,y=a+bx与y=(ii)根据(i)的判断结果及表中数据,建立y关于x的回归方程;并预测每亩化肥施用量为27公斤时,粮食亩产量y的值.(附:①对于一组数据(ui,vi)(i=1,2,3,…,②若随机变量X∼N(μ,【变式2-1】4.(2023·云南保山·统考二模)中医药是包括汉族和少数民族医药在内的我国各民族医药的统称,是具有悠久历史传统和独特理论技术方法的医药体系,长期呵护着我们的健康,为中华文明的延续作出了突出贡献.某科研机构研究发现,某味中药的药用量x(单位:克)与药物功效y(单位:药物功效单位)之间具有关系y=10(1)估计该味中药的最佳用量与功效;(2)对一批含有这昧中药的合成药物进行检测,发现这味中药的药用量平均值为6克,标准差为2,估计这批合成药的药物功效y的平均值.题型3非线性之指数函数方程1.直接设指数求解;2.取对数化简,再设对数求解【例题3】(2023·全国·模拟预测)一座城市的夜间经济不仅有助于拉动本地居民内需,还能延长外地游客、商务办公者等的留存时间,带动当地经济发展,是衡量一座城市生活质量、消费水平、投资环境及文化发展活力的重要指标.数据显示,近年来中国各地政府对夜间经济的扶持力度加大,夜间经济的市场发展规模保持稳定增长,下表为2017—2022年中国夜间经济的市场发展规模(单位:万亿元),其中2017—2022年对应的年份代码依次为1~6.年份代码x123456中国夜间经济的市场发展规模y/20.522.926.430.936.442.4(1)已知可用函数模型y=a⋅bx拟合y与x的关系,请建立y关于x(2)某传媒公司预测2023年中国夜间经济的市场规模将达到48.1万亿元,现用(1)中求得的回归方程预测2023年中国夜间经济的市场规模,若两个预测规模误差不超过1万亿元,则认为(1)中求得的回归方程是理想的,否则是不理想的,判断(1)中求得的回归方程是否理想.参考数据:viee1.163.36673.28217.251.162.83其中vi参考公式:对于一组数据u1,v1,【变式3-1】1.(2023·四川内江·统考一模)某企业为响应国家号召,汇聚科研力量,加强科技创新,准备加大研发资金投入,为了解年研发资金投入额x(单位:亿元)对年盈利额y(单位:亿元)的影响,通过对“十二五”和“十三五”规划发展10年期间年研发资金投入额xi和年盈利额yi(i=1,2,⋯,10)数据进行分析,建立了两个函数模型:y=α+βx2;y=eλx+xyuviiiiii(1)请从相关系数的角度,分析哪一个模型拟合度更好?(2)根据(1)的选择及表中数据,建立y关于x的回归方程.(系数精确到0.01)附:相关系数r回归直线y=bx+a【变式3-1】2.(2023·全国·模拟预测)近三年的新冠肺炎疫情对我们的生活产生了很大的影响,当然也影响着我们的旅游习惯,乡村游、近郊游、周边游热闹了许多,甚至出现“微度假”的概念.在国家有条不紊的防疫政策下,旅游又重新回到了老百姓的日常生活中.某乡村抓住机遇,依托良好的生态环境、厚重的民族文化,开展乡村旅游.通过文旅度假项目考察,该村推出了多款套票文旅产品,得到消费者的积极回应.该村推出了六条乡村旅游经典线路,对应六款不同价位的旅游套票,相应的价格x与购买人数y的数据如下表.旅游线路奇山秀水游古村落游慢生活游亲子游采摘游舌尖之旅套票型号ABCDEF价格x/元394958677786经数据分析、描点绘图,发现价格x与购买人数y近似满足关系式y=axba>0,b>0,即lny=blnx附:①可能用到的数据:i=16viwi=75.3②对于一组数据v1,w2,v2,w2,…,(1)根据所给数据,求y关于x的回归方程.(2)按照相关部门的指标测定,当套票价格x∈49,81时,该套票受消费者的欢迎程度更高,可以被认定为“热门套票”.现有三位游客,每人从以上六款套票中购买一款旅游,购买任意一款的可能性相等.若三人买的套票各不相同,记三人中购买“热门套票”的人数为X,求随机变量【变式3-1】3.(2023上·山东淄博·高三统考期中)为传承和发扬淄博陶瓷,某陶瓷公司计划加大研发力度.为确定下一年度投资计划,需了解年研发资金xi(亿元)与年销售额yi(亿元)的关系.该公司对历史数据进行对比分析,建立了两个函数模型:①y=α+βx2,②y=eλx现该公司收集了近12年的年研发资金xi和年销售额yi的数据,i=1,2,⋯,12,并对这些数据作了初步处理,得到了散点图及一些统计量的值.令uxyiiuv20667702004604.20iiii3125000215000.30814(1)设ui和yi的相关系数为r1,xi和(2)根据(1)的选择及表中数据,建立y关于x的回归方程(计算过程中保留到0.001,最后结果精确到0.01);(3)为进一步了解人们对新款式瓷器喜爱程度(分为“比较喜欢”和“不太喜欢”)是否跟年龄(分为“小于30岁”和“不小于30岁”)有关,公司从该地区随机抽取600人进行调查,调查数据如下表:比较喜欢不太喜欢合计年龄小于30岁200100300年龄不小于30岁150150300合计350250600根据小概率α=0.001附:①相关系数r=i=1nxi-②χ2=nα0.150.10.050.0250.010.001x2.0722.7063.8415.0246.63510.828③参考数据:308=4×77.【变式3-1】4.(2023上·重庆渝中·高三统考期中)当前,新一轮科技革命和产业变革蓬勃兴起,以区块链为代表的新一代信息技术迅猛发展,现收集某地近6年区块链企业总数量相关数据,如下表:年份201720182019202020212022编号x123456企业总数量y(单位:百个)5078124121137352(1)若用模型y=aebx拟合y与x的关系,根据提供的数据,求出(2)为了促进公司间的合作与发展,区块链联合总部决定进行一次信息化技术比赛,邀请甲、乙、丙三家区块链公司参赛.比赛规则如下:①每场比赛有两个公司参加,并决出胜负;②每场比赛获胜的公司与未参加此场比赛的公司进行下一场的比赛;③在比赛中,若有一个公司首先获胜两场,则本次比赛结束,该公司获得此次信息化比赛的“优胜公司”.已知在每场比赛中,甲胜乙的概率为12,甲胜丙的概率为13,乙胜丙的概率为35,若首场由甲乙比赛,求甲公司获得“参考数据:i=16参考公式:对于一组数据xi,yi题型4非线性之对数函数方程1.直接设对数求解;2.对指数型取对数【例题4】(2023·福建·统考模拟预测)放行准点率是衡量机场运行效率和服务质量的重要指标之一.某机场自2012年起采取相关策略优化各个服务环节,运行效率不断提升.以下是根据近10年年份数xi与该机场飞往A地航班放行准点率yi(ixytiiii2017.580.41.540703145.01621254.227.71226.8其中ti=(1)根据散点图判断,y=bx+a与y=clnx-2012+d(2)已知2023年该机场飞往A地、B地和其他地区的航班比例分别为0.2、0.2和0.6.若以(1)中的预测值作为2023年该机场飞往A地航班放行准点率的估计值,且2023年该机场飞往B地及其他地区(不包含A、B两地)航班放行准点率的估计值分别为80%和75(i)现从2023年在该机场起飞的航班中随机抽取一个,求该航班准点放行的概率;(ii)若2023年某航班在该机场准点放行,判断该航班飞往A地、B地、其他地区等三种情况中的哪种情况的可能性最大,说明你的理由.附:(1)对于一组数据u1,v1,u2,v2,…参考数据:ln10≈2.30,ln11≈2.40,【变式4-1】1.(2023·云南昆明·高三昆明一中校考阶段练习)《中共中央国务院关于全面推进乡村振兴加快农业农村现代化的意见》,这是21世纪以来第18个指导“三农”工作的中央一号文件.文件指出,民族要复兴,乡村必振兴,要大力推进数字乡村建设,推进智慧农业发展.某乡村合作社借助互联网直播平台进行农产品销售,众多网红主播参与到直播当中,在众多网红直播中,统计了10名网红直播的观看人次xi和农产品销售量yi(1)利用散点图判断,y=a+bx和y(2)对数据作出如下处理:得到相关统计量的值如表:xyωiiii9.430.323666.6439.266其中令ωi=lnxi,ω=110i=1(3)规定:观看人次大于等于120万人次的主播为优秀主播,从这10名主播中随机抽取3名,记其中优秀主播的人数为X,求X的分布列和数学期望.参考数据和公式:ln2≈0.69,附:对于一组数据u1,v1,u2,v2,…,【变式4-1】2.(2023·山西·校联考模拟预测)某剧场的座位数量是固定的,管理人员统计了最近在该剧场举办的五场表演的票价xi(单位:元)和上座率yi(上座人数与总座位数的比值)的数据,其中(1)由散点图判断y=bx+a与y=(2)根据(1)所求的回归方程,预测票价为多少时,剧场的门票收入最多.参考数据:x=240,y=0.5,i=15xi2=365000,i=15xiyi参考公式:对于一组数据u1,v1,u2【变式4-1】3.(2023·辽宁朝阳·校联考一模)秋天的第一杯奶茶是一个网络词汇,最早出自四川达州一位当地民警之口,民警用“秋天的第一杯奶茶”顺利救下一名女孩,由此而火爆全网.后来很多人开始在秋天里买一杯奶茶送给自己在意的人.某奶茶店主记录了入秋后前7天每天售出的奶茶数量(单位:杯)如下:日期第一天第二天第三天第四天第五天第六天第七天日期代码x1234567杯数y4152226293132(1)请根据以上数据,绘制散点图,并根据散点图判断,y=a+bx与y=(2)建立y关于x的回归方程(结果保留1位小数),并根据建立的回归方程,试预测要到哪一天售出的奶茶才能超过35杯?(3)若每天售出至少25杯即可盈利,则从第一天至第七天中任选三天,记随机变量X表示盈利的天数,求随机变量X的分布列.参考公式和数据:其中u回归直线方程y=byuiiie22.71.2759235.113.28.2【变式4-1】4.(2022上·四川绵阳·高三绵阳中学校考期末)某创业者计划在某旅游景区附近租赁一套农房发展成特色“农家乐”,为了确定未来发展方向,此创业者对该景区附近五家“农家乐”跟踪调查了100天,这五家“农家乐”的收费标准互不相同,得到的统计数据如下表,x为收费标准(单位:元/日),t为入住天数(单位:天),以频率作为各自的“入住率”,收费标准x与“入住率”y的散点图如图.x100150200300450t9065453020(1)若从以上五家“农家乐”中随机抽取两家深入调查,记ξ为“入住率”超过0.6的农家乐的个数,求ξ的概率分布列;(2)令z=lnx,由散点图判断y=bx+a与(3)根据第(2)问所求的回归方程,试估计收费标准为多少时,100天销售额L最大?(100天销售额L=100×入住率×收费标准x)参考数据:b=i=1nxiyi-nx⋅yi=1nxi2-n【变式4-1】5.(2023下·江西·高三校联考阶段练习)中医药在抗击新冠肺炎疫情中,发挥了重要作用.中药可以起到改善平常上呼吸道的症状,同时可以起到抑制病毒繁殖的效果就可以达到治疗新型冠状病毒肺炎的作用.某地种植药材收到了很好的经济效益.根据资料显示,产出的药材的箱数x(单位:十箱)与成本y(单位:千元)的关系如下:x34679y6.577.588.2y与x可用回归方程y=blgx+(1)若农户卖出的该药材的价格为500元/箱,试预测该药材10箱的利润是多少元;(利润=售价-成本)(2)据统计,4月份的连续20天中农户每天为甲地可配送的药材的箱数的频率分布直方图如图,用这20天的情况来估计相应的概率.(i)通过频率分布直方图计算农户每天平均可配送的药材的箱数(同一组中的数据以这组数据所在区间中点的值作代表);(ii)一个运输户拟购置3辆小货车专门运输农户为甲地配送的该药材,一辆货车每天只能运营一趟,每辆车每趟最多只能装载40箱该药材,满载发车,否则不发车.若发车,则每辆车每趟可获利400元;若未发车,则每辆车每天平均亏损200元.试计算此项业务每天的利润平均值的大小.参考数据:设t=tyii0.737.440.530.15参考公式:对于一组数据ui,vi乘估计分别为β=i=1题型5残差相关模型残差计算思路如下∶先求出回归方程y=bx+a(b,a直接套公式即可),然后把表格中每一个x值通过方程算出对应的每一个y值,最后与表格中的y值对应相减即可。数据点和它在回归直线上相应位置的差异yi-yi是随机误差的效应,称ei=yi-残差计算公式∶实际观察值与估计值(拟合值)之间的差。残差平方和:i【例题5】(2023上·云南昆明·高三校考阶段练习)云南省统计局发布《全省旅游业发展情况(2015-2022年)》报告,其中2015年至2022年游客总人数y(单位:亿人次)的数据如下表:年份20152016201720182019202020212022年份代号x12345678游客总人数y3.34.35.76.98.15.36.58.4为了预测2023年云南省游客总人数,根据2015年至2022年游客总人数y的数据建立线性回归模型一,得到回归方程l1:y=0.556x+3.56,但由于受到2020年疫情影响,估计预测不准确,若用2015年至2019(1)根据l1和l2预测2023年云南省游客总人数(预测数据精确到(2)为了检验两种模型的预测效果,对两种模型作残差分析得到:模型一:总偏差平方和i=18y模型二:总偏差平方和i=15y用R2来比较模型一与模型二的拟合效果(R2精确到(3)根据2020年至2022年游客总人数y的数据建立线性回归模型三,求回归方程l3,并根据l3预测2023年云南省游客总人数(预测数据精确到0.1参考公式:R2=1-i=1nyi【变式5-1】1.(2023下·广西防城港·高三统考阶段练习)某互联网公司为了确定下季度的前期广告投人计划,收集了近6个月广告投入量x(单位:万元)和收益y(单位:万元)的数据如表:月份123456广告投入量24681012收益14.2120.3131.831.1837.8344.67他们用两种模型①y=bx+a
xyi=1i=17301464.24364(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型拟合?并说明理由;(2)残差绝对值大于2的数据被认为是异常数据,需要剔除.(i)剔除异常数据后求出(1)中所选模型的回归方程;(ii)若广告投入量x=18时,(1附:对于一组数据x1,y1【变式5-1】2.(2023·河北唐山·统考三模)据统计,某城市居民年收入(所有居民在一年内收入的总和,单位:亿元)与某类商品销售额(单位:亿元)的10年数据如下表所示:第n年12345678910居民年收入x32.231.132.935.737.138.039.043.044.646.0商品销售额y25.030.034.037.039.041.042.044.048.051.0依据表格数据,得到下面一些统计量的值.iiiii379.6391247.624568.9m(1)根据表中数据,得到样本相关系数r≈0.95.以此推断,y与x(2)根据统计量的值与样本相关系数r≈0.95,建立y关于x的经验回归方程(系数精确到0.01(3)根据(2)的经验回归方程,计算第1个样本点32.2,25.0对应的残差(精确到0.01);并判断若剔除这个样本点再进行回归分析,b的值将变大还是变小?(不必说明理由,直接判断即可).附:样本xi,y2.297≈1.516,b=i【变式5-1】3.(2023·黑龙江哈尔滨·哈尔滨三中校考二模)中国共产党第二十次全国代表大会上的报告中提到,新时代十年我国经济实力实现历史性跃升,国内生产总值从54万亿元增长到114万亿元,我国经济总量稳居世界第二位.建立年份编号为解释变量,地区生产总值为响应变量的一元线性回归模型,现就2012-2016某市的地区生产总值统计如下:年份20122013201420152016年份编号12345地区生产总值(亿元)2.83.13.94.65.6(1)求出回归方程,并计算2016年地区生产总值的残差;(2)随着我国打赢了人类历史上规模最大的脱贫攻坚战,该市2017-2022的地区生产总值持续增长,现对这11年的数据有三种经验回归模型y=1.017x+1.200、y=3.816x-1.645、y=0.107x2+2.365,它们的R(3)若2012-2022该市的人口数(单位:百万)与年份编号的回归模型为y=0.2x+1.2,结合(2参考公式:b=i=1【变式5-1】4.(2023·陕西咸阳·武功县普集高级中学统考二模)2021年,党中央、国务院印发了《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》,也就是我们现在所称的“双减”政策.某地为了检测双减的落实情况,从某高中选了6名同学,检测课外学习时长(单位:分钟),相关数据如下表所示.学生序号123456学习时长/分220180210220200230(1)若从被抽中的6名同学中随机抽出2名,则抽出的2名同学课外学习时长都不小于210分钟的概率;(2)下表是某班统计了本班同学2022年1-7月份的人均月课外劳动时间(单位:小时),并建立了人均月课外劳动时间y关于月份x的线性回归方程y=bx+4,月份x1234567人均月劳动时间y89m12n1922由于某些原因导致部分数据丢失,但已知i=1(i)求m,n的值;(ii)求该班6月份人均月劳动时间数据的残差值(残差即样本数据与预测值之差).附:y=bx+a题型6独立性检验独立性检验的步骤(1)根据实际问题的需要确定允许推断“事件A与B有关系”犯错误的概率的上界α,然后查表确定临界值k.(2)利用公式χ2=eq\f(nad-bc2,a+bc+da+cb+d)计算随机变量χ2.【例题6】(2023上·贵州贵阳·高三贵阳一中校考阶段练习)“村BA”后,贵州“村超”又火出圈!所谓“村超”,其实是目前火爆全网的贵州乡村体育赛事一一榕江(三宝侗寨)和美乡村足球超级联赛,被大家简称为“村超”.“村超”的民族风、乡土味、欢乐感,让每个人尽情享受着足球带来的快乐.某校为了丰富学生课余生活,组建了足球社团.足球社团为了解学生喜欢足球是否与性别有关,随机抽取了男、女同学各50名进行调查,部分数据如表所示:喜欢足球不喜欢足球合计男生20女生15合计100附:χ2α0.10.050.010.0050.001x2.7063.8416.6357.87910.828(1)根据所给数据完成上表,依据α=0.005的独立性检验,能否有99.5(2)社团指导老师从喜欢足球的学生中抽取了2名男生和1名女生示范定点射门.据统计,这两名男生进球的概率均为23,这名女生进球的概率为12,每人射门一次,假设各人进球相互独立,求3人进球总次数X【变式6-1】1.(2023·全国·模拟预测)中秋节起源于我国,是我国的传统节日之一,吃月饼是中秋节的重要习俗.某超市为了解月饼销售情况,随机调研了某日来店购买月饼的200位顾客,并将调研结果整理如下:年龄购买袋装月饼购买礼盒月饼50岁及以上8020不超过50岁6040(1)根据已知条件,试判断是否有99%(2)假设A表示事件“在该超市购买月饼礼盒赠送玉兔望月挂件”,B表示事件“顾客在该超市购买月饼礼盒”,P(A)>0附:K2=n参考数据:P0.100.050.0250.010k2.7063.8415.0246.635【变式6-1】2.(2023·全国·模拟预测)某平台为了解当代大学生对“网络公序良俗”的认知情况,设计了一份调查表,题目分为必答题和选答题.其中必答题是①、②、③共三道题,选答题为④、⑤、⑥、⑦、⑧、⑨、⑩共七道题,被调查者在选答题中自主选择其中4道题目回答即可.为了调查当代大学生对④、⑥、⑧、⑩四道选答题的答题情况,从同济大学在④、⑥、⑧、⑩四个题目中至少选答一道的学生中随机抽取100名学生进行调查,他们选答④、⑥、⑧、⑩的题目数及人数统计如表:选答④、⑥、⑧、⑩的题目数1道2道3道4道人数20303020(1)从这100名学生中任选3名,求他们选答④、⑥、⑧、⑩题目数量之和为5的概率;(2)从这100名学生中任选2名,记X表示这2名学生选答④、⑥、⑧、⑩的题目数之差的绝对值,求随机变量X的数学期望;(3)学校还调查了这100位学生的性别情况,研究男女生中“公序良俗”达人的大概比例,得到的数据如下表:(规定同时选答④、⑥、⑧、⑩的学生为“公序良俗”达人)性别“公序良俗”达人非“公序良俗”达人总计男性8女性25总计100请完成上述2×2列联表,并计算回答是否有95%的把握认为“公序良俗”参考公式:χ2=n附表:α0.100.050.0100.001x2.7063.8416.63510.828【变式6-1】3.(2023下·贵州贵阳·高三校联考阶段练习)某学校共有1000名学生参加数学知识竞赛,其中男生250人.为了了解该校学生在数学知识竞赛中的情况,采取按性别分层抽样,随机抽取了100名学生进行调查,分数分布在450~950分之间.将分数不低于750分的学生称为“高分选手”.根据调查的结果绘制的学生分数频率分布直方图如图所示.(1)求a的值,并估计该校学生分数的平均数(同一组中的数据用该组区间的中点值作代表);(2)若样本中属于“高分选手”的男生有10人,完成下列2×2列联表,并判断是否有95%的把握认为该校学生属于“高分选手”与“性别”有关?属于“高分选手”不属于“高分选手”合计男生女生合计参考公式:K2=nP0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828【变式6-1】4.(2023上·宁夏银川·高三校联考阶段练习)体育强则中国强,国运兴则体育兴,体育强国是新时期我国体育工作改革和发展的目标与任务,银川某学校体育老师决定检验高三学生的1km水平,随机抽取了100位学生进行测试,并根据该项技能的评价指标,按60,70,70,80,80,90,90,(1)求a的值,并估计评价指标的中位数(精确到0.1);(2)根据频率分布直方图求样本评价指标的平均数(同一组的数据用该组区间的中点值作代表),若平均数与中位数之差的绝对值小于1,则认为学生1km水平有显著稳定性;否则不认为有显著稳定性,请依数据给出答案;(3)在选取的100位学员中,其中男生人数与女生人数相同,若规定评价指标不低于80为优秀,低于80为良好,经统计男生中有40个学员评价指标为优秀,请列出2×2列联表,并判断是否有99%的把握认为“评价指标是否优秀与性别有关”附:K2=nP0.100.050.010k2.7063.8416.635题型7回归分析与二项分布【例题7】(2023下·海南海口·高三统考期中)为促进全民健身更高水平发展,更好地满足人民群众的健身和健康需求,国家相关部门制定发布了《全民健身计划(2021—2025年)》.相关机构统计了我国2018年至2022年(2018年的年份序号为1,依此类推)健身人群数量(即有健身习惯的人数,单位:百万),所得数据如图所示:
(1)若每年健身人群中放弃健身习惯的人数忽略不计,从2022年的健身人群中随机抽取5人,设其中从2018年开始就有健身习惯的人数为X,求E((2)由图可知,我国健身人群数量与年份序号线性相关,请用相关系数加以说明.附:相关系数r=i=1nxi-xyi-y【变式7-1】1.(2023·河南·襄城高中校联考模拟预测)某公司是一家集无人机特种装备的研发、制造与技术服务的综合型科技创新企业.该公司生产的甲、乙两种类型无人运输机性能都比较出色,但操控水平需要十分娴熟,才能发挥更大的作用.已知在单位时间内,甲、乙两种类型的无人运输机操作成功的概率分别为23和1(1)该公司分别收集了甲型无人运输机在5个不同的地点测试的两项指标数xi,yi(地点1地点2地点3地点4地点5甲型无人运输机指标数x24568甲型无人运输机指标数y34445试求y与x间的相关系数r,并利用r说明y与x是否具有较强的线性相关关系;(若r>0.75(2)操作员连续进行两次无人机的操作有两种方案:方案一:在初次操作时,随机选择两种无人运输机中的一种,若初次操作成功,则第二次继续使用该类型设备;若初次操作不成功,则第二次使用另一类型进行操作.方案二:在初次操作时,随机选择两种无人运输机中的一种,无论初次操作是否成功,第二次均使用初次所选择的无人运输机进行操作.假定方案选择及操作不相互影响,试比较这两种方案的操作成功的次数的期望值.附:参考公式及数据:r=i=1【变式7-1】2.(2023·安徽·校联考模拟预测)纯电动汽车、混合电动汽车及燃料电池电动汽车均为新能源汽车,近几年某地区新能源汽车保有量呈快速增长的态势,下表为2018~2022年该地区新能源汽车及纯电动汽车的保有量(单位:万辆),其中2018~2022年对应的年份编号依次为1~5:年份编号x12345该地区新能源汽车保有量y1.52.63.44.97.8该地区纯电动汽车保有量z1.32.12.84.06.4(1)由上表数据可知,可用指数函数模型y=a⋅bx拟合y与x的关系,请建立y关于x的回归方程(a,b的值精确到0.1(2)从表中数据可以看出2018~2022年,该地区新能源汽车保有量中纯电动汽车保有量占比均超过80%,说明纯电动汽车一直是新能源汽车的主流产品.若甲、乙、丙3人从2018~2022年中各随机选取1个年份(可以重复选取),记取到满足y-z>0.8的年份的个数为X参考数据:viee1.51.2522.621.11.511.4其中vi=ln参考公式:对一组数据u1,v1,u2,v2,⋯,【变式7-1】3.(2023·安徽马鞍山·统考三模)强基计划主要选拔培养有志于服务国家重大战略需求且综合素质或基础学科拔尖的学生,聚焦高端芯片与软件、智能科技、新材料、先进制造和国家安全等关键领域,由有关高校结合自身办学特色,合理安排招生.强基计划的校考由试点高校自主命题,校考过程中通过笔试才能进入面试环节.(1)某研究机构为了更好地服务于高三学生,随机抽取了某校5名高三学生,对其记忆力测试指标x和分析判断力测试指标y进行统计分析,得到下表数据:x79101113y34567请用线性相关系数判断该组数据中y与x之间的关系是否可用线性回归模型进行拟合;(精确到0.01)(2)现有甲、乙两所高校的笔试环节都设有三门考试科目,某考生参加每门科目考试是否通过相互独立.若该考生报考甲高校,每门笔试科目通过的概率均为35;该考生报考乙高校,每门笔试科目通过的概率依次为m , 1参考数据:i=15xi2参考公式:线性相关系数:r=i=1【变式7-1】4.(2023·河南洛阳·洛宁县第一高级中学校联考一模)防疫抗疫,人人有责.随着奥密克戎的全球肆虐,防疫形势越来越严峻,防疫物资需求量急增.下表是某口罩厂今年的月份x与订单y(单位:万元)的几组对应数据:月份x12345订单yyyyyy(1)求y关于x的经验回归方程,并估计该厂6月份的订单金额;(2)已知甲从该口罩厂随机购买了4箱口罩,该口罩厂质检过程中发现该批口罩的合格率为34,不合格产品需要更换.用X表示甲需要更换口罩的箱数,求随机变量X参考数据:i=1参考公式:回归直线的方程是y=bx题型8回归分析与超几何分布【例题8】(2023·广东韶关·统考模拟预测)研究表明,如果温差本大,人们不注意保暖,可能会导致自身受到风寒刺激,增加感冒患病概率,特别是对于几童以及年老体弱的人群,要多加防范某中学数学建模社团成员研究了昼夜温差大小与某小学学生患感冒就诊人数多少之间的关系,他们记录了某六天的温差,并到校医室查阅了这六天中每天学生新增感冒就诊的人数,得到数据如下:日期第一天第二天第三天第四天第五天第六天昼夜温差x(°C47891412新增感就诊人数y(位)yyyyyy参考数据:i6y(1)已知第一天新增感冒就的学生中有4位男生,从第一天多增的感冒就诊的学生中随机取2位,其中男生人数记为X,若抽取的2人中至少有一位女生的概率为56,求随机变量X(2)已知两个变量x与y之间的样本相关系数r=1617,请用最小二乘法求出y关于x的经验回归方程y=bx+a,据此估计昼夜温差为15【变式8-1】1.(2023·江苏南通·二模)我国风云系列卫星可以检测气象和国土资源情况.某地区水文研究人员为了了解汛期人工测雨量x(单位:dm)与遥测雨量y(单位:dm)的关系,统计得到该地区10组雨量数据如下:样本号i12345678910人工测雨量x5.387.996.376.717.535.534.184.046.024.235遥测雨量y5.438.076.576.147.955.564.274.156.044.49x0.050.080.20.570.420.030.090.110.020.26并计算得i(1)求该地区汛期遥测雨量y与人工测雨量x的样本相关系数(精确到0.01),并判断它们是否具有较强的线性相关关系(若r≥0.75,则认为两个变量有较强的线性相关性(2)规定:数组(xi,yi)满足xi-yi<0.1为“Ⅰ类误差”,满足0.1≤xi-yi<0.3为“Ⅱ类误差”,满足xi-yi≥0.3为“Ⅲ类误差”.为进一步研究该地区水文研究人员,从“Ⅰ附:相关系数r=【变式8-1】2.(2023·河南郑州·统考模拟预测)MCN即多频道网络,是一种新的网红经济运行模式,这种模式将不同类型和内容的PGC(专业生产内容)联合起来,在资本有力支持下,保障内容的持续输出,从而最终实现商业的稳定变现,在中国以直播电商、短视频为代表的新兴网红经济的崛起,使MCN机构的服务需求持续增长.数据显示,近年来中国MCN市场规模迅速扩大.下表为2018年—2022年中国MCN市场规模(单位:百亿元),其中2018年—2022年对应的代码依次为1-5.年份代码x12345中国MCN市场规模y1.121.682.453.354.32(1)由上表数据可知,可用指数函数模型y=a⋅bx拟合y与x(2)从2018年-2022年中国MCN市场规模中随机抽取3个数据,记这3个数据中与y的差的绝对值小于1的个数为X,求X的分布列与期望.参考数据:yvii2.580.8446.8315.99其中vi=lnyi参考公式:对于一组数据u1,v1,u2,v2,…,【变式8-1】3.(2023·山东青岛·统考二模)为了丰富农村儿童的课余文化生活,某基金会在农村儿童聚居地区捐建“悦读小屋”.自2018年以来,某村一直在组织开展“悦读小屋读书活动”.下表是对2018年以来近5年该村少年儿童的年借阅量的数据统计:年份20182019202020212022年份代码x12345年借阅量y(册)yy3692142(参考数据:i=1(1)在所统计的5个年借阅量中任选2个,记其中低于平均值的个数为X,求X的分布列和数学期望EX(2)通过分析散点图的特征后,计划分别用①y=35x-47和②y=5x2+【变式8-1】4.(2022·四川成都·石室中学校考二模)2020年,是人类首次成功从北坡登顶珠峰60周年,也是中国首次精确测定并公布珠峰高程的45周年.华为帮助中国移动开通珠峰峰顶5G,有助于测量信号的实时开通,为珠峰高程测量提供通信保障,也验证了超高海拔地区5G信号覆盖的可能性,在持续高风速下5G信号的稳定性,在条件恶劣地区通过简易设备传输视频信号的可能性.正如任总在一次采访中所说:“华为公司价值体系的理想是为人类服务.”有人曾问,在珠峰开通5G的意义在哪里?“我认为它是科学技术的一次珠峰登顶,告诉全世界,华为5G、中国5G的底气来自哪里.现在,5G的到来给人们的生活带来更加颠覆性的变革,某IT公司基于领先技术的支持,5G经济收入在短期内逐月攀升,该IT公司在1月份至6月份的5G经济收入y(单位:百万元)关于月份x的数据如下表所示,并根据数据绘制了如图所示的散点图.月份x123456收入y(百万元)6.68.616.121.633.041.0(1)根据散点图判断,y=ax+b与y=c⋅edx(a,b,c(2)根据(1)的结果及表中的数据,求出y关于x的回归方程,并预测该公司7月份的5G经济收入.(结果保留小数点后两位)(3)从前6个月的收入中抽取2个,记收入超过20百万元的个数为X,求X的分布列和数学期望.参考数据:xyuiiiee3.5021.152.8517.70125.356.734.5714.30其中,设u=lny,ui=lnyi(i=1,2参考公式:对于一组具有线性相关关系的数据(xi,vi)(i=1,2,3,…,n),其回归直线v=βx题型9回归分析与独立性检验【例题9】(2023上·云南·高三云南师大附中校考阶段练习)近年来我国新能源汽车产业迅速发展,下表是某地区新能源乘用车的年销售量与年份的统计表:年份x20182019202020212022销量y(万台)1.601.701.902.202.60某机构调查了该地区100位购车车主的性别与购车种类情况,得到的部分数据如下表所示:购置传统燃油车购置新能源车总计男性车主3560女性车主25总计100(1)求新能源乘用车的销量y关于年份x的线性相关系数r,并判断y与x之间的线性相关关系的强弱;(若r∈0.75,1,相关性较强;若r∈(2)请将上述2×2列联表补充完整,根据小概率值α=0.05①参考公式:相关系数r=②参考数据:6.6≈2.6③卡方临界值表:α0.100.050.0100.0050.001χ2.7063.8416.6357.87910.828其中χ2=n【变式9-1】1.(2023下·广东·高三校联考阶段练习)为了促进健康保险的发展,规范健康保险的经营行为,保护健康保险活动当事人的合法权益,提升人民群众健康保障水平,我国制定了《健康保险管理办法》.为了解某一地区中年居民(年龄在40~55岁)购买健康保险的情况,一机构根据统计数据,用最小二乘法得到健康保险购买量y(单位:万单)关于x(年份)的线性回归方程为y=4.7x-9459.2,且购买量y的方差为sy(1)求y与x的相关系数r,并据此判断健康保险购买量y与年份x的相关性强弱;(2)该机构还调查了该地区90位居民的性别与是否购买健康保险的情况,得到的数据如下表:性别没有购买健康保险购买健康保险总计男性39645女性301545总计692190依据小概率值α=0.05(3)在上述购买健康保险的居民中按照性别进行分层抽样抽取7人,再从这7人中随机抽取3人,记这3人中,男性的人数为X,求X的分布列和数学期望.参考公式:(ⅰ)线性回归方程:y=bx+a(ⅱ)相关系数:r=i=1nxi-(ⅲ)χ2=n附表:α0.100.050.0100.001x2.7063.8416.63510.828【变式9-1】2.(2023下·宁夏银川·高三银川一中校考阶段练习)人类命运共同体的提法将中国梦融入世界梦,充分展现了中国的大国担当.在第75届联合国大会上中国承诺,将采取更加有力的政策和措施,力争于2030年之前使二氧化碳的排放达到峰值,努力争取2060年之前实现碳中和(简称“双碳目标"),此举展现了我国应对气候变化的坚定决心,预示着中国经济结构和经济社会运转方式将产生深刻变革,极大促进我国产业链的清洁化和绿色化.新能源汽车、电动汽车是重要的战略新兴产业,对于实现“双碳目标”具有重要的作用.为了解某一地区电动汽车销售情况,一机构根据统计数据,用最小二乘法得到电动汽车销量y(单位:万台)关于x(年份)的线性回归方程为y=4.7x-9459.2,且销量y的方差为sy(1)求y与x的相关系数r,并据此判断电动汽车销量y与年份x的相关性强弱;(2)该机构还调查了该地区90位购车车主的性别与购车种类情况,得到的数据如下表:性别购买非电动汽车购买电动汽车总计男性39645女性301545总计692190依据小概率值α=0.05①参考数据:5×127=②参考公式:(i)线性回归方程:y=bx(ii)相关系数:r=i=1nxi-x③参考临界值表:P0.100.050.0100.005k2.7063.8416.6357.879【变式9-1】3.(2023·全国·模拟预测)直播带货是一种直播和电商相结合的销售手段,目前已被广大消费者所接受.针对这种现状,某公司决定逐月加大直播带货的投入,直播带货金额稳步提升,以下是该公司2023年前5个月的带货金额:月份x12345带货金额y/万元350440580700880(1)计算变量x,y的相关系数r(结果精确到0.01).(2)求变量x,y之间的线性回归方程,并据此预测2023年7月份该公司的直播带货金额.(3)该公司随机抽取55人进行问卷调查,得到如下不完整的列联表:参加过直播带货未参加过直播带货总计女性2530男性10总计请填写上表,并判断是否有90%的把握认为参加直播带货与性别有关.参考数据:y=590,i=15i=15x参考公式:相关系数r=i=1nx附:K2=nP0.150.100.050.025k2.0722.7063.8415.024【变式9-1】4.(2023·贵州毕节·校考模拟预测)为了解某一地区新能源电动汽车销售情况,一机构根据统计数据,用最小二乘法得到电动汽车销量y(单位:万台)关于x(年份)的线性回归方程y=4.7x-9459.2,且销量y的方差为sy(1)求y与x的相关系数r,并据此判断电动汽车销量y与年份x的线性相关性的强弱.(2)该机构还调查了该地区90位购车车主的性别与购车种类情况,得到的数据如下表:性别购买非电动汽车购买电动汽车总计男性39645女性301545总计692190依据小概率值α=0.05(3)在购买电动汽车的车主中按照性别进行分层抽样抽取7人,再从这7人中随机抽取3人,记这3人中男性的人数为X,求X的分布列和数学期望.①参考数据:5×127=②参考公式:线性回归方程为y=bx相关系数r=i=1nxi-K2=nP0.100.050.0100.001k2.7063.8416.63510.828题型10回归分析与正态分布【例题10】(2023·四川攀枝花·统考二模)攀枝花市地处川滇交界处,攀西大裂谷中段,这里气候条件独特,日照充足,盛产芒果、石榴、枇杷、甘蔗等热带亚热带水果.根据种植规模与以往的种植经验,产自某种植基地的单个“红玉软籽”石榴质量g在正常环境下服从正态分布N602,625(1)10000个产自该基地的“红玉软籽”石榴,估计有多少个质量g在577,652内;(2)2023年该基地考虑增加人工投入,现有以往的人工投入增量x(人)与年收益增量y(万元)的数据如下:人工投入增量x(人)234567年收益增量(万元)111319263138该基地为了预测人工投入增量与年收益增量的关系,建立了y与x的回归模型,试根据表中统计数据,求出y关于x的线性回归方程y=bx参考数据:若随机变量X∼Nμ,σ2,则回归直线y=bx+a【变式10-1】1.(2022下·重庆渝中·高三重庆巴蜀中学校考阶段练习)精准扶贫、精准脱贫是扶贫工作的战略部署,是全面建成小康社会、实现民族复兴的重要保障在当地党和政府的支持和帮助下,某贫困户开始种植一种夏季生长的经济作物.该类经济作物的质量以其质量指标值来衡量,下图是该经济作物的质量指标值t关于昼夜温差x(单位:℃)的散点图.(参考数据:i=15t(1)根据散点图可以认为x与t之间存在线性相关关系,且相关系数r=0.8,试用最小二乘法求出线性回归方程t(2)经过市场调查,按质量指标值t可将该类经济作物分成三级,对应的每公斤售价如下表所示:等级二级一级特级质量指标值t52.4≤t每公斤售价(元)204560经统计分析,该类经济作物的质量指标值t~Nμ,δ2,其中μ近似为散点图中质量指标值的样本均值,δ近似为散点图中质量指标值的样本标准差(附:①对于-组数据v1,μ1,v2,μ2,…,vn②若t~Nμ,σ2,则Pμ【变式10-1】2.(2019·山东青岛·校联考一模)“爱国,是人世间最深层、最持久的情感,是一个人立德之源、立功之本.”在中华民族几千年绵延发展的历史长河中,爱国主义始终是激昂的主旋律.爱国汽车公司拟对“东方红”款高端汽车发动机进行科技改造,根据市场调研与模拟,得到科技改造投入x(亿元)与科技改造直接收益y(亿元)的数据统计如下:x2346810132122232425y1322314250565868.56867.56666当0<x≤17时,建立了y与x的两个回归模型:模型①:y=4.1x+11.8;模型②:y=21.3x-(1)根据下列表格中的数据,比较当0<x≤17时模型①、②的相关指数R2,并选择拟合精度更高、更可靠的模型,预测对“东方红”款汽车发动机科技改造的投入为回归模型模型①模型②回归方程yyi182.479.2(附:刻画回归效果的相关指数R2=1--i=1(2)为鼓励科技创新,当科技改造的投入不少于20亿元时,国家给予公司补贴收益10亿元,以回归方程为预测依据,比较科技改造投入17亿元与20亿元时公司实际收益的大小;(附:用最小二乘法求线性回归方程y=bx+a(3)科技改造后,“东方红”款汽车发动机的热效率X大幅提高,X服从正态分布N0.52,0.012,公司对科技改造团队的奖励方案如下:若发动机的热效率不超过50%,不予奖励;若发动机的热效率超过50%但不超过53%,每台发动机奖励2万元;若发动机的热效率超过53(附:随机变量ξ服从正态分布Nμ,σ2,则P【变式10-1】3.(2021·广东广州·统考二模)习近平总书记指出:在扶贫的路上,不能落下一个贫困家庭,丢下一个贫困群众,根据相关统计,2010年以后中国贫困人口规模呈逐年下降趋势,2011年~2019年全国农村贫用发生的散点图如下:注:年份代码1~9分别对应年份2011年~2019年.(1)求y关于t的回归直线方程(系数精确到0.01):(2)已知某贫困地区的农民人均年纯收入X(单位:万元)满足正态分布N1.6,0.36,若该地区约有97.72%的农民人均纯收入高于该地区最低人均年纯收入标准,则该地区最低人均年纯收入标准大约为多少万元参考数据与公式:i=19y回归直线y=bt+a若随机变量X服从正态分布Nμ,σ2,则Pμ【变式10-1】4.(2019下·山东枣庄·高二统考期末)随着中美贸易战的不断升级,越来越多的国内科技巨头加大了科技研发投入的力度.中华技术有限公司拟对“麒麟”手机芯片进行科技升级,根据市场调研与模拟,得到科技升级投入x(亿元与科技升级直接收益y(亿元)的数据统计如下:序号123456789101112x2346810132122232425y1322314250565868.56867.56666当0<x≤17时,建立了y与x的两个回归模型:模型①:y=4.1x+11.8;模型②:y=21.3x-14.4(1)根据下列表格中的数据,比较当0<x≤17时模型①、②的相关指数R2的大小,并选择拟合精度更高、更可靠的模型,预测对“麒麟”回归模型模型①模型②回归方程yyi182.479.2(附:刻画回归效果的相关指数R2=1-i(2)为鼓励科技创新,当科技升级的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,比较科技升级投入17亿元与20亿元时公司实际收益的大小.(附:用最小二乘法求线性回归方程y=bx+a(3)科技升级后,“麒麟”芯片的效率X大幅提高,经实际试验得X大致服从正态分布N0.52,0.012.公司对科技升级团队的奖励方案如下:若芯片的效率不超过50%,不予奖励:若芯片的效率超过50%,但不超过53%,每部芯片奖励2元;若芯片的效率超过53%,每部芯片奖励4元记为每部芯片获得的奖励,求E(附:若随机变量X~Nμ,σ题型11独立性检验与正态分布【例题11】(2023下·江苏扬州·高三统考开学考试)云计算是信息技术发展的集中体现,近年来,我国云计算市场规模持续增长.从中国信息通信研究院发布的《云计算白皮书(2022年)》可知,我国2017年至2021年云计算市场规模数据统计表如下:年份2017年2018年2019年2020年2021年年份代码x12345云计算市场规模y/亿元692962133420913229经计算得:i=15lny(1)根据以上数据,建立y关于x的回归方程y=ebx(2)云计算为企业降低生产成本、提升产品质量提供了强大助推力.某企业未引入云计算前,单件产品尺寸与标准品尺寸的误差ε~N(0,4m),其中m为单件产品的成本(单位:元),且P(-1<附:对于一组数据(x1,y1),(x2,若X~N(μ,σ2【变式11-1】1.(2022上·福建漳州·高三校考期中)2022年卡塔尔世界杯即将于11月20日开幕.某球迷协会欲了解会员是否前往现场观看比赛,按性别进行分层随机抽样,已知男女会员人数之比为3:2,统计得到如下列联表:前往现场观看不前往现场观看合计女性8a男性b8合计40(1)求a,b的值,依据小概率值α=(2)用频率估计概率,假设会员是否前往现场观看互不影响,若从拟前往现场观看的会员中随机抽取4人进行访谈,求在访谈者中,女性不少于2人的概率.附:χ2=nα0.10.050.010.0050.001x2.7063.8416.6357.87910.828【变式11-1】2.(2023·全国·高三专题练习)2020年受疫情影响,我国企业曾一度停工停产,中央和地方政府纷纷出台各项政策支持企业复工复产,以减轻企业负担.为了深入研究疫情对我国企业生产经营的影响,帮扶困难职工,在甲、乙两行业里随机抽取了200名工人进行月薪情况的问卷调查,经统计发现他们的月薪在2000元到8000元之间,具体统计数据见下表.月薪/元[2000,3000)[3000,4000)[4000,5000)[5000,6000)[6000,7000)[7000,8000)人数203644504010将月薪不低于6000元的工人视为“I类收入群体”,低于6000元的工人视为“II类收入群体”,并将频率视为概率.(1)根据所给数据完成下面的2×2列联表:I类收入群体II类收入群体总计甲行业60乙行业20总计根据上述列联表,判断是否有99%的把握认为“II类收入群体”与行业有关.附件:K2=nk3.8416.63510.828P0.0500.0100.001(2)经统计发现该地区工人的月薪X(单位:元)近似地服从正态分布Nμ,14002,其中μ近似为样本的平均数x(每组数据取区间的中点值).若X落在区间(μ-①已知工人王强参与了本次调查,其月薪为2500元,试判断王强是否属于“生活困难”的工人;②某超市对调查的工人举行了购物券赠送活动,赠送方式为:月薪低于μ的获得两次赠送,月薪不低于μ的获得一次赠送.每次赠送金额及对应的概率如下:赠送金额/元100200300概率111求王强获得的赠送总金额的数学期望.【变式11-1】3.(2023·江苏无锡·校联考三模)为调查学生数学建模能力的总体水平,某地区组织10000名学生(其中男生4000名,女生6000名)参加数学建模能力竞赛活动.(1)若将成绩在70,85的学生定义为“有潜力的学生”,经统计,男生中有潜力的学生有2500名,女生中有潜力的学生有3500名,完成下面的2×2列联表,并判断是否有99.9%的把握认为学生是否有潜力与性别有关?是否有潜力性别合计男生女生有潜力没有潜力合计(2)经统计,男生成绩的均值为80,方差为49,女生成绩的均值为75,方差为64.(ⅰ)求全体参赛学生成绩的均值μ及方差σ2(ⅱ)若参赛学生的成绩X服从正态分布Nμ,σ2参考数据:①P0.10.050.010.0050.001k2.7063.8416.6357.87910.828②若X∼Nμ,σ2,则参考公式:K2=n【变式11-1】4.(2023·辽宁·哈尔滨三中校联考一模)某学校号召学生参加“每天锻炼1小时”活动,为了了解学生参与活动的情况,随机调查了100名学生一个月(30天)完成锻炼活动的天数,制成如下频数分布表:天数[0,5](5,10](10,15](15,20](20,25](25,30]人数4153331116(1)由频数分布表可以认为,学生参加体育锻炼天数X近似服从正态分布Nμ,σ2,其中μ近似为样本的平均数(每组数据取区间的中间值),且σ=6.1,若全校有3000名学生,求参加“每天锻炼1小时”(2)调查数据表明,参加“每天锻炼1小时”活动的天数在(15,30]的学生中有30名男生,天数在[0,15]的学生中有20名男生,学校对当月参加“每天锻炼1小时”活动超过15天的学生授予“运动达人”称号.请填写下面列联表:性别活动天数合计[0,15](15,30]男生女生合计并依据小概率值α=0.05的独立性检验,能否认为学生性别与获得“运动达人”称号有关联.如果结论是有关联,请解释它们之间如何相互影响附:参考数据:Pμ-σ≤X≤α0.10.050.010.0050.001x2.7063.8416.6357.87910.828题型12独立性检验与超几何分布【例题12】(2023上·重庆沙坪坝·高三重庆一中校考阶段练习)疫情结束之后,演唱会异常火爆.为了调查“喜欢看演唱会和学科是否有关”,对本年级的100名老师进行了调查.附:χ2=nP0.0500.0100.001k3.8416.63510.828(1)完成下列2×2列联表,并判断是否有95%的把握认为本年级老师“喜欢看演唱会”与“学科”有关;喜欢看演唱会不喜欢看演唱会合计文科老师30理科老师40合计50(2)三楼大办公室中有11名老师,有4名老师喜欢看演唱会,现从这11名老师中随机抽取3人,求抽到的3人中恰有1人喜欢看演唱会的概率.【变式12-1】1.(2023上·辽宁朝阳·高三建平县实验中学校联考阶段练习)2023年9月23日第19届亚运会在杭州开幕,本届亚运会共设40个竞赛大项,包括31个奥运项目和9个非奥运项目.为研究不同性别学生对杭州亚运会项目的了解情况,某学校进行了一次抽样调查,分别抽取男生和女生各50名作为样本,设事件A=“了解亚运会项目”,B=“学生为女生”,据统计PA附:χ2=nα0.0500.0100.001x3.8416.63510.828(1)根据已知条件,填写下列2×2列联表,并依据α=0.001的独立性检验,能否认为该校学生对亚运会项目的了解情况与性别有关了解不了解合计男生女生合计(2)现从该校了解亚运会项目的学生中,采用分层随机抽样的方法随机抽取9名学生,再从这9名学生中随机抽取4人,设抽取的4人中男生的人数为X,求X的分布列和数学期望.【变式12-1】2.(2024·四川成都·四川省成都列五中学校考一模)为了进一步推动智慧课堂的普及和应用,A市现对全市中小学智慧课堂的应用情况进行抽样调查,统计数据如表:经常应用偶尔应用或者不应用总计农村40城市60总计10060160从城市学校中任选一个学校,偶尔应用或者不应用智慧课堂的概率是14(1)补全2×2列联表,判断能否有99.5%(2)在经常应用智慧课堂的学校中,按照农村和城市的比例抽取5个学校进行分析,然后再从这5个学校中随机抽取2个学校所在的地域进行核实,记其中农村学校有X个,求X的分布列和数学期望.附:KP0.5000.0500.005k0.4453.8417.789.【变式12-1】3.(2023上·广东广州·高三华南师大附中校考阶段练习)中国进出口商品交易会,简称广交会,是由中国商务部和广东省人民政府共同主办、中国对外贸易中心承办,创办于1957年4月25日,每年春秋两季在广州举办.为调查广州地区大学生对广交会举办的了解情况,从广州各高校抽取400名学生进行问卷调查,得到部分数据如下表,男女总计了解80不了解160总计200400(1)完成上述2×2列联表,并判断是否有99.9%的把握认为广州地区大学生对广交会举办的了解情况与性别有关;(2)据调查,广州某高校学生会宣传部6人中有3人了解广交会情况,现从这6人中随机抽取4人参加2024年广交会志愿服务,设抽取的人中了解广交会的人数为X,求X的分布列与期望.参考公式:χ2参考数据:p0.100.050.010.0050.001x2.7063.8416.6357.87910.828【变式12-1】4.(2023上·湖南·高三邵阳市第二中学校联考阶段练习)2023年实行新课标新高考改革的省市共有29个,选科分类是高级中学在校学生生涯规划的重要课题,某高级中学为了解学生选科分类是否与性别有关,在该校随机抽取100名学生进行调查.统计整理数据得到如下的2×2列联表:选物理类选历史类合计男生3515女生2525合计100(1)依据小概率值α=0.05(2)在以上随机抽取的女生中,按不同选择类别同比例分层抽样,共抽取6名女生进行问卷调查,然后在被抽取的6名女生中再随机抽取4名女生进行面对面访谈.设面对面访谈的女生中选择历史类的人数为随机变量X,求随机变量X的分布列和数学期望.附:χ2=nα0.100.050.0250.0100.0050.001x2.7063.8415.0246.6357.87910.828题型13独立性检验与二项分布【例题13】(2023·广西玉林·校联考模拟预测)随着科技的发展,网络已逐渐融入了人们的生活.网购是非常方便的购物方式,为了了解网购在我市的普及情况,某调查机构进行了有关网购的调查问卷,并从参与调查的市民中随机抽取了男女各100人进行分析,从而得到表(单位:人):经常网购偶尔或不用网购合计男性45100女性65100合计(1)完成如表;对于以上数据,采用小概率值α=0.01(2)①现从所抽取的女市民中利用分层抽样的方法抽取20人,再从这20人中随机选取3人赠送优惠券,求选取的3人中至少有2人经常网购的概率;②将频率视为概率,从我市所有参与调查的市民中随机抽取20人赠送礼品,记其中经常网购的人数为X,求随机变量X的数学期望和方差.参考公式:χ2α0.1500.1000.0500.0250.0100.0050.001x2.0722.7063.8415.0246.6357.87910.828【变式13-1】1.(2023·全国·模拟预测)sinαcosβ=12sinα+β+sinα-β,cosαsinβ=合格不合格合计高三年级的学生54高一年级的学生16合计100(1)请完成2×2列联表,依据小概率值α=0.001的独立性检验,分析“对公式的掌握情况”与“学生所在年级”(2)以频率估计概率,从该校高一年级学生中抽取3名学生,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 借款人与出质人之间的合同
- 简易个人分包合同
- 废止采购合同
- 专业分包工程合同样本
- 专业工程勘察招标启示
- 互联网金融交易担保协议
- 土工网带采购合同
- 技术服务合同税率动态
- 技术服务合同的技术改进费用标准
- 招标文件价格询价步骤
- 喷涂工程合同范本
- 01685《动漫艺术概论》自考必背考试题库(含答案)
- 《THPJC-2型机床电气技能实训考核鉴定装置》-X62W万能铣床电气线路分析及故障排除与分析
- 《记念刘和珍君》高中语文选择性必修中册
- 2024年广东省高中学业水平合格性考试语文试卷真题(含答案解析)
- CJ/T 83-2016 水处理用斜管
- CJJ181-2012 城镇排水管道检测与评估技术规程
- 2024河北科技师范学院教师招聘考试笔试试题
- 劳动劳务合同模板
- 2024南宁学院教师招聘考试笔试试题
- 医师定期考核业务水平测试题库(5000题可查找)
评论
0/150
提交评论