新高考艺术生数学基础复习讲义 考点22 回归方程和2×2联表(教师版含解析)_第1页
新高考艺术生数学基础复习讲义 考点22 回归方程和2×2联表(教师版含解析)_第2页
新高考艺术生数学基础复习讲义 考点22 回归方程和2×2联表(教师版含解析)_第3页
新高考艺术生数学基础复习讲义 考点22 回归方程和2×2联表(教师版含解析)_第4页
新高考艺术生数学基础复习讲义 考点22 回归方程和2×2联表(教师版含解析)_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、50/50考点22 回归方程和22联表知识理解一线性关系1变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关;点散布在左上角到右下角的区域内,两个变量的这种相关关系为负相关2两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线(2)回归方程: 是两个具有线性相关关系的变量的一组数据的回归方程,其中是待定参数 的计算公式.注意:回归方程必

2、过样本中心,这也是做小题的依据和检验所求回归方程是否正确。 (3)相关系数:当r0时,表明两个变量正相关;当r0时,表明两个变量负相关r的绝对值越接近于1,表明两个变量的线性相关性越强r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系通常|r|大于0.75时,认为两个变量有很强的线性相关性二独立性检验(1)22列联表设X,Y为两个变量,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(22列联表)如下:y1y2总计x1ababx2cdcd总计acbdabcd(2)独立性检验利用随机变量K2(也可表示为2)的观测值(其中nabcd为样本容量)来判断“两个变量有关系”的方法称为独

3、立性检验 考向分析考向一 一次线性关系【例1-1】(2020山东高三专题练习)某工厂的每月各项开支与毛利润(单位:万元)之间有如下关系,与的线性回归方程,则( )245683040605070A17.5B17C15D15.5【答案】A【解析】由题意,根据表中的数据,可得,即样本中心为,代入与的线性回归方程为,解得.故选:A.【例1-2】(2021全国高三专题练习)西尼罗河病毒(WNV)是一种脑炎病毒,WNV通常是由鸟类携带,经蚊子传播给人类1999年8-10月,美国纽约首次爆发了WNV脑炎流行在治疗上目前尚未有什么特效药可用,感染者需要采取输液及呼吸系统支持性疗法,有研究表明,大剂量的利巴韦林

4、含片可抑制WNV的复制,抑制其对细胞的致病作用现某药企加大了利巴韦林含片的生产,为了提高生产效率,该药企负责人收集了5组实验数据,得到利巴韦林的投入量x(千克)和利巴韦林含片产量y(百盒)的统计数据如下:投入量x(千克)12345产量y(百盒)1620232526由相关系数可以反映两个变量相关性的强弱,认为变量相关性很强;,认为变量相关性一般;,认为变量相关性较弱(1)计算相关系数r,并判断变量x、y相关性强弱;(2)根据上表中的数据,建立y关于x的线性回归方程;为了使某组利巴韦林含片产量达到150百盒,估计该组应投入多少利巴韦林?参考数据:参考公式:相关系数,线性回归方程中,【答案】(1),

5、x与y具有很强的相关性;(2)54.2千克【解析】(1),则所以x与y具有很强的相关性(2)由(1)得,所以y关于x的线性回归方程为当(百盒)时,(千克)故要使某组利巴韦林含片产量达到150百盒,估计该组应投入54.2千克利巴韦林【举一反三】1(2020全国高三专题练习)某工厂某产品产量(千件)与单位成本(元)满足回归直线方程,则以下说法中正确的是()A产量每增加件,单位成本约下降元B产量每减少件,单位成本约下降元C当产量为千件时,单位成本为元D当产量为千件时,单位成本为元【答案】A【解析】令,因为,所以产量每增加件,单位成本约下降元.2(2020安徽省六安中学高三开学考试)“关注夕阳、爱老敬

6、老”某马拉松协会从年开始每年向敬老院捐赠物资和现金.下表记录了第年(年是第一年)与捐赠的现金(万元)的对应数据,由此表中的数据得到了关于的线性回归方程,则预测年捐赠的现金大约是( )A万元B万元C万元D万元【答案】C【解析】由已知得,所以样本点的中心点的坐标为,代入,得,即,所以,取,得,预测2019年捐赠的现金大约是万元.3(2020全国高三专题练习)基于移动互联技术的共享单车被称为“新四大发明”之一,短时间内就风靡全国,带给人们新的出行体验、某共享单车运营公司的市场研究人员为了解公司的经营状况,对该公司最近六个月内的市场占有率进行了统计,结果如下表:月份月份代码市场占有率()(1)请在给出

7、的坐标纸中作出散点图,并用相关系数说明可用线性回归模型拟合月度市场占有率与月份代码之间的关系;(2)求关于的线性回归方程,并预测该公司年月份的市场占有率;(3)根据调研数据,公司决定再采购一批单车扩大市场,现有采购成本分别为元/辆和元/辆的、两款车型报废年限各不相同,考虑到公司的经济效益,该公司决定先对两款单车各辆进行科学模拟测试,得到两款单车使用寿命频数表如下: 报废年限车型年年年年总计经测算,平均每辆单车每年可以为公司带来收入元.不考虑除采购成本之外的其他成本,假设每辆单车的使用寿命都是整数年,且用频率估计每辆单车使用寿命的概率,以每辆单车产生利润的期望值为决策依据、如果你是该公司的负责人

8、,你会选择采购哪款车型?参考数据:,参考公式:相关系数;回归直线方程为,其中,【答案】(1)散点图见解析,可用线性回归模型拟合两变量之间的关系;(2),;(3)应选择款车型.【解析】(1)散点图如图所示, , , 两变量之间具有较强的线性相关关系,故可用线性回归模型拟合两变量之间的关系; (2),又, ,回归直线方程为; 年月的月份代码,估计年月的市场占有率为; (3)用频率估计概率,款单车的利润的分布列为:(元),款单车的利润的分布列为:(元),以每辆单车产生利润的期望值为决策依据,故应选择款车型.4(2020全国高三专题练习)近年来,“双11”网购的观念逐渐深入人心.某人统计了近年某网站“

9、双11”当天的交易额,统计结果如下表:年份20152016201720182019年份代码x12345交易额y/百亿元912172126(1)请根据上表提供的数据,用相关系数说明与的线性相关程度,线性相关系数保留三位小数.(统计中用相关系数来衡量两个变量之间线性关系的强弱.若相应于变量的取值,变量的观测值为(),则两个变量的相关系数的计算公式为:.统计学认为,对于变量,如果,那么负相关很强;如果,那么正相关很强;如果或,那么相关性一般;如果,那么相关性较弱);(2)求出关于x的线性回归方程,并预测年该网站“双11”当天的交易额.参考公式:,;参考数据:.【答案】(1)0.998;变量与的线性相

10、关程度很强;(2);百亿元.【解析】(1)由题意,根据表格中的数据,可得:,则, 所以所以变量与的线性相关程度很强.(2)由(1)可得,又由, 所以,则, 可得关于的线性回归方程为 令,可得,即年该网站“双11”当天的交易额百亿元.考向二 独立性检验【例2】(2021江苏泰州市高三期末)2020年是脱贫攻坚的收官之年,国务院扶贫办确定的贫困县全部脱贫摘帽,脱贫攻坚取得重大胜利,为确保我国如期全面建成小康社会,实现第一个百年奋斗目标打下了坚实的基础在产业扶贫政策的大力支持下,西部某县新建了甲乙两家玩具加工厂,加工同一型号的玩具质监部门随机抽检了两个厂的各100件玩具,在抽取中的200件玩具中,根

11、据检测结果将它们分成“A”“B”“C”三个等级,AB等级都是合格品,C等级是次品,统计结果如下表所示:等级ABC频数2012060(表一)厂家合格品次品合计甲75乙35合计(表二)在相关政策扶持下,确保每件合格品都有对口销售渠道,但从安全起见,所有的次品必须由原厂家自行销.(1)请根据所提供的数据,完成上面的22列联表(表二),并判断是否有95%的把握认为产品的合格率与厂家有关?(2)每件玩具的生产成本为30元,AB等级产品的出厂单价分别为60元40元.另外已知每件次品的销毁费用为4元.若甲厂抽检的玩具中有10件为A等级,用样本的频率估计概率,试判断甲乙两厂能否都能盈利,并说明理由.附:,其中

12、.0.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.828【答案】(1)列联表答案见解析,没有95%的把握认为产品的合格率与厂家有关;(2)甲厂能盈利,乙不能盈利,理由见解析.【解析】(1)22列联表如下厂家合格品次品合计甲7525100乙6535100合计14060200,没有95%的把握认为产品的合格率与厂家有关.(2)甲厂10件A等级,65件B等级,25件次品,对于甲厂,单件产品利润X的可能取值为30,10,.X的分布列如下:X3010P,甲厂能盈利,对于

13、乙厂有10件A等级,55件B等级,35件次品,对于乙厂,单位产品利润Y的可能取值为30,10,Y分布列如下:Y3010P,乙不能盈利.【举一反三】1(2021山东高三专题练习)共享单车进驻城市,绿色出行引领时尚某市有统计数据显示,2020年该市共享单车用户年龄等级分布如图1所示,一周内市民使用单车的频率分布扇形图如图2所示若将共享单车用户按照年龄分为“年轻人”(20岁39岁)和“非年轻人”(19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的称为“经常使用单车用户”,使用次数为5次或不足5次的称为“不常使用单车用户”已知在“经常使用单车用户”中有是“年轻人”(1)现对该市市

14、民进行“经常使用共享单车与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为200的样本,请你根据图表中的数据,补全下列列联表,并根据列联表的独立性检验,判断是否有85%的把握认为经常使用共享单车与年龄有关?年轻人非年轻人合计经常使用单车用户120不常使用单车用户80合计16040200使用共享单车情况与年龄列联表(2)将(1)中频率视为概率,若从该市市民中随机任取3人,设其中经常使用共享单车的“非年轻人”人数为随机变量,求的分布列与期望参考数据:独立性检验界值表0.150.100.0500.0250.0102.0722.7063.8415.0246.635其中,【答案】(1)列联表见解析,

15、有的把握可以认为经常使用共享单车与年龄有关;(2)分布列见解析,数学期望为【解析】(1)补全的列联表如下:年轻人非年轻人合计经常使用共享单车10020120不常使用共享单车602080合计16040200于是,即有的把握可以认为经常使用共享单车与年龄有关(2)由(1)的列联表可知,经常使用共享单车的“非年轻人”占样本总数的频率为,即在抽取的用户中出现经常使用单车的“非年轻人”的概率为0.1,的分布列为01230.7290.2430.0270.001的数学期望【举一反三】1(2021全国高三专题练习)某工厂为了提高生产效率,对生产设备进行了技术改造,为了对比技术改造后的效果,采集了技术改造前后各

16、20次连续正常运行的时间长度(单位:天)数据,整理如下:改造前:19,31,22,26,34,15,22,25,40,35,18,16,28,23,34,15,26,20,24,21改造后:32,29,41,18,26,33,42,34,37,39,33,22,42,35,43,27,41,37,38,36(1)完成下面的列联表,并判断能否有99的把握认为技术改造前后的连续正常运行时间有差异?超过30不超过30改造前改造后(2)工厂的生产设备的运行需要进行维护,工厂对生产设备的生产维护费用包括正常维护费,保障维护费两种对生产设备设定维护周期为T天(即从开工运行到第kT天,kN*)进行维护生产设

17、备在一个生产周期内设置几个维护周期,每个维护周期相互独立在一个维护周期内,若生产设备能连续运行,则只产生一次正常维护费,而不会产生保障维护费;若生产设备不能连续运行,则除产生一次正常维护费外,还产生保障维护费经测算,正常维护费为0.5万元次;保障维护费第一次为0.2万元周期,此后每增加一次则保障维护费增加0.2万元现制定生产设备一个生产周期(以120天计)内的维护方案:T=30,k=1,2,3,4以生产设备在技术改造后一个维护周期内能连续正常运行的频率作为概率,求一个生产周期内生产维护费的分布列及均值附:P(K2k)0.0500.0100.001k3.8416.63510.828【答案】(1)

18、见解析,有99%的把握认为技术改造前后的连续正常运行时间有差异.(2)见解析;均值为2.275万元.【解析】(1)列联表为:超过30不超过30改造前515改造后155有99%的把握认为技术改造前后的连续正常运行时间有差异. (2)由题知,生产周期内有4个维护周期,一个维护周期为30天,一个维护周期内,生产线需保障维护的概率为.设一个生产周期内需保障维护的次数为,则;一个生产周期内的正常维护费为万元,保障维护费为万元.一个生产周期内需保障维护次时的生产维护费为万元.设一个生产周期内的生产维护费为X,则X的所有可能取值为2,2.2,2.6,3.2,4. 所以,的分布列为22.22.63.24一个生

19、产周期内生产维护费的均值为2.275万元.2(2020四川成都市高三一模)一网络公司为某贫困山区培养了名“乡土直播员”,以帮助宣传该山区文化和销售该山区的农副产品,从而带领山区人民早日脱贫致富该公司将这名“乡土直播员”中每天直播时间不少于小时的评为“网红乡土直播员”,其余的评为“乡土直播达人”根据实际评选结果得到了下面列联表:网红乡土直播员乡土直播达人合计男104050女203050合计3070100(1)根据列联表判断是否有的把握认为“网红乡土直播员”与性别有关系?(2)在“网红乡土直播员”中按分层抽样的方法抽取人,在这人中选人作为“乡土直播推广大使”设被选中的名“乡土直播推广大使”中男性人

20、数为,求的分布列和期望附:,其中【答案】(1)有的把握认为“网红乡土直播员”与性别有关系;(2)分布列见解析;期望为【解析】(1)由题中列联表,可得有的把握认为“网红乡土直播员”与性别有关系(2)在“网红乡土直播员”中按分层抽样的方法抽取6人,男性人数为人;女性人数为人由题,随机变量所有可能的取值为,的分布列为012的数学期望考向三 非一次性回归方程【例3-1】(2021全国高三专题练习)在一项调查中有两个变量和,下图是由这两个变量近8年来的取值数据得到的散点图,那么适宜作为关于的回归方程的函数类型是( )ABCD()【答案】B【解析】散点图呈曲线,排除A选项,且增长速度变慢,排除选项C、D,

21、故选B【例3-2】(2020全国高三专题练习)根据公安部交管局下发的通知,自2020年6月1日起,将在全国开展“一盔一带”安全守护行动,其中就要求骑行摩托车、电动车需要佩戴头盔,为的就是让大家重视交通安全.某地交警部门根据某十字路口的监测数据,从穿越该路口的骑行者中随机抽查了200人,得到如图所示的列联表:戴头盔不带头盔合计男性3090120女性107080合计40160200(1)是否有97.5%的把握认为自觉带头盔行为与性别有关?(2)通过一定的宣传和相关处罚措施出台后,交警在一段时间内通过对某路口不带头盔的骑行者统计,得到上面的散点图和如下数据:天数123456人数11060443430

22、28观察散点图,发现两个变量不具有线性相关关系,现考虑用函数对两个变量的关系进行拟合,通过分析得y与有一定的线性相关关系,并得到以下参考数据(其中):3.50.4112.250.1681911.492816173.8306请选择合适的参考数据,求出y关于x的回归方程.参考公式:.0.0500.0250.0100.0050.001k3.8415.0246.6357.87910.828对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:,.【答案】(1)没有;(2).【解析】(1)由列联表计算.故没有的把握认为骑行者自觉带头盔行为与性别有关.(2)由,则可转化为,又,得,则.故y关于x的回归

23、方程为【举一反三】1(2020河南周口市高三月考)已知变量关于变量的回归方程为,其一组数据如下表所示:1234若,则( )A5B6C7D8【答案】B【解析】由,得,令,则,由题意,因为满足,所以,解得,所以,所以,令,解得.故选:B.2(2021全国高三专题练习)近期,济南公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用表示活动推出的天数,表示每天使用扫码支付的人次(单位:十人次),统计数据如表所示:表:根据以上数据,绘制了散点图.1234567

24、611213466101196(1)根据散点图判断,在推广期内与(,均为大于零的常数)哪一个适宜作为扫码支付的人次关于活动推出天数的回归方程类型?(给出判断,不必说明理由);(2)根据(1)的判断结果及表中的数据,建立关于的回归方程,并预测活动推出第8天使用扫码支付的人次;(3)推广期结束后,车队对乘客的支付方式进行统计,结果如下表:支付方式现金乘车卡扫码比例10%60%30%车队为缓解周边居民出行压力,以80万元的单价购进了一批新车,根据以往的经验可知,每辆车每个月的运营成本约为0.66万元.已知该线路公交车票价为2元,使用现金支付的乘客无优惠,使用乘车卡支付的乘客享受8折优惠,扫码支付的乘

25、客随机优惠,根据统计结果得知,使用扫码支付的乘客中有的概率享受7折优惠,有的概率享受8折优惠,有的概率享受9折优惠,预计该车队每辆车每个月有1万人次乘车,根据所给数据以事件发生的频率作为相应事件发生的概率,在不考虑其它因素的条件下,按照上述收费标准,假设这批车需要年才能开始盈利,求的值.参考数据:其中,参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为:,.661.542.71150.123.47【答案】(1);(2),347;(3)7.【解析】(1)因为散点近似在指数型函数的图象上,所以适宜作为扫码支付的人数关于活动推出天数的回归方程类型:(2),两边同时取常用对数得:;

26、设,把样本中心点代入,得:,关于的回归方程式:;把代入上式:;活动推出第8天使用扫码支付的人次为347;(3)记一名乘客乘车支付的费用为,则的取值可能为:2,1.8,1.6,1.4;所以,一名乘客一次乘车的平均费用为:(元),由题意可知:,所以,取7;估计这批车大概需要7年才能开始盈利.3(2021全国高三专题练习)某公司研发了一种帮助家长解决孩子早教问题的萌宠机器人.萌宠机器人语音功能让它就像孩子的小伙伴一样和孩子交流,记忆功能还可以记住宝宝的使用习惯,很快找到宝宝想听的内容.同时提供快乐儿歌、国学经典、启蒙英语等早期教育内容,且云端内容可以持续更新.萌宠机器人一投放市场就受到了很多家长欢迎

27、.为了更好地服务广大家长,该公司研究部门从流水线上随机抽取100件萌宠机器人(以下简称产品),统计其性能指数并绘制频率分布直方图(如图1):产品的性能指数在的适合托班幼儿使用(简称A类产品),在的适合小班和中班幼儿使用(简称B类产品),在的适合大班幼儿使用(简称C类产品),A,B,C,三类产品的销售利润分别为每件1.5,3.5,5.5(单位:元).以这100件产品的性能指数位于各区间的频率代替产品的性能指数位于该区间的概率.(1)求每件产品的平均销售利润;(2)该公司为了解年营销费用(单位:万元)对年销售量(单位:万件)的影响,对近5年的年营销费用,和年销售量数据做了初步处理,得到的散点图(如

28、图2)及一些统计量的值.16.3024.870.411.64表中,.根据散点图判断,可以作为年销售量(万件)关于年营销费用(万元)的回归方程.(i)建立关于的回归方程;(ii)用所求的回归方程估计该公司应投入多少营销费,才能使得该产品一年的收益达到最大?(收益=销售利润-营销费用,取).参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,.【答案】(1)每件产品的平均销售利润为4元(2)(i)(ii)该厂应投入256万元营销费.【解析】(1)设每件产品的销售利润为元,则的所有可能取值为1.5,3.5,5.5,由直方图可得,三类产品的频率分别为0.15、0.45、0.4,所以,所

29、以随机变量的分布列为:1.53.55.50.150.450.4所以,故每件产品的平均销售利润为4元;(2)(i)由得,令,则,由表中数据可得,则,所以,即,因为,所以,故所求的回归方程为;(ii)设年收益为万元,则,设,则,当时,在单调递增,当时,在单调递减,所以,当,即时,有最大值为768,即该厂应投入256万元营销费,能使得该产品一年的收益达到最大768万元.强化练习1(2021全国高三专题练习)给出下列说法:回归直线恒过样本点的中心,且至少过一个样本点;两个变量相关性越强,则相关系数就越接近1;将一组数据的每个数据都加一个相同的常数后,方差不变;在回归直线方程中,当解释变量增加一个单位时

30、,预报变量平均减少0.5个单位.其中说法正确的是( )ABCD【答案】B【解析】对于中,回归直线恒过样本点的中心,但不一定过一个样本点,所以不正确;对于中,根据相关系数的意义,可得两个变量相关性越强,则相关系数就越接近1,所以是正确的;对于中,根据方差的计算公式,可得将一组数据的每个数据都加一个相同的常数后,方差是不变的,所以是正确的;对于中,根据回归系数的含义,可得在回归直线方程中,当解释变量增加一个单位时,预报变量平均减少0.5个单位,所以是正确的.故选:B.2(2020全国高三专题练习)对两个变量、进行线性相关检验,得线性相关系数,对两个变量、进行线性相关检验,得线性相关系数,则下列判断

31、正确的是( )A变量与正相关,变量与负相关,变量与的线性相关性较强B变量与负相关,变量与正相关,变量与的线性相关性较强C变量与正相关,变量与负相关,变量与的线性相关性较强D变量与负相关,变量与正相关,变量与的线性相关性较强【答案】C【解析】由线性相关系数知与正相关,由线性相关系数知与负相关,又,所以,变量与的线性相关性比与的线性相关性强,故选:C.3(2020河南新乡市高三一模)年的“金九银十”变成“铜九铁十”,全国各地房价“跳水”严重,但某地二手房交易却“逆市”而行.下图是该地某小区年月至年月间,当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码分别对应年月年月)根据散点图选择

32、和两个模型进行拟合,经过数据处理得到的两个回归方程分别为和,并得到以下一些统计量的值:注:是样本数据中的平均数,是样本数据中的平均数,则下列说法不一定成立的是( )A当月在售二手房均价与月份代码呈正相关关系B根据可以预测年月在售二手房均价约为万元/平方米C曲线与的图形经过点D回归曲线的拟合效果好于的拟合效果【答案】C【解析】对于A,散点从左下到右上分布,所以当月在售二手房均价与月份代码呈正相关关系,故A正确;对于B,令,由,所以可以预测年月在售二手房均价约为万元/平方米,故B正确;对于C,非线性回归曲线不一定经过,故C错误;对于D,越大,拟合效果越好,故D正确.故选:C.4(2020全国高三专

33、题练习)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( ) ABCD【答案】A【解析】由给出的四组数据的散点图可以看出,题图1和题图3是正相关,相关系数大于0,题图2和题图4是负相关,相关系数小于0,题图1和题图2的点相对更加集中,所以相关性更强,所以接近于1,接近于,由此可得故选:A5(2020邵阳市第二中学高三其他模拟(文)某种产品的广告费支出与销售额(单位:万元)之间有如表关系,与的线性回归方程为,当广告支出5万元时,随机误差的效应(残差)为( )245683040605070A10B20C30D40【答案】A【解析】因为与的线性回归方程为,所以当时,由表格当广告支

34、出万元时,销售额为万元,所以随机误差的效应(残差)为 故选A.6(2020全国高三专题练习)为研究某种细菌在特定环境下,随时间变化的繁殖情况,得到如下实验数据:天数(天)3456繁殖个数(千个)2.534.5由最小二乘法得与的线性回归方程为,则当时,繁殖个数的预测值为( )A4.9B5.25C5.95D6.15【答案】B【解析】由题意,根据表格中的数据,可得,即样本中心为,代入回归直线方程,即,解得,即回归直线的方程为,当时,故选B7(2020全国高三专题练习)已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下对应数据:x24568y3040506070根据上表可得回归

35、方程,计算得,则当投入10万元广告费时,销售额的预报值为A75万元B85万元C99万元D105万元【答案】B【解析】【解析】由题意得,样本中心为回归直线过样本中心,解得,回归直线方程为当时,故当投入10万元广告费时,销售额的预报值为85万元故选B8(2020全国高三专题练习)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表非一线一线总计愿生452065不愿生132235总计5842100由,得.参照下表,P(K2k0)0.0500.0100.001k03.8416.63510.828下列结论正确的是(

36、)A在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C有99%以上的把握认为“生育意愿与城市级别有关”D有99%以上的把握认为“生育意愿与城市级别无关”【答案】C【解析】因为,所以有以上的把握认为“生育意愿与城市级别有关”,故选:C.9(2020全国高三专题练习)为考察高中生的性别与是否喜欢数学课程之间的关系,利用22列联表进行检验,经计算K2的观测值k7.069,参考下表,则认为“性别与是否喜欢数学课程有关”犯错误的概率不超过( )P(K2k0)0.1000.0500.0250.0100.001k02.

37、7063.8415.0246.63510.828A0.001B0.01C0.99D0.999【答案】B【解析】k7.0696.635,对照表格,则认为“性别与是否喜欢数学课程有关”犯错误的概率不超过0.01,故选:B.10(多选)(2021全国高三专题练习)因防疫的需要,多数大学开学后启用封闭式管理某大学开学后也启用封闭式管理,该校有在校学生9000人,其中男生4000人,女生5000人,为了解学生在封闭式管理期间对学校的管理和服务的满意度,随机调查了40名男生和50名女生,每位被调查的学生都对学校的管理和服务给出了满意或不满意的评价,经统计得到如下列联表:满意不满意男2020女4010附表:

38、P(K2k)0.1000.050.0250.0100.001k2.7063 .8415.0246.63510.828附:以下说法正确的有( )A满意度的调查过程采用了分层抽样的抽样方法B该学校学生对学校的管理和服务满意的概率的估计值为0.6C有99的把握认为学生对学校的管理和服务满意与否与性别有关系D没有99的把握认为学生对学校的管理和服务满意与否与性别有关系【答案】AC【解析】因为男女比例为40005000,故A正确满意的频率为,所以该学校学生对学校的管理和服务满意的概率的估计值约为0.667,所以B错误由列联表,故有99的把握认为学生对学校的管理和服务满意与否与性别有关系,所以C正确,D错

39、误故选:AC.11(2021山东高三专题练习)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面

40、积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r=,1.414.【答案】(1);(2);(3)详见解析【解析】(1)样区野生动物平均数为,地块数为200,该地区这种野生动物的估计值为(2)样本(i=1,2,20)的相关系数为(3)由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性,由于各地块间植物覆盖面积差异很大,从俄各地块间这种野生动物的数量差异很大,采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.12(2020江苏

41、南通市高三期中)利用简单随机抽样的方法,从某校高一年级男生体验表格中抽取名同学的胸围与肺活量的样本,计算平均值,并求出线性回归方程为.高一男生胸围与肺活量样本统计表胸围肺活量胸围肺活量(1)求的值;(2)求样本与的相关系数,并根据相关性检验的临界值表,判断有无把握认为肺活量与胸围线性关系是有意义的(精确到);(3)将肺活量不低于视为大肺活量,用样本大肺活量的频率作为全校高一男生大肺活量的概率,求从本校高一年级任意抽取名男同学,恰有两名是大肺活量的概率.(参考公式及数据:,.)附:相关性检验的临界值表检验水平【答案】(1)1433.07;( 2)有99%的把握认为肺活量的大小与胸围具有线性相关关

42、系;(3).【解析】( 1)由于回归直线:=32.26x+a过点(80.5,4030),所以a=4030-32.26x80.5=1433.07.( 2)假设H0:变量x,y不具有线性相关关系,所以r=32.260.601,由相关性检验临界值表知:r001=0.561,r=0.6010.561,所以有99%的把握认为肺活量的大小与胸围具有线性相关关系.( 3)从统计表中可知,20个样本中不低于4500m/有5个,所以全校高一男生大肺活量的概率为=设从高一年级任取4名男同学,恰有两名男生是大肺活量的概率为,则p=.所以从高一年级任取4名男同学,恰有两名男生是大肺活量的概率为.13(2020江苏扬州

43、市高三期中)某校从高二年级随机抽取了20名学生的数学总评成绩和物理总评成绩,记第i位学生的成绩为() (i=1,2,3.20),其中分别为第i位学生的数学总评成绩和物理总评成绩.抽取的数据列表如下( 按数学成绩降序整理):序号12345678910数学总评成绩x95929190898888878685物理总评成绩y96908987928186888384序号11121314151617181920数学总评成绩x83828180807978777574物理总评成绩81808285807879818078(1)根据统计学知识,当相关系数|r|0.8时,可视为两个变量之间高度相关.根据抽取的数据,能

44、否说明数学总评成绩与物理总评成绩高度相关?请通过计算加以说明. 参考数据:参考公式:相关系数(2)规定:总评成绩大于等于85分者为优秀,小于85分者为不优秀,对优秀赋分1,对不优秀赋分0,从这20名学生中随机抽取2名学生,若用X表示这2名学生两科赋分的和,求X的分布列和数学期望.【答案】(1)“数学学期综合成绩”与“物理学期综合成绩”高度相关;答案见解析;(2)分布列见解析,.【解析】(1)由题意,所以“数学学期综合成绩”与“物理学期综合成绩”高度相关; (2) 由题意得:的可能取值为0,1,2,3,4.,根据赋分规则可知,7人赋分为2,4人赋分为1,9个人赋分为0,所以,所以的分布列为:01

45、234所以.14(2020全国高三专题练习)近年来,“双11”网购的观念逐渐深入人心.某人统计了近年某网站“双11”当天的交易额,统计结果如下表:年份20152016201720182019年份代码x12345交易额y/百亿元912172126(1)请根据上表提供的数据,用相关系数说明与的线性相关程度,线性相关系数保留三位小数.(统计中用相关系数来衡量两个变量之间线性关系的强弱.若相应于变量的取值,变量的观测值为(),则两个变量的相关系数的计算公式为:.统计学认为,对于变量,如果,那么负相关很强;如果,那么正相关很强;如果或,那么相关性一般;如果,那么相关性较弱);(2)求出关于的线性回归方程

46、,并预测年该网站“双11”当天的交易额.参考公式:,;参考数据:.【答案】(1)0.998;变量与的线性相关程度很强;(2);百亿元.【解析】(1)由题意,根据表格中的数据,可得:, 则, 所以, 所以变量与的线性相关程度很强.(2)由(1)可得,又由,所以,则, 可得关于的线性回归方程为, 令,可得,即年该网站“双11”当天的交易额百亿元.15(2020陕西高三零模)年月日,国家统计局公布全国规模以上工业企业月累计营业收入利润率数据如表:月份累计月月月月月月月月月月月份累计代码营业收入利润率(1)根据表中有关数据请在下图中补充完整与的折线图,判断与哪一个更适宜作为关于的回归方程类型,并说明理

47、由;(2)根据(1)的判断结果及表中数据,建立关于的回归方程(系数精确到);(3)根据(2)得出的回归方程,预测月月累计营业收入利润率的值为多少?参考公式:对于一组数据、,其回归直线的斜率和截距的最小二乘估计分别为,.参考数据:表中,【答案】(1)折线图见解析,更适宜,理由见解析;(2);(3)【解析】(1)补充完整的折线图如下,可知选用更适宜理由:根据折线图知折线的形状更接近的图象(2)令,先建立关于的线性回归方程,,关于的线性归方程为,关于的回归方程为;(3)由(2)可知,当时,因此,预测月月累计营业收入利润率的值为16(2020河北邢台市邢台一中高三月考)近年来,国资委、党委高度重视扶贫

48、开发工作,坚决贯彻落实中央扶贫工作重大决策部署,在各个贫困县全力推进定点扶贫各项工作,取得了积极成效.某贫困县为了响应国家精准扶贫的号召,建了一些蔬菜大棚供村民承包管理,已知土地的使用面积以及相应的管理时间的关系如下表所示:土地使用面积(单位:亩)12345管理时间(单位:月)810132024并调查了某村300名村民参与管理的意愿,得到的部分数据如下表所示:愿参与管理不愿参与管理男性村民15050女性村民50(1)求出相关系数r(保留三位小数)的大小,并判断管理时间y与土地使用面积x是否有较强的相关关系?若有,求出线性回归方程.(2)是否有99.9%的把握认为村民的性别与参与管理的意愿有关?

49、参考公式:,;,0.0100.0050.0016.6357.87910.828参考数据:【答案】(1);管理时间y与土地使用面积x有较强的相关关系;(2)有99.9%的把握认为村民的性别与参与管理的意愿有关.【解析】(1)根据题中数据可得,01259计算得:,则,故管理时间y与土地使用面积x有较强的相关关系;求得:,.故回归方程是:;(2)依题意,女性村民中不愿意参与管理的人数为50,计算得的观测值为:故有99.9%的把握认为村民的性别与参与管理的意愿有关.17(2020山东济南市高三开学考试)2019年6月25日,固体废物污染环境防治法(修订草案)初次提请全国人大常委会审议,草案对“生活垃圾

50、污染环境的防治”进行了专章规定.草案提出,国家推行生活垃圾分类制度.为了了解人民群众对垃圾分类的认识,某市环保部门对该市市民进行了一次垃圾分类网络知识问卷调查,每一位市民仅有一次参加机会,通过随机抽样,得到参加问卷调查的1000人(其中450人为女性)的得分(满分:100分)数据,统计结果如表所示:得分男性人数15901301001256030女性人数1060701501004020(1)由频数分布表可以认为,此次问卷调查的得分服从正态分布,近似为这1000人得分的平均值(同一组数据用该组区间的中点值作为代表),请利用正态分布的知识求;(2)把市民分为对垃圾分类“比较了解”(不低于60分的)和

51、“不太了解”(低于60分的)两类,请完成如下列联表,并判断是否有的把握认为市民对垃圾分类的了解程度与性别有关?不太了解比较了解合计男性女性合计(3)从得分不低于分的被调查者中采用分层抽样的方法抽取名.再从这人中随机抽取人,求抽取的人中男性人数的分布列及数学期望.参考数据:;若,则,;,【答案】(1);(2)列联表答案见解析,有的把握认为学生对垃圾分类的了解程度与性别有关;(3)分布列详见见解析,数学期望:.【解析】(1)由题意知:,又,所以.(2)由题意得列联表如下:不太了解比较了解合计男性235315550女性140310450合计3756251000,所以有的把握认为学生对垃圾分类的了解程

52、度与性别有关.(3)不低于分的被调查者的男女比例为,所以采用分层抽样的方法抽取人中,男性为人,女性为人.设从这人中随机抽取的人中男性人数为,则的取值为,所以随机变量的分布列为所以其期望18(2020河南高三月考)某省为了迎接国家数学竞赛,特地在,两所学校分别用甲乙两种方法培训教学.为观测其成绩情况,分别在两个班级各随机抽取60名学生,对每名学生进行综合评分,将每名学生所得的综合评分制成如图所示的频率分布直方图,其中,.记综合评分为80及以上的学生为优质学生.(1)求图中,的值,并求综合评分的平均数(同一组中的数据用该组区间的中点值作代表);(2)用样本估计总体,以频率作为概率,若在,两个班级随

53、机抽取3名学生,求所抽取的学生中的优质学生数的分布列和数学期望(3)填写下面的列联表,能否在犯错误的概率不超过0.1的情况下认为优质学生与培训方法有关.优质学生非优质学生合计甲培训法40乙培训法合计附:0.150.100.050.0250.0100.0050.0012.0722.7063.8415.0246.6357.87910.828(参考公式:,其中.)【答案】(1),综合评分的平均数为(分);(2)分布列答案见解析,数学期望:;(3)列联表答案见解析,不能在犯错误的概本不超过0.1的情况下认为优质学生与培训方法有关.【解析】(1)由频率分布直方图,可得,解得.综合评分的平均数为(分).(

54、2)由(1)知,学生为优秀的概率为,记优质学生数为,由题意知,的所有可能取值为0,1,2,3.则,.故的分布列为01230.0640.2880.4320.216所以的数学期望为.(3)填写列联表如下.优质学生非优质学生合计甲培训法402060乙培训法322860合计7248120计算,所以不能在犯错误的概本不超过0.1的情况下认为优质学生与培训方法有关.20(2020全国高三专题练习)某企业销售部门为了解员工的销售能力,按性别利用分层抽样的方法从该部门现有员工中(其中男生占比为45%)随机抽取名进行问卷调查,并将得分分为1,2,3,4,5五个档次,各档次中参与问卷调查的员工人数如条形图所示.已

55、知第5档的员工人数占总人数的.(1)若将某员工得分所在的档次作为该员工销售的能力基数(记能力基数为能力基数高,其他均为能力基数不高),在能力基数为5的员工中,女生与男生的比例为,以抽取的名员工为研究对象,完成下面的列联表,并判断是否有90%的把握认为能力基数高低与性别有关;男生女生合计能力基数高能力基数不高合计(2)为提高员工认知并调动员工自主学习的积极性,部门组织员工参加各种形式的培训讲座.已知每位员工的销售能力指数、能力基数以及参加培训的次数满足函数关系式,如果员工甲的能力基数为4,员工乙的能力基数为2,则在甲不参加培训的情况下,乙至少参加多少次培训,其销售能力指数超过甲?参考数据及参考公

56、式:,0.150.100.050.012.0722.7063.8416.635【答案】(1)列联表见解析;没有;(2)17次.【解析】(1)由已知及条形图,可得,得,补全列联表如下所示.男生女生合计能力基数高61420能力基数不高394180合计4555100,所以没有90%的把握认为能力基数高低与性别有关.(2)员工甲的销售能力指数.员工乙参加次培训后的销售能力指数,由已知得,即,即,解得,可得,所以乙至少参加17次培训,其销售能力指数超过甲.21(2020全国高三专题练习)近年来我国电子商务行业迎来蓬勃发展的新机遇,2016年双11期间,某购物平台的销售业绩高达918亿人民币.与此同时,相关管理部门推出了针对电商的商品和服务的评价体系.现从评价系统中选出200次成功交易,并对其评价进行统计,对商品的好评率为0.6,对服务的好评率为0.75,其中对商品和服务都做出好

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论