人教版高中数学精讲精练选择性必修三第8章 成对数据的统计分析 章末测试(提升)(解析版)_第1页
人教版高中数学精讲精练选择性必修三第8章 成对数据的统计分析 章末测试(提升)(解析版)_第2页
人教版高中数学精讲精练选择性必修三第8章 成对数据的统计分析 章末测试(提升)(解析版)_第3页
人教版高中数学精讲精练选择性必修三第8章 成对数据的统计分析 章末测试(提升)(解析版)_第4页
人教版高中数学精讲精练选择性必修三第8章 成对数据的统计分析 章末测试(提升)(解析版)_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

资料整理【淘宝店铺:向阳百分百】资料整理【淘宝店铺:向阳百分百】第8章成对数据的统计分析章末测试(提升)单选题(每题5分,每题只有一个选项为正确答案,8题共40分)1.(2023湖北)给出下列命题,其中正确命题的个数为(

)①若样本数据,,…,的方差为3,则数据,,…,的方差为6;②回归方程为时,变量与具有负的线性相关关系;③随机变量服从正态分布,,则;④甲同学所在的某校高三共有5003人,先剔除3人,再按简单随机抽样的方法抽取容量为200的一个样本,则甲被抽到的概率为.A.1个 B.2个 C.3个 D.4个【答案】A【解析】对于①,若样本数据,,…,的方差为3,则数据,,…,的方差为,故①错误;对于②,回归方程为,可知,则变量x与y具有负的线性相关关系,故②正确;对于③,随机变量X服从正态分布,,根据正态分布的对称性,所以,故③错误;对于④,根据简单随机抽样概率均等可知,某校高三共有5003人,抽取容量为200的一个样本,则甲被抽到的概率为,故④错误.故选:A.2.(2022春·吉林白城·高二校考阶段练习)某种产品的广告支出费用(单位:万元)与销售量(单位:万件)之间的对应数据如下表所示:根据表中的数据可得回归直线方程,,以下说法正确的是(

)广告支出费用2.22.64.05.35.9销售量3.85.47.011.6122A.销售量的多少有96%是由广告支出费用引起的B.销售量的多少有4%是由广告支出费用引起的C.第三个样本点对应的残差,回归模型的拟合效果一般D.第三个样本点对应的残差,回归模型的拟合效果较好【答案】A【解析】因为表示解释变量对于预报变量的贡献率,,所以销售量的多少有96%由广告支出费用引起的,故A正确,B错误;当时,第三个样本点对应的残差为,又,故拟合效果较好,故CD错误.故选:A.3.(2022秋·湖南长沙·高三长郡中学校考阶段练习)为了解某种产品与原材料之间的关系,随机调查了该产品5个不同时段的产品与原材料的价格,得到如下统计数据表:原材料价格(万元/吨)产品价格(万元/件但是统计员不小心丢失了一个数据(用代替),在数据丢失之前得到回归直线方程为,则的值等于(

)A. B. C. D.【答案】A【解析】依题意,得,,因为必过,所以,解得,所以.故选:A.4.(2022·全国·高三专题练习)在新高考改革中,浙江省新高考实行的是7选3的模式,即语数外三门为必考科目,然后从物理、化学、生物、政治、历史、地理、技术(含信息技术和通用技术)7门课中选考3门.某校高二学生选课情况如下列联表一和列联表二(单位:人)选物理不选物理总计男生340110450女生140210350总计480320800表一选生物不选生物总计男生150300450女生150200350总计300500800表二试根据小概率值的独立性检验,分析物理和生物选课与性别是否有关(

)附:A.选物理与性别有关,选生物与性别有关B.选物理与性别无关,选生物与性别有关C.选物理与性别有关,选生物与性别无关D.选物理与性别无关,选生物与性别无关【答案】C【解析】由题意,先分析物理课是否与性别有关:根据表格数据,结合题干表格数据,,因此,有充分证据推断选择物理学科与性别有关再分析生物课是否与性别有关:根据表格数据,结合题干表格数据,,因此,没有充分证据推断选择生物学科与性别有关故选:C5.(2022秋·四川眉山)某企业推出了一款新食品,为了解每单位该食品中所含某种营养成分x(单位:克)与顾客的满意率y的关系,通过调查研究发现可选择函数模型来拟合y与x的关系,根据以下数据:营养成分含量x/克123454.344.364.444.454.51可求得y关于x的回归方程为(

)A. B.C. D.【答案】A【解析】由得,两边同时取对数,得;由表中数据可知,的平均数=.对于A,化简变形可得,两边同时取对数可得,将代入可得,,与题中数据吻合;故选项A正确;对于B,化简变形可得,两边同时取对数可得,,将代入可得,所以选项B错误;对于C,,两边同时取对数可得,而表中所给数据为的相关量,所以C错误;对于D,,两边同时取对数可得,而表中所给数据为的相关量,所以D错误.故选:A.6.(2022秋·陕西咸阳)某企业秉承“科学技术是第一生产力”的发展理念,投入大量科研经费进行技术革新,该企业统计了最近6年投入的年科研经费x(单位:百万元)和年利润y(单位:百万元)的数据,并绘制成如图所示的散点图.已知x,y的平均值分别为,.甲统计员得到的回归方程为;乙统计员得到的回归方程为;若甲、乙二人计算均未出现错误,有下列四个结论:①当投入年科研经费为20(百万元)时,按乙统计员的回归方程可得年利润估计值为75.6(百万元)(取);②;③方程比方程拟合效果好;④y与x正相关.以上说法正确的是(

)A.①③④ B.②③ C.②④ D.①②④【答案】D【解析】将代入,得,①正确;将,代入得,②正确;由散点图可知,回归方程比的拟合效果更好,③错误;因为随的增大而增大,所以与正相关,④正确.故①②④正确.故选:D.7.(2022·全国·高三专题练习)针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为人,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.零假设为:喜欢短视频和性别相互独立.若依据的独立性检验认为喜欢短视频和性别不独立,则的最小值为(

)附:,附表:0.050.013.8416.635A.7 B.8 C.9 D.10【答案】C【解析】根据题意,不妨设,于是,由于依据的独立性检验认为喜欢短视频和性别不独立,根据表格可知,解得,于是最小值为.故选:C8.(2022春·湖南益阳·高二统考期末)设两个相关变量和分别满足,,,2,…,6,若相关变量和可拟合为非线性回归方程,则当时,的估计值为(

)A.32 B.63 C.64 D.128【答案】C【解析】令,则,,,所以,,所以,即,所以当时,.故选:C.二、多选题(每题至少有两个选项为正确答案,少选且正确得2分,每题5分。4题共20分)9.(2022秋·山西)为了研究汽车减重对降低油耗的作用,对一组样本数据进行分析,其中表示减重质量(单位:千克),表示每行驶一百千米降低的油耗(单位:升),,由此得到的线性回归方程为.下列说法正确的是(

)A.的值一定为0B.越大,减重对降低油耗的作用越大C.残差的平方和越小,回归效果越好D.至少有一个数据点在回归直线上【答案】BC【解析】的实际意义为当减重质量为0时,汽车每行驶一百千米所降低的油耗,从其意义上来看,的值应该等于0,但拟合直线并不一定过坐标原点,因此的值可能比0略大或略小,所以A错误;的实际意义是每行驶一百千米降低的油耗量与减重质量之比,因此越大,减重对降低油耗的作用越大,所以B正确;相关指数,所以残差的平方和越小,越接近于1,回归效果越好,所以正确;有可能没有数据点在回归直线上,所以D错误.故选:BC.10.(2022·全国·高三专题练习)当下新能源汽车备受关注,某校“绿源”社团对“学生性别和喜欢新能源汽车是否有关”做了一次调查,其中被调查的男女生人数相同,男生喜欢新能源汽车的人数占男生人数的,女生喜欢新能源汽车的人数占女生人数的,若有的把握认为是否喜欢新能源汽车和性别有关,则调查人数中男生有可能的人数为(

)附:A.68 B. C.70 D.71【答案】CD【解析】设男女生总人数为,则男生喜欢新能源汽车的人数,女生喜欢新能源汽车的人数占女生人数的.则列出联表如下:类别喜欢新能源汽车不喜欢新能源汽车小计男生女生小计...所以,即,所以,故选:CD11.(2022秋·河北保定)为了增强学生体育锻炼的积极性,某中学需要了解性别因素与学生对体育锻炼的喜好是否有影响,为此对学生是否喜欢体育锻炼的情况进行普查.得到下表:性别合计男性女性喜欢280p280+p不喜欢q120120+q合计280+q120+p400+p+q附:,.0.150.100.050.0250.0100.00l2.0722.7063.8415.0246.63510.828已知男生喜欢该项运动的人数占男生人数的,女生喜欢该项运动的人数占女生人数的,则下列说法正确的是(

)A.列联表中的值为,的值为B.随机对一名学生进行调查,此学生有的可能喜欢该项运动C.有的把握认为学生的性别与其对该项运动的喜好有关系D.没有的把握认为学生的性别与其对该项运动的喜好有关系【答案】ACD【解析】A:由题意知,男生喜欢该项运动的人数占男生人数的,女生喜欢该项运动的人数占女生人数的,则,,解得,故A正确;B:补全列联表如下:男性女性合计喜欢280180460不喜欢120120240合计400300700所以随机抽一名学生进行调查,喜欢该项运动的概率约为,故B错误;C:,而,所以有的把握认为学生的性别与其对该项运动的喜好有关系,故C正确;D:由选项C知,没有的把握认为学生的性别与其对该项运动的喜好有关系,故D正确.故选:ACD12.(2023春·广东广州)下列命题正确的是(

)A.若甲、乙两组数据的相关系数分别为0.66和,则乙组数据的线性相关性更强;B.在检验A与B是否有关的过程中,根据数据算得,已知,,则有99%的把握认为A与B有关;C.已知随机变量X服从正态分布,若,则;D.在回归分析中,残差平方和与决定系数都可以用来刻画回归的效果,它们的值越小,则模型的拟合效果越好.【答案】AC【解析】A:由知:乙组数据的线性相关性更强,正确;B:由,即,则有97.5%的把握认为A与B有关,错误;C:由已知:随机变量X的分布曲线关于对称,故,正确;D:残差平方和越小,模型的拟合效果越好,但决定系数越大,模型的拟合效果越好,错误.故选:AC三、填空题(每题5分,4题共20分)13.(2022秋·陕西榆林·高二校考期末)某单位做了一项统计,了解办公楼日用电量(度)与当天平均气温之间的关系,随机统计了四个工作日用电量与当天平均气温,并制作了如下对照表:日平均气温181310日用电量度24343864由表中数据得到线性回归方程,则当日平均气温为时,预测日用电量为___________度.【答案】66【解析】由题知,,因为回归方程,所以,解得,所以回归方程为,所以,当时,所以,当日平均气温为时,预测日用电量为.故答案为:14.(2023秋·江西新余)在新冠疫情政策改变后,某社区统计了核酸检测为阳性的人数,用表示天数,表示每天核酸检测为阳性的人数,统计数据如下表所示:1234567611213466101196根据散点图判断,核酸检测为阳性的人数关于天数的回归方程适合用来表示,则其回归方程为______.参考数据:设,,,参考公式:对于一组数据,,….其回归直线的斜率和截距的最小二乘估计公式分别为:,【答案】【解析】由,可得,设,则,因为,,,所以,,所以,所以.故答案为:.15.(2023·上海)为了考察某种药物预防疾病的效果,进行动物试验,得到如下列联表:药物疾病合计未患病患病服用a50-a50未服用80-aa-3050合计8020100若在本次考察中得出“在犯错误的概率不超过0.01的前提下认为药物有效”的结论,则a的最小值为___________(其中a≥40且a∈)(参考数据:≈2.58,≈3.29)参考公式临界值表0.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.828【答案】46【解析】由题意可得,整理得:,所以或,解得:或,又因为a≥40且a∈,所以,所以a的最小值为46.故答案为:46.16.(2022·全国·高三专题练习)对平面直角坐标系中的两组点,如果存在一条直线使这两组点分别位于该直线的两侧,则称该直线为“分类直线”.对于一条分类直线,记所有的点到的距离的最小值为,约定:越大,分类直线的分类效果越好.某学校高三(2)班的7位同学在2020年期间网购文具的费用(单位:百元)和网购图书的费用(单位:百元)的情况如图所示,现将,,和为第Ⅰ组点.将,和归为第Ⅱ点.在上述约定下,可得这两组点的分类效果最好的分类直线,记为.给出下列四个结论:①直线比直线的分类效果好;②分类直线的斜率为2;③该班另一位同学小明的网购文具与网购图书的费用均为300元,则小明的这两项网购花销的费用所对应的点与第Ⅱ组点位于的同侧;④如果从第Ⅰ组点中去掉点,第Ⅱ组点保持不变,则分类效果最好的分类直线不是.其中所有正确结论的序号是___________.【答案】②③④【解析】由图象知:,①当直线为分类直线时,,当直线为分类直线时,所以直线分类效果好,故错误;②由图知定位L的位置由确定,所以直线L过点的外心,设直线方程为则,解得,故正确;③当到L的距离与到L的距离相等时为L的临界值,此时点在L的右侧,故正确;④去掉点后,,解得,故正确;故答案为:②③④四、解答题(17题10分,其余每题12分,6题共70分)17.(河南省濮阳市2022-2023学年)某出租车公司为推动驾驶员服务意识和服务水平大提升,对出租车驾驶员从驾驶技术和服务水平两个方面进行了考核,并从中随机抽取了100名驾驶员,这100名驾驶员的驾驶技术与性别的2×2列联表和服务水平评分的频率分布直力图如下,已知所有驾驶员的服务水平评分均在区间内.(1)判断能否有95%的把握认为驾驶员的驾驶技术是否优秀与性别有关;(2)从服务水平评分在区间内的驾驶员中用分层抽样的方法抽取12人,再从这12人中随机抽取4人,记X为4人中评分落在区间内的人数,求X的分布列和数学期望.附:,其中.0.100.0500.0102.7063.8416.635【答案】(1)不能有95%的把握认为驾驶员的驾驶技术是否优秀与性别有关(2)分布列见解析,【解析】(1)由题意可知:,则,即,故不能有95%的把握认为驾驶员的驾驶技术是否优秀与性别有关.(2),解得,由频率分布直方图,则服务水平评分在区间内驾驶员的频率分别为,即其比为,因此,分层抽样的12人在区间内驾驶员人数分别为,故的可能取值为,,,,,,则其分布列如下表:.18.(2023广东深圳)某学校有学生1000人,其中男生600人,女生400人.为了解学生的体质健康状况,按照性别采用分层抽样的方法抽取100人进行体质测试.其中男生有50人测试成绩为优良,其余非优良;女生有10人测试成绩为非优良,其余优良.(1)请完成下表,并依据小概率值的独立性检验,分析抽样数据,能否据此推断全校学生体质测试的优良率与性别有关.性别体质测试合计优良非优良男生女生合计(2)100米短跑为体质测试的项目之一,已知男生该项成绩(单位:秒)的均值为14,方差为1.6;女生该项成绩的均值为16,方差为4.2,求样本中所有学生100米短跑成绩的均值和方差.附:,其中.0.10.050.010.0050.0012.7063.8416.6357.87910.828参考公式:【答案】(1)列联表见解析,根据小概率事件的独立性检验,不可以认为全校学生体质测试的优良率与性别有关.(2)均值;方差【解析】(1)由分层抽样的定义可得,抽取的100人中有60名男生,40名女生,列联表如下:性别体质测试合计优良非优良男生501060女生301040合计8020100,根据小概率事件的独立性检验,不可以推断全校学生体质测试的优良率与性别有关.(2)男生人数,女生人数,则设男生的成绩为女生的成绩为所以均值为,所以,所以样本中所有学生100米短跑成绩的方差为19.(2023春·河南新乡·在数字化时代,电子书阅读给人们的阅读方式、认知模式与思维习惯带来了改变,电子书阅读的快速增长也再次引发人们对相关问题的思考.某地对本地群众(中老年人与年轻人)的年龄与阅读习惯(经常电子阅读与经常纸质阅读)进行了调查统计,得到如下列联表:年轻人中老年人合计经常电子阅读503585经常纸质阅读xy115合计MN200设从经常电子阅读的人中任取1人,记抽取到的中老年人数为;从经常纸质阅读的人中任取1人,记抽取到的中老年人数为,已知.(1)求列联表中x,y,M,N的值,并判断是否有95%的把握认为阅读习惯与年龄有关;(2)从年轻人中按阅读习惯用分层抽样的方法抽出10人,再从抽出的10人中用简单随机抽样的方法抽取3人,若其中经常电子阅读的人数为X,求X的分布列及数学期望.参考公式及数据:,其中.0.100.050.0100.0052.7063.8416.6357.879【答案】(1),,,;有95%的把握认为阅读习惯与年龄有关;(2)分布列答案见解析;数学期望:.【解析】(1)因为,所以,解得.因为,所以有95%的把握认为阅读习惯与年龄有关.(2)由题意可知,抽出的10人中,经常电子阅读的有5人,经常纸质阅读的有5人,从中取3人,则X的可能取值为0,1,2,3.因为;;;.所以X的分布列为X0123P.20.(202河南三门峡)2021年春节前,受疫情影响,各地鼓励外来务工人员选择就地过年.某市统计了该市4个地区的外来务工人数与就地过年人数(单位:万),得到如下表格:A区B区C区D区外来务工人数x/万3456就地过年人数y/万2.5344.5(1)请用相关系数说明y与x之间的关系可用线性回归模型拟合,并求y关于x的线性回归方程.(2)假设该市政府对外来务工人员中选择就地过年的每人发放1000元补贴.①若该市E区有2万名外来务工人员,根据(1)的结论估计该市政府需要给E区就地过年的人员发放的补贴总金额;②若A区的外来务工人员中甲、乙选择就地过年的概率分别为p,,其中,该市政府对甲、乙两人的补贴总金额的期望不超过1400元,求p的取值范围.参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,.【答案】(1)y与x之间的线性相关程度非常强,(2)①1750万元;②【解析】(1))由题,,,,,,所以相关系数,因为y与x之间的相关系数近似为0.99,说明y与x之间的线性相关程度非常强,所以可用线性回归模型拟合y与x之间的关系.,,故y关于x的线性回归方程为.(2)①将代入,得,故估计该市政府需要给E区就地过年的人员发放的补贴总金额为(万元).②设甲、乙两人中选择就地过年的人数为X,则X的所有可能取值为0,1,2,,,.所以,所以,由,得,又,所以,故p的取值范围为.21.(2023·全国·唐山市第十一中学校考模拟预测)近些年来,学生的近视情况由高年级向低年级漫延,为调查某小学生的视力情况与电子产品的使用时间之间的关系,调查者规定:平均每天使用电子产品累计5小时或连续使用2小时定义为长时间使用电子产品,否则为非长时间使用.随机抽取了某小学的150名学生,其中非长时间使用电子产品的100名,长时间使用电子产品的50名,调查表明非长时间使用电子产品的学生中有95人视力正常,长时间使用电子产品的学生中有40人视力正常.(1)是否有99.5%的把握认为视力正常与否与是否长时间使用电子产品有关?(2)如果用这150名学生中,长时间使用电子产品的学生和非长时间使用电子产品的学生视力正常的在各自范围内所占比率分别代替该校长时间使用电子产品的学生和非长时间使用电子产品的学生视力正常的概率,且每位学生视力正常与否相互独立,现从该校学生中随机抽取3人(2个非长时间使用和1个长时间使用电子产品),设随机变量表示“3人中视力正常”的人数,试求的分布列和数学期望.附:.0.100.050.0250.010.0052

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论