(新教材适用)2023-2024学年高中数学第8章成对数据的统计分析检测题新人教A版选择性_第1页
(新教材适用)2023-2024学年高中数学第8章成对数据的统计分析检测题新人教A版选择性_第2页
(新教材适用)2023-2024学年高中数学第8章成对数据的统计分析检测题新人教A版选择性_第3页
(新教材适用)2023-2024学年高中数学第8章成对数据的统计分析检测题新人教A版选择性_第4页
(新教材适用)2023-2024学年高中数学第8章成对数据的统计分析检测题新人教A版选择性_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章检测题考试时间120分钟,满分150分.一、单项选择题(本大题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列说法中正确的是(C)A.相关关系是一种不确定的关系,回归分析是对相关关系的分析,因此没有实际意义B.独立性检验对分类变量关系的研究没有100%的把握,所以独立性检验研究的结果在实际中也没有多大的实际意义C.相关关系可以对变量的发展趋势进行预报,这种预报可能会是错误的D.独立性检验如果得出的结论有99%的可信度,就意味着这个结论一定是正确的[解析]相关关系虽然是一种不确定关系,但是回归分析可以在某种程度上对变量的发展趋势进行预报,这种预报在尽量减小误差的条件下可以对生产与生活起到一定的指导作用,独立性检验对分类变量的检验也是不确定的,但是其结果也有一定的实际意义,故选C.2.相关变量x,y的样本数据如下:x12345y22356经回归分析可得y与x线性相关,并由最小二乘法求得经验回归方程=x+a,则a=(C)A.0.1 B.C.0.3 D.[解析]由题意,eq\x\to(x)=eq\f(1+2+3+4+5,5)=3,eq\x\to(y)=eq\f(2+2+3+5+6,5)=,∵经验回归方程为=x+a,∴=×3+a,∴a=0.3.故选C.3.已知经验回归方程=2x+相应于点(3,6.5)的残差为-,则的值为(B)A.0.5 B.C.-0.5 D.-[解析]因为经验回归方程=2x+相应于点(3,6.5)的残差为-,所以=6+-,解得=0.6.4.假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表如下:YXy1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d对于同一样本,以下数据能说明X与Y有关的可能性最大的一组为(D)A.a=5,b=10,c=6,d=7B.a=5,b=6,c=10,d=7C.a=7,b=6,c=10,d=5D.a=6,b=7,c=10,d=5[解析]对于同一样本,|ad-bc|越小,说明X与Y相关性越弱,而|ad-bc|越大,说明X与Y相关性越强,通过计算知,对于选项A,B,C,都有|ad-bc|=|35-60|=25;对于选项D,有|ad-bc|=40.故选D.5.某同学寒假期间对其30位亲属的饮食习惯进行了一次调查,列出了如下2×2列联表:年龄饮食习惯合计偏爱蔬菜偏爱肉类50岁以下481250岁以上16218合计201030则可以说其亲属的饮食习惯与年龄有关的把握为(C)A.95% B.99%C.99.5% D.99.9%[解析]因为χ2=eq\f(30×(4×2-16×8)2,12×18×20×10)==x,所以有99.5%的把握认为其亲属的饮食习惯与年龄有关.6.废品率x%与每吨生铁成本y(元)之间的经验回归方程为=234+3x,表明(B)A.废品率每增加1%,生铁成本增加3x元B.废品率每增加1%,生铁成本每吨平均增加3元C.废品率每增加1%,生铁成本增加234元D.废品率不变,生铁成本为234元[解析]经验回归方程表示废品率x%与每吨生铁成本y(元)之间的相关关系,当经验回归方程为=234+3x时,表明废品率每增加1%,生铁成本每吨平均增加3元,故选B.7.两个相关变量满足如下关系:x1015202530y10031005101010111014两变量的经验回归方程为(A)A.=x+B.=x-C.=x+D.=x+[解析]eq\x\to(x)=eq\f(10+15+20+25+30,5)=20,eq\x\to(y)=eq\f(1003+1005+1010+1011+1014,5)=,利用公式可得=eq\f(10×1003+15×1005+20×1010+25×1011+30×1014-5×20×,100+225+400+625+900-5×400)=,又=eq\x\to(y)-eq\x\to(x)=997.4.∴经验回归方程为=x+997.4.故选A.8.如图是某市2022年10月至2023年10月间,每月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码1~13分别对应2022年10月—2023年10月)根据散点图选择y=a+beq\r(x)和y=c+dlnx两个模型进行拟合,经过数据处理得到的两个经验回归方程分别为=0.9369+0.0285eq\r(x)和=0.9554+0.0306lnx,并得到以下一些统计量的值:=0.9369+0.0285eq\r(x)=0.9554+0.0306lnxR2注:eq\x\to(x)是样本数据中x的平均数,eq\x\to(y)是样本数据中y的平均数,则下列说法不一定成立的是(C)A.当月在售二手房均价y与月份代码x呈现正相关关系B.根据=0.9369+0.0285eq\r(x)可以预测2024年1月在售二手房均价约为1.0509万元/平方米C.曲线=0.9369+0.0285eq\r(x)与=0.9554+0.0306lnx的图形经过点(eq\x\to(x),eq\x\to(y))D.=0.9554+0.0306lnx回归曲线的拟合效果好于=0.9369+0.0285eq\r(x)的拟合效果[解析]对于A,散点从左下到右上分布,所以当月在售二手房均价y与月份代码x呈现正相关关系,故正确,不符合题意;对于B,令x=16,由=0.9369+0.0285eq\r(16)=1.0509,所以可以预测2024年1月在售房均价约为1.0509万元/平方米,故正确,不符合题意;对于C,非线性回归曲线不一定经过(eq\x\to(x),eq\x\to(y)),故错误,符合题意;对于D,R2越大,拟合效果越好,故正确,不符合题意.二、多项选择题(本大题共4小题,每小题5分,共20分.在每小题给出的四个选项中,有多个选项是符合题目要求的,全部选对的得5分,选对但不全的得2分,有选错的得0分)9.晚上睡眠充足是提高学习效率的必要条件,高中甲的高三年级学生晚上10点10分必须休息,高中乙的高三年级学生晚上11点休息,并鼓励学生还可以继续进行夜自习,稍晚再休息.有关人员分别对这两所高中的高三年级学习总成绩前50名学生的学习效率进行问卷调查,其中高中甲有30名学生的学习效率高,且从这100名学生中随机抽取1人,抽到学习效率高的学生的概率是,则(AC)附:K2=eq\f(n(ad-bc)2,(a+b)(a+c)(b+d)(c+d)).P(K2≥k0)k0A.高中甲的前50名学生中有60%的学生学习效率高B.高中乙的前50名学生中有40%的学生学习效率高C.有%的把握认为“学生学习效率高低与晚上睡眠是否充足有关”D.认为“学生学习效率高低与晚上睡眠是否充足有关”的犯错概率超过[解析]高中甲的前50名学生中有30人学习效率高,即eq\f(30,50)×100%=60%,所以A正确;高中乙的前50名学生中有10人学习效率高,即eq\f(10,50)×100%=20%,所以B错误;这100名学生中学习效率高的学生有100×=40(人),根据题意填写2×2列联表如下:学习效率高学习效率不高合计高中甲302050高中乙104050合计4060100计算观测值K2=eq\f(100×(30×40-10×20)2,40×60×50×50)=eq\f(50,3)≈,所以有%的把握认为“学生学习效率高低与晚上睡眠是否充足有关”,C正确;认为“学生学习效率高低与晚上睡眠是否充足有关”的犯错概率不超过,所以D错误.故选AC.10.在统计中,由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)利用最小二乘法得到两个变量的经验回归方程为=x+,那么下面说法正确的是(BCD)A.经验回归直线=x+至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点B.经验回归直线=x+必经过点(eq\x\to(x),eq\x\to(y))C.经验回归直线=x+表示最接近y与x之间真实关系的一条直线D.|r|≤1,且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小[解析]经验回归直线是最能体现这组数据的变化趋势的直线,不一定经过样本数据中的点,故A不正确,C正确;经验回归直线一定经过样本中心点,故B正确;相关系数r满足|r|≤1,且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小,故D正确.11.某地建立农业科技图书馆,供农民免费借阅,收集了近5年借阅数据如表:年份20192020202120222023年份代码x12345年借阅量y(万册)根据上表,可得y关于x的经验回归方程为=x+,下列结论正确的有(AC)A.=B.借阅量的75%分位数为C.y与x的线性相关系数r>0D.2024年的借阅量一定不少于万册[解析]eq\x\to(x)=eq\f(1,5)×(1+2+3+4+5)=3,eq\x\to(y)=eq\f(1,5)×++++5.8)=,因为y关于x的经验回归方程为=x+,所以=×3+,解得=,故A正确;5×75%=,故借阅量的75%分位数为,故B不正确;因为0.24>0,所以y与x的线性相关系数r>0,故C正确;经验回归方程为=x+,当x=6时,=,故2024年的借阅量约为万册,故D错误.12.对于表中x,y之间的一组数据:x13678y12345甲、乙两位同学给出的拟合直线方程分别为①=eq\f(1,3)x+1和②=eq\f(1,2)x+eq\f(1,2).若通过分析得出②的拟合效果好,则下列分析理由正确的是(BCD)A.①的残差和大于②的残差和,所以②拟合效果更好B.①的残差平方和大于②的残差平方和,所以②拟合效果更好C.①的R2小于②的R2,所以②拟合效果更好D.残差图中直线②的残差点分布的水平带状区域比①的残差点分布的水平带状区域更窄,所以直线②拟合效果更好[解析]不可以根据残差和的大小来分析模型的拟合效果的好坏,故A错误;用=eq\f(1,3)x+1作为拟合直线时,所得y的实际值与y的估计值的差的平方和即残差平方和为:S1=eq\b\lc\(\rc\)(\a\vs4\al\co1(1-\f(4,3)))2+(2-2)2+(3-3)2+eq\b\lc\(\rc\)(\a\vs4\al\co1(4-\f(10,3)))2+eq\b\lc\(\rc\)(\a\vs4\al\co1(5-\f(11,3)))2=eq\f(7,3).用=eq\f(1,2)x+eq\f(1,2)作为拟合直线时,所得残差平方和为:S2=(1-1)2+(2-2)2+eq\b\lc\(\rc\)(\a\vs4\al\co1(3-\f(7,2)))2+(4-4)2+eq\b\lc\(\rc\)(\a\vs4\al\co1(5-\f(9,2)))2=eq\f(1,2),∴S2<S1,∴②的拟合效果更好,故B正确;①的R2=1-eq\f(\f(7,3),10)=eq\f(23,30),②的R2=1-eq\f(\f(1,2),10)=eq\f(19,20),∴①的R2小于②的R2,∴②拟合效果更好,故C正确;残差图中直线②的残差点分布的水平带状区域比①的残差点分布的水平带状区域更窄,∴直线②拟合效果更好,故D正确.三、填空题(本大题共4小题,每小题5分,共20分)13.某艺术馆为了研究学生性别和喜欢国画之间的联系,随机抽取80名学生进行调查(其中有男生50名,女生30名),并绘制等高堆积条形图(如图所示),则这80名学生中喜欢国画的人数为_58__.[解析]由等高堆积条形图可知,男生中喜欢国画的占80%,女生中喜欢国画的占60%,则这80名学生中喜欢国画的人数为50×80%+30×60%=58.14.假设关于某设备的使用年限x和所支出的维修费用y(万元)有如下的统计资料:x23456y若由资料可知y对于x呈线性相关关系,且经验回归方程为=+x,其中已知=,请估计使用年限为20年时,维修费用为___万元.[解析]由表中数据可知:eq\x\to(x)=eq\f(2+3+4+5+6,5)=4,eq\x\to(y)=++++,5)=5.又∵经验回归直线一定经过样本点中心(eq\x\to(x),eq\x\to(y)),∴5=+×4,∴=,∴经验回归方程为=x+0.08.故估计使用年限为20年时,维修费用为=×20+=24.68(万元).15.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)456789销量y(件)908483807568由表中数据,求得经验回归方程为=-4x+.若在这些样本点中任取一点,则它在经验回归直线左下方的概率为eq\f(1,3).[解析]样本点中心坐标为eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(13,2),80)),所以=80+4×eq\f(13,2)=106,所以经验回归方程为=-4x+106,经验证可知有2个点位于回归直线左下方,其概率为eq\f(2,6)=eq\f(1,3).16.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:喜爱打篮球不喜爱打篮球合计男生20a25女生b15c合计30d50则a+b+c+d=_60__;在犯错误的概率不超过___的前提下认为喜爱打篮球与性别有关.附:χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).αxα[解析]由列联表数据可求得a=5,b=10,c=25,d=20,所以a+b+c+d=60;χ2=eq\f(50×(20×15-5×10)2,25×25×30×20)≈,所以在犯错误的概率不超过的前提下认为“喜爱打篮球与性别有关”.四、解答题(本大题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤)17.(本小题满分10分)某种木材体积与树木的树龄之间有如下的对应关系:树龄2345678体积30344060556270(1)请作出这些数据的散点图;(2)你能由散点图发现木材体积与树木的树龄近似成什么关系吗?[解析](1)以横轴表示树木的树龄,纵轴表示树木的体积,可得相应的散点图如图所示:(2)由散点图发现木材体积随着树龄的增加而呈增加的趋势,且散点落在一条直线附近,所以木材的体积与树龄成相关关系且呈正相关.18.(本小题满分12分)某大型企业人力资源部为了研究企业员工的工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示.积极支持企业改革不太赞成企业改革总计工作积极544094工作一般326395总计86103189李明和张宇都对该题进行了独立性检验的分析,李明的结论是“在犯错误的概率不超过0.01的前提下认为企业员工的工作积极性和对待企业改革的态度有关系”;张宇的结论是“在犯错误的概率不超过的前提下认为企业员工的工作积极性和对待企业改革的态度有关系”.他们两人的结论正确吗?他们的结论为什么不一样?[解析]正确.由列联表中的数据,得χ2=eq\f(189×(54×63-40×32)2,94×95×86×103)≈10.759.10.,若以为临界值,则在犯错误的概率不超过的前提下认为企业员工的工作积极性和对待企业改革的态度有关系;若以为临界值,则在犯错误的概率不超过的前提下认为企业员工的工作积极性和对待企业改革的态度有关系.19.(本小题满分12分)某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如表所示:使用年限(单位:年)1234567失效费(单位:万元)(1)由表中数据可知,可用线性回归模型拟合y与x的关系.请用相关系数加以说明(精确到0.01);(2)求出y关于x的经验回归方程,并估算该种机械设备使用8年的失效费.参考公式:r=eq\f(\i\su(i=1,n,)(xi-\x\to(x))(yi-\x\to(y)),\r(\i\su(i=1,n,)(xi-\x\to(x))2)\r(\i\su(i=1,n,)(yi-\x\to(y))2)),=eq\f(\i\su(i=1,n,)(xi-\x\to(x))(yi-\x\to(y)),\i\su(i=1,n,)(xi-\x\to(x))2),=eq\x\to(y)-eq\x\to(x).参考数据:eq\i\su(i=1,7,)(xi-eq\x\to(x))(yi-eq\x\to(y))=14,eq\i\su(i=1,7,)(yi-eq\x\to(y))2=7.08.[解析](1)由表知:eq\x\to(x)=eq\f(1,7)×(1+2+3+4+5+6+7)=4,则eq\i\su(i=1,7,)(xi-eq\x\to(x))2=(-3)2+(-2)2+(-1)2+02+12+22+32=28,故r=eq\f(\i\su(i=1,n,)(xi-\x\to(x))(yi-\x\to(y)),\r(\i\su(i=1,n,)(xi-\x\to(x))2)\r(\i\su(i=1,n,)(yi-\x\to(y))2))=eq\f(14,\r(28×7.08))≈,所以r的值非常接近于1,即可用线性回归模型拟合y与x的关系;(2)由表知:eq\x\to(y)=eq\f(1,7)×++++++5.90)=,则=eq\f(\i\su(i=1,n,)(xi-\x\to(x))(yi-\x\to(y)),\i\su(i=1,n,)(xi-\x\to(x))2)=eq\f(14,28)=,=eq\x\to(y)-eq\x\to(x)=-×4=2.3.故所求经验回归方程为=x+2.3.令x=8,则=×8+=6.3(万元).所以估计该设备使用8年的失效费为万元.20.(本小题满分12分)某种产品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下对应数据:x24568y3040605070(1)画出散点图;(2)求经验回归方程;(3)试预测广告费支出为10万元时,销售额为多少?附:=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)·\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),=eq\x\to(y)-eq\x\to(x).参考数据:eq\i\su(i=1,5,x)eq\o\al(2,i)=145,eq\i\su(i=1,5,x)iyi=1380.[解析](1)根据表格中的5组数据,绘制散点图如图所示:(2)由表格数据可知:eq\x\to(x)=eq\f(1,5)(2+4+5+6+8)=5,eq\x\to(y)=eq\f(1,5)(30+40+60+50+70)=50,故=eq\f(\i\su(i=1,5,x)iyi-5\x\to(x)·\x\to(y),\i\su(i=1,5,x)\o\al(2,i)-5\x\to(x)2)=eq\f(1380-5×5×50,145-5×25)=,=eq\x\to(y)-eq\x\to(x)=50-×5=,故所求经验回归方程为=x+17.5.(3)由(2)知,=x+,令x=10,解得=82.5.故广告费支出为10万元时,销售额约为万元.21.(本小题满分12分)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不小于80件者为“生产能手”,请你利用已知条件画出2×2列联表,根据α=的独立性检验,能否认为生产能手与工人所在的年龄组有关联?参考数据及公式如下:αxαχ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))[解析](1)由已知得,样本中有25周岁以上(含25周岁)组工人60名,25周岁以下组工人40名.所以,样本中日平均生产件数不足60件的工人中,25周岁以上(含25周岁)组工人有60×=3(人),记为A1,A2,A3;25周岁以下组工人有40×=2(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是:(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=eq\f(7,10).(2)由题中频率分布直方图可知,在抽取的100名工人中,“25周岁以上(含25周岁)组”中的生产能手有60×=15(人),“25周岁以下组”中的生产能手有40×=15(人),据此可得2×2列联表如表:年龄分组生产能手非生产能手合计25周岁以上(含25周岁)组15456025周岁以下组152540合计3070100假设H0:生产能手与工人所在的年龄组无关.根据列联表中的数据,经计算得到χ2=eq\f(100×(15×25-15×45)2,60×40×30×70)≈=x.根据α=的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为生产能手与工人所在的年龄组无关.22.(本小题满分12分)某人计划于2023年7月购买一辆某品牌新能源汽车,他从当地该品牌销售网站了解到近五个月实际销量如表所示:月份月份编号t12345实际销量y(万辆)1(1)经分析,可用线性回归模型拟合当地该品牌新能源汽车实际销量y(万辆)与月份编号t之间的相关关系.请用最小二乘法求y关于t的线性经验回归方程:=t+,并预测2023年7月份当地该品牌新能源汽车的销量;(2)已知某地拟购买新能源汽车的消费群体十分庞大,某调研机构对其中的200名消费者的购车补贴金额的心理预期值进行了一个抽样调查,得到下表:补贴金额预期值区间(万元)[1,2)[2,3)[3,4)[4,5)[5,6)[6,7]频数206060302010将频

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论