第10章 第3课时 成对数据的统计分析-备战2025年高考数学一轮复习(解析版)_第1页
第10章 第3课时 成对数据的统计分析-备战2025年高考数学一轮复习(解析版)_第2页
第10章 第3课时 成对数据的统计分析-备战2025年高考数学一轮复习(解析版)_第3页
第10章 第3课时 成对数据的统计分析-备战2025年高考数学一轮复习(解析版)_第4页
第10章 第3课时 成对数据的统计分析-备战2025年高考数学一轮复习(解析版)_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3课时成对数据的统计分析[考试要求]1.了解样本相关系数的统计含义.2.理解一元线性回归模型和2×2列联表,会运用这些方法解决简单的实际问题.3.会利用统计知识进行数据分析.1.变量的相关关系两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系,即不确定性关系.2.相关关系的分类(1)按变量间的增减性分为正相关和负相关.①正相关:当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势;②负相关:当一个变量的值增加时,另一个变量的相应值呈现减小的趋势.(2)按变量间是否有线性特征分为线性相关和非线性相关(曲线相关).①线性相关:如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们称这两个变量线性相关;②非线性相关或曲线相关:如果两个变量具有相关性,但不是线性相关,我们称这两个变量非线性相关或曲线相关.3.相关关系的刻画(1)散点图:成对样本数据都可用直角坐标系中的点表示出来,由这些点组成的统计图,叫做散点图.(2)样本相关系数r的计算式r==.(3)样本相关系数r的性质①样本相关系数r的取值范围为[-1,1];②若r>0时,成对样本数据正相关;③若r<0时,成对样本数据负相关;④样本相关系数与相关程度当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.提醒:当两个变量的相关系数|r|=1时,两个变量呈函数关系.4.一元线性回归模型与最小二乘法(1)一元线性回归模型称Y=bx+a+e,Ee=0,De=σ2为Y关于x的一元线性回归模型.其中,Y称为因变量或响应变量,x称为自变量或解释变量,a称为截距参数,b称为斜率参数;e是Y与bx+a(2)最小二乘法将y=bx+a称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,这种求经验回归方程的方法叫做最小二乘法,求得的b,a叫做b,a的最小二乘估计,其中b=,a=y-bx.5.刻画回归效果的方式(1)残差图法在残差图中,残差点比较均匀地落在以横轴为对称轴的水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高.(2)残差平方和法残差平方和为,残差平方和越小,模型拟合效果越好.(3)决定系数法R2=1-.R2的值越趋近于1,模型的拟合效果越好.6.列联表与独立性检验(1)分类变量X,Y的2×2列联表:XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d则χ2=nad−bc(2)利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.(3)χ2独立性检验中几个常用的小概率值和相应的临界值.α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828[常用结论]经验回归方程必过样本点的中心(x,一、易错易混辨析(正确的打“√”,错误的打“×”)(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系. ()(2)样本相关系数的绝对值越接近1,成对样本数据的线性相关程度越强. ()(3)若事件X,Y关系越密切,则由观测数据计算得到的χ2的观测值越小. ()(4)经验回归方程y=bx+a中,若a<0,则变量x和y负相关. ()[答案](1)√(2)√(3)×(4)×二、教材经典衍生1.(人教A版选择性必修第三册P103习题8.1T1改编)下列四个散点图中,变量x与y之间具有负的线性相关关系的是()ABCDD[观察散点图可知,只有D选项的散点图表示的是变量x与y之间具有负的线性相关关系.]2.(人教A版选择性必修第三册P103练习T3改编)在一次试验中,测得(x,y)的四组值分别为(1,2),(2,0),(4,-4),(-1,6),则y与x的相关系数为()A.12B.-1C.0D.-B[∵测得(x,y)的四组值分别为(1,2),(2,0),(4,-4),(-1,6),∴x=1.5,r=−20−4×1.5×1故选B.]3.(人教A版选择性必修第三册P113练习T2改编)从某学校随机选取8名女大学生,关于其身高x(单位:cm)和体重y(单位:kg)的经验回归方程为y=0.849x-85.712,则身高172cm的女大学生的体重约为________kg.60.316[当x=172时,y=0.849×172-85.712=60.316.]4.(人教A版选择性必修第三册P133例4改编)为了调查患肺癌是否与吸烟有关,调查了100名50岁以下的人,调查结果如下表:吸烟肺癌合计肺癌患者非肺癌患者吸烟者20m40不吸烟者n5560合计2575100根据列联表数据,求得χ2=________(保留3位有效数字),那么,在犯错误的概率不超过0.001的前提下认为患肺癌与吸烟有关.附:χ2=nad−bcα0.0500.0100.001xα3.8416.63510.82822.2[由20+m=40,得m=20.由20+n=25,得n=5.故χ2=100×20×55−20×5240×60×25×75≈22.2>10.828=x0.0所以在犯错误的概率不超过0.001的前提下认为患肺癌与吸烟有关.]考点一成对数据的相关性[典例1](1)(2023·天津高考)调查某种群花萼长度和花瓣长度,所得数据如图所示.其中相关系数r=0.8245,下列说法正确的是()A.花瓣长度和花萼长度没有相关性B.花瓣长度和花萼长度呈现负相关C.花瓣长度和花萼长度呈现正相关D.若从样本中抽取一部分,则这部分的相关系数一定是0.8245(2)(多选)(2023·广东湛江一模)某服装生产商为了解青少年的身高和体重的关系,在15岁的男生中随机抽测了10人的身高和体重,数据如下表所示:编号12345678910身高/cm165168170172173174175177179182体重/kg55896165677075757880由表中数据制作成如下所示的散点图:由最小二乘法计算得到经验回归直线l1的方程为y=b1x+a1,相关系数为r1,决定系数为R12;经过残差分析确定(168,89)为离群点(对应残差过大),把它去掉后,再用剩下的9组数据计算得到经验回归直线l2的方程为y=b2x+a2,相关系数为r2,决定系数为A.a1>a2 B.b1>b2C.r1<r2 D.R12(1)C(2)AC[(1)∵相关系数r=0.8245,且散点图呈左下角到右上角的带状分布,∴花瓣长度和花萼长度呈正相关.若从样本中抽取一部分,则这部分的相关系数不一定是0.8245,故选C.(2)身高的平均数为165+168+170+172+173+174+175+177+179+18210=173.5,因为离群点(168,89)的横坐标168小于平均值173.5,纵坐标89相对过大,所以去掉离群点后经验回归直线的截距变小而斜率变大,所以a1>a2,b1<b2,所以A正确,B错误;去掉离群点后成对样本数据的线性相关程度更强,拟合效果会更好,所以r判定两个变量正、负相关的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:r>0时,正相关;r<0时,负相关.(3)线性经验回归方程中:b>0时,正相关;b<0时,负相关.[跟进训练]1.(1)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-12xA.-1 B.0C.-12 (2)已知一组成对数据(18,24),(13,34),(10,38),(-1,m)的经验回归方程为y=-2x+59.5,则该组数据的相关系数r=________(精确到0.001).(1)A(2)-0.998[(1)所有样本点均在同一条斜率为负数的直线上,则样本相关系数最小,为-1.(2)由条件可得,x=18+13+10−14y=24+34+38+m4=96+m(x,y)一定过经验回归方程y=-2x+59.5,代入解得m=62,y=96+624xiyi=18×24+13×34+10×38-1xi2=182+132+102+(-1)2yi2=242+342+382+622=1192−4×10×≈-0.998.]【教师备选资源】1.(多选)对两组数据进行统计后得到的散点图如图所示,关于其线性相关系数的结论正确的是()A.r1<0 B.r2>1C.r1+r2>0 D.r1>AC[由散点图可知,线性相关系数r1的图象表示y与x成负相关,故-1<r1<0,故A正确;线性相关系数r2的图象表示y与x正相关,故0<r2<1,故B错误;因为线性相关系数r2的点较线性相关系数r1的点密集,故r2>r1,故r1+r2.如图是某地区2001年至2021年环境保护建设投资额(单位:万元)的折线图.根据该折线图判断,下列结论正确的是()A.为预测该地2024年的环境保护建设投资额,应用2001年至2021年的数据建立回归模型更可靠B.为预测该地2024年的环境保护建设投资额,应用2010年至2021年的数据建立回归模型更可靠C.投资额与年份负相关D.投资额与年份的相关系数r<0B[因为2009年之前与2010年之后投资额变化较大,故为预测该地2024年的环境保护建设投资额,应用2010年至2021年的数据建立回归模型更可靠,所以A错误,B正确;随年份的增长,投资额总体上在增长,所以投资额与年份正相关,r>0,故CD错误.故选B.]3.如图是相关变量x,y的散点图,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到经验回归方程y=b1x+a1,样本相关系数为r1;方案二:剔除点(10,21),根据剩下的数据得到经验回归方程y=b2x+a2,样本相关系数为r2.则()A.0<r1<r2<1 B.0<r2<r1<1C.-1<r1<r2<0 D.-1<r2<r1<0D[根据相关变量x,y的散点图知,变量x,y具有负线性相关关系,且点(10,21)是离群值;方案一中,没剔除离群值,线性相关性弱些;方案二中,剔除离群值,线性相关性强些;所以样本相关系数-1<r2<r1<0.]考点二回归模型一元线性回归模型[典例2](2023·河北唐山三模)据统计,某城市居民年收入(所有居民在一年内收入的总和,单位:亿元)与某类商品销售额(单位:亿元)的10年数据如表所示:第n年12345678910居民年收入x32.231.132.935.737.138.039.043.044.646.0商品销售额y25.030.034.037.039.041.042.044.048.051.0依据表格数据,得到下面一些统计量的值.i=1i=1i=1i=1i=1379.6391246.904568.9m(1)根据表中数据,得到样本相关系数r≈0.95.以此推断,y与x的线性相关程度是否很强?(2)根据统计量的值与样本相关系数r≈0.95,建立y关于x的经验回归方程(系数精确到0.01);(3)根据(2)的经验回归方程,计算第1个样本点(32.2,25.0)对应的残差(精确到0.01);并判断若剔除这个样本点再进行回归分析,b的值将变大还是变小(不必说明理由,直接判断即可).附:样本(xi,yi)(i=1,2,…,n)的相关系数r=,2.304≈1.518,b=,a=y-bx[解](1)根据样本相关系数r≈0.95,可以推断线性相关程度很强.所以b=r2.304≈0.95×1.518≈1.44,又因为x=37.96,所以a=y-b所以y与x的经验回归方程为y=1.44x-15.56.(3)第一个样本点(32.2,25.0)的残差为:25.0-(1.44×32.2-15.56)=-5.808≈-5.81,由于该点在回归直线的右下方,故将其剔除后,b的值将变大.非线性回归模型[典例3](2023·广东广州二模)一企业生产某种产品,通过加大技术创新投入降低了每件产品成本,为了调查年技术创新投入x(单位:千万元)对每件产品成本y(单位:元)的影响,对近10年的年技术创新投入xi和每件产品成本yi(i=1,2,3,…,10)的数据进行分析,得到如图所示的散点图,并计算得:x=6.8,y=70,=350.(1)根据散点图可知,可用函数模型y=bx+a拟合y与x的关系,试建立y关于x(2)已知该产品的年销售额m(单位:千万元)与每件产品成本y(单位:元)的关系为m=-y2500+2y25(注:年利润=年销售额-年投入成本)参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归方程v=α+βu的斜率和截距的最小二乘估计公式分别为β=,α=v-βu.[解](1)令u=1x,则y关于u的经验回归方程为y=α=βu由题意可得β==350−2101.6−0.9=200,α=y-βu=70-200×所以y关于x的经验回归方程为y=10+200x(2)由y=10+200x可得x=200年利润M=m-x-10=-y2500+2y25+200y−10+100-200y−10当y=20时,年利润M取得最大值,此时x=200y−10=200所以当年技术创新投入为20千万元时,年利润M的预报值取最大值.回归分析问题的类型及解题方法(1)求经验回归方程①根据散点图判断两变量是否线性相关,如不是,应通过换元构造线性相关.②利用公式,求出回归系数b.③利用经验回归方程过样本点的中心求系数a.(2)利用经验回归方程进行预测,把经验回归方程看作一次函数,求函数值.(3)利用经验回归方程判断正、负相关,决定正相关还是负相关的是系数b.(4)经验回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.提醒:非线性处理策略要通过换元、取对数等手段把非线性问题转化为线性问题.[跟进训练]2.某研究所为了研究某种昆虫的产卵数y(单位:个)与温度x(单位:℃)之间的关系,现将收集到的温度xi和一组昆虫的产卵数yi(i=1,2,…,6)的6组观测数据作了初步处理,得到如图的散点图及一些统计数据.经计算得到以下数据:i=1(1)若用线性回归模型来拟合数据的变化关系,求y关于x的经验回归方程y=bx+a(结果精确到0.1);(2)若用非线性回归模型来拟合数据的变化关系,求得y关于x的经验回归方程y=0.06e0.2303x,且决定系数为R2=0.9672.①试与(1)中的回归模型相比,用R2说明哪种模型的拟合效果更好;②用拟合效果好的模型预测温度为35℃时该组昆虫的产卵数(结果四舍五入取整数).附参考公式:对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其经验回归方程y=bx+a截距和斜率的最小二乘估计公式分别为:b=,a=y−bx参考数据:e8.0605≈3167.[解](1)由题意可知b==55784≈6.6,a=y-bx∴y关于x的经验回归方程是y=6.6x-138.6.(2)①用指数回归模型拟合y与x的关系,决定系数R2=0.9672,线性回归模型拟合y与x的关系,决定系数R2=1-=1-236.643930≈0.9398,且0.9398<0.9672,∴用y=0.06e0.2303x比y=6.6x-138.6拟合效果更好.②y=0.06e0.2303x中,令x=35,则y=0.06e0.2303×35=0.06e8.0605≈0.06×3167≈190(个),故预测温度为35℃时该组昆虫产卵数约为190个.考点三独立性检验[典例4](2023·全国甲卷改编)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下:对照组的小白鼠体重的增加量从小到大排序为15.218.820.221.322.523.225.826.527.530.132.634.334.835.635.635.836.237.340.543.2试验组的小白鼠体重的增加量从小到大排序为7.89.211.412.413.215.516.518.018.819.219.820.221.622.823.623.925.128.232.336.5(1)计算试验组的样本平均数;(2)①求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数,完成如下列联表;组别小白鼠体重的增加量合计<m≥m对照组试验组合计②根据①中的列联表,依据小概率值α=0.05的独立性检验,能否以此推断小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?附:χ2=nad−bcα0.1000.0500.010xα2.7063.8416.635[解](1)根据题意,计算试验组样本平均数为x=120×(7.8+9.2+11.4+12.4+13.2+15.5+16.5+18.0+18.8+19.2+19.8+20.2+21.6+22.8+23.6+23.9+25.1+28.2+32.3+36.5)=1(2)①由题意知,这40只小白鼠体重的增加量的中位数是将两组数据合在一起,从小到大排列后第20位与第21位数据的平均数,因为第20位数据为23.2,第21位数据为23.6,所以这组数据的中位数是m=12×(23.2+23.6)=2填写列联表如下:组别小白鼠体重的增加量合计<m≥m对照组61420试验组14620合计202040②零假设为H0:小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量无差异.根据列联表中数据,得χ2=40×6×6−14×14220×20×20×20=6.4>3.841=x所以依据小概率值α=0.05的独立性检验,可以认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异.独立性检验的一般步骤(1)根据样本数据完成2×2列联表.(2)根据公式χ2=nad−bc(3)比较χ2与临界值的大小关系,作统计推断.[跟进训练]3.(2020·新高考Ⅰ卷改编)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:PM2.5浓度SO2浓度[0,50](50,150](150,475][0,35]32184(35,75]6812(75,115]3710(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;(2)根据所给数据,完成下面的2×2列联表:PM2.5浓度SO2浓度[0,150](150,475][0,75](75,115](3)根据(2)中的列联表,依据小概率值α=0.01的独立性检验,能否推断该市一天空气中PM2.5浓度与SO2浓度有关?附:χ2=nad−bcα0.0500.0100.001xα3.8416.63510.828[解](1)根据抽查数据,该市100天空气中的PM2.5浓度不超过75,且SO2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150的概率的估计值为64100=(2)根据抽查数据,可得2×2列联表:PM2.5浓度SO2浓度[0,150](150,475][0,75]6416(75,115]1010(3)零假设为H0:该市一天空气中PM2.5浓度与SO2浓度无关,则χ2=100×64×10−16×10280×20×74×26≈由于7.484>6.635=x0.01,所以依据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为该市一天空气中PM2.5浓度与SO2浓度有关.课时分层作业(七十一)成对数据的统计分析一、单项选择题1.根据分类变量X与Y的成对样本数据,计算得到χ2=6.147.依据α=0.01的独立性检验x0.0A.变量x与y不独立B.变量x与y不独立,这个结论犯错误的概率不超过0.01C.变量x与y独立D.变量x与y独立,这个结论犯错误的概率不超过0.01C[按照独立性检验的知识及比对的参数值,当χ2=6.147,我们可以下结论变量x与y独立.故排除选项A,B;依据α=0.01的独立性检验(x0.01=6.635),6.147<6.635,所以我们不能得到“变量x与y独立,这个结论犯错误的概率不超过0.01”这个结论.故C正确,D错误.故选C.]2.(2024·浙江湖州模拟)研究变量x,y得到一组样本数据,进行回归分析,以下说法中错误的是()A.若变量x和y之间的相关系数为r=-0.992,则变量x和y之间的负相关很强B.用决定系数R2来比较两个模型拟合效果,R2越大,表示残差平方和越小,即模型的拟合效果越好C.在经验回归方程y=-2x+0.8中,当解释变量x每增加1个单位时,响应变量y平均减少2个单位D.经验回归直线y=bx+a至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个D[若变量x和y之间的相关系数为r=-0.992,则变量x和y之间的负相关很强,A正确;用决定系数R2来比较两个模型拟合效果,R2越大,表示残差平方和越小,即模型的拟合效果越好,B正确;在经验回归方程y=-2x+0.8中,当解释变量x每增加1个单位时,响应变量y平均减少2个单位,C正确;经验回归直线y=bx+a必过(x,y)3.已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关C[因为y=-0.1x+1的斜率小于0,故x与y负相关.因为y与z正相关,可设z=by+a,b>0,则z=by+a=-0.1bx+b+a,故x与z负相关.故选C.]4.(2023·广东梅州二模)云计算是信息技术发展的集中体现,近年来,我国云计算市场规模持续增长.已知某科技公司2018年至2022年云计算市场规模数据,且市场规模y与年份代码x的关系可以用模型y=c1ec2x(其中e为自然对数的底数)拟合,设z=lny,得到数据统计表如下:年份2018年2019年2020年2021年2022年年份代码x12345云计算市场规模y/千万元7.4112036.666.7z=lny22.433.64由上表可得经验回归方程z=0.52x+a,则2025年该科技公司云计算市场规模y的估计值为()A.e5.08 B.e5.6C.e6.12 D.e6.5B[因为x=3,所以a=z-0.52x=3-3即经验回归方程z=0.52x+1.44,当x=8时,z=0.52×8+1.44=5.6,所以y=ez=e5.6,即2025年该科技公司云计算市场规模y的估计值为e5.6.故选B.]5.(2023·河北衡水一模)某新能源汽车生产公司,为了研究某生产环节中两个变量x,y之间的相关关系,统计样本数据得到如下表格:x2023252730y22.4334.6由表格中的数据可以得到y与x的经验回归方程为y=14x+aA.(30,4.6) B.(27,3)C.(25,3) D.(23,2.4)C[由表格数据知:x=20+23+25+27+305∴a=y−14x=3-∴经验回归方程为y=14x-13对于A,残差的绝对值为4.6−14对于B,残差的绝对值为3−14×27−对于C,残差的绝对值为3−1对于D,残差的绝对值为2.4−14∴残差绝对值最小的样本数据是(25,3).故选C.]6.(2023·山东菏泽二模)足球是一项大众喜爱的运动,为了解喜爱足球是否与性别有关,随机抽取了若干人进行调查,抽取女性人数是男性的2倍,男性喜爱足球的人数占男性人数的56,女性喜爱足球的人数占女性人数的13,若本次调查得出“在犯错误的概率不超过0.005的前提下认为喜爱足球与性别有关α0.100.050.010.0050.001xα2.7063.8416.6357.87910.828A.10人 B.11人C.12人 D.13人C[设被调查的男性为x人,则女性为2x人,依据题意可得列联表如下表:足球性别合计男性女性喜爱足球5x2x3x不喜爱足球x4x3x合计x2x3xχ2=3x5x6·4x3−2x3·x623x2·3x2·x解得x≥11.8185,又因为上述列联表中的所有数字均为整数,故x的最小值为12.故选C.]二、多项选择题7.(2023·湖南长沙一模)自然环境中,大气压受到各种因素的影响,如温度、湿度、风速和海拔等方面的改变,都将导致大气压发生相应的变化,其中以海拔的影响最为显著.如图是根据一组观测数据得到海拔6~15km的大气压强散点图,根据一元线性回归模型得到经验回归方程为y1=-4.0x+68.5,决定系数为R12=0.99;根据非线性回归模型得到经验回归方程为y2=132.9e-0.163x,决定系数为RA.由经验回归散点图可知,大气压强与海拔高度负相关B.由经验回归方程y1=-4.0x+68.5可知,海拔每升高1km,大气压强必定降低4.0kPaC.由经验回归方程y1=-4.0x+68.5可知,样本点(11,22.6)的残差为-1.9D.对比两个回归模型,结合实际情况,经验回归方程y2=132.9e-0.163x的预报效果更好ACD[由图象知,海拔高度越高,大气压强越低,所以大气压强与海拔高度负相关,A正确;由经验回归直线得到的数据为估计值,而非精确值,B错误;当x=11时,y1=-4.0×11+68.5=24.5,又由散点图知观测值为22.6,所以样本点(11,22.6)的残差为22.6-24.5=-1.9,C正确;随着海拔高度的增加,大气压强越来越小,但不可能为负数,因此经验回归方程y2=132.9e-0.163x的预报效果更好,D正确.故选ACD.]8.(2024·江苏泰州开学考试)“天宫课堂”是为发挥中国空间站的综合效益,推出的首个太空科普教育品牌.为了解学生对“天宫课堂”的喜爱程度,某学校从全校学生中随机抽取200名学生进行问卷调查,得到以下数据,则()性别天宫课堂喜欢天宫课堂不喜欢天宫课堂男生8020女生7030参考公式及数据:①χ2=nad−bc2a+bc+da+cb+d,n=a+②当α=0.05时,xα=3.841.A.从这200名学生中任选1人,已知选到的是男生,则他喜欢天宫课堂的概率为2B.用样本的频率估计概率,从全校学生中任选3人,恰有2人不喜欢天宫课堂的概率为9C.根据小概率值α=0.05的独立性检验,认为喜欢天宫课堂与性别没有关联D.对抽取的喜欢天宫课堂的学生进行天文知识测试,男生的平均成绩为80,女生的平均成绩为90,则参加测试的学生成绩的均值为85BC[从这200名学生中任选1人,已知选到的是男生,则他喜欢天宫课堂的概率P=8080+20=4样本中喜欢天宫课堂的频率为80+70200=3恰有2人不喜欢天宫课堂的概率P1=C321−因为χ2=200×80×30−70×202100×100×150×50≈2.667<3.8抽取的喜欢天宫课堂的学生男、女生人数分别为80,70,又男生的平均成绩为80,女生的平均成绩为90,所以参加测试的学生成绩的均值为80×80+70×9080+70=254三、填空题9.某工厂为研究某种产品产量x(单位:t)与所需某种原材料y(单位:t)的相关性,在生产过程中收集4组对应数据(x,y)如下表所示:x3456y2.534m根据表中数据,得出y关于x的经验回归方程为y=0.7x+a.据此计算出在样本点(4,3)处的残差为-0.15,则a的值为________,表中m的值为________.0.354.5[由在样本点(4,3)处的残差为-0.15,可得当x=4时,y=3.15,即3.15=0.7×4+a,解得a=0.35.又x=14(3+4+5+6)=4.5,y=14(2.5+3+4+m)=14(9.5+m),经验回归直线过点x,y,所以14(9.5+m10.如图是调查某学校高一年级男、女学生是否喜欢徒步运动而得到的等高堆积条形图,阴影部分表示喜欢徒步的频率.已知该年级男生500人、女生400人(假设所有学生都参加了调查),现从所有喜欢徒步的学生中按分层随机抽样的方法抽取23人,则抽取的男生人数为________.15[根据等高堆积条形图可知:喜欢徒步的男生人数为0.6×500=300,喜欢徒步的女生人数为0.4×400=160,所以喜欢徒步的总人数为300+160=460,按分层随机抽样的方法抽取23人,则抽取的男生人数为300460×23=15.四、解答题11.(2022·全国甲卷改编)甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:运营公司班次数准点未准点A24020B21030(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)依据小概率值α=0.1的独立性检验,能否以此推断甲、乙两城之间的长途客车是否准点与客车所属公司有关?附:χ2=nad−bcα0.1000.0500.010xα2.7063.8416.635[解](1)根据表中数据,A家公司共有班次260次,准点班次有240次,设A家公司长途客车准点事件为M,则P(M)=240260=12B家公司共有班次240次,准点班次有210次,设B家公司长途客车准点事件为N,则P(N)=210240=7所以A家公司长途客车准点的概率为1213B家公司长途客车准点的概率为78(2)补充列联表如下.运营公司班次数合计准点未准点A24020260B21030240合计45050500零假设为H0:甲、乙两城之间的长途客车是否准点与客车所属公司无关.根据2×2列联表,可得χ2=nad−bc2a+bc+da+cb+d=500×240×30−210×202根据小概率值α=0.1的独立性检验,我们推断H0不成立,即认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.12.(2023·福建厦门二模)移动物联网广泛应用于生产制造、公共服务、个人消费等领域.截至2022年底,我国移动物联网连接数达18.45亿户,成为全球主要经济体中首个实现“物超人”的国家.如图所示是2018-2022年移动物联网连接数w与年份代码t的散点图,其中年份2018-2022对应的t分别为1~5.(1)根据散点图推断两个变量是否线性相关.计算样本相关系数(精确到0.01),并推断它们的相关程度;(2)①假设变量x与变量Y的n对观测数据为(x1,y1),(x2,y2),…,(xn,yn),两个变量满足一元线性回归模型Y=bx+e,Ee=0,De=σ2,(随机误差ei=y②令变量x=t-t,y=w-w,则变量x与变量Y满足一元线性回归模型Y=bx+e,Ee=0,De=σ附:样本相关系数r=参考数据:[解](1)由散点图可以看出样本点都集中在一条直线附近,由此推断两个变量线性相关.因为t=15=(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2=10,所以r==27.210×76.9=27.2769≈所以这两个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论