高考数学第一轮复习复习第3节 成对数据的统计分析(讲义)_第1页
高考数学第一轮复习复习第3节 成对数据的统计分析(讲义)_第2页
高考数学第一轮复习复习第3节 成对数据的统计分析(讲义)_第3页
高考数学第一轮复习复习第3节 成对数据的统计分析(讲义)_第4页
高考数学第一轮复习复习第3节 成对数据的统计分析(讲义)_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3节成对数据的统计分析[课程标准要求]1.会作两个相关变量的数据的散点图,能根据最小二乘原理建立经验回归方程并进行预测,了解样本相关系数的统计含义和残差分析.2.了解独立性检验的基本思想,2×2列联表的统计意义,能对两个分类变量进行独立性检验.1.成对数据的统计相关性(1)变量的相关关系两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.(2)散点图每一个序号下的成对样本数据都可用直角坐标系中的点表示出来,由这些点组成了统计图.我们把这样的统计图叫做散点图.(3)正相关与负相关从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量负相关.(4)线性相关与曲线相关一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.(5)样本相关系数r=∑=∑i我们称r为变量x和变量y的样本相关系数.样本相关系数r的取值范围为[-1,1].当r>0时,称成对样本数据正相关,这时,当其中一个数据的值变小时,另一个数据的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大.当r<0时,称成对样本数据负相关,这时,当其中一个数据的值变小时,另一个数据的值通常会变大;当其中一个数据的值变大时,另一个数据的值通常会变小.样本相关系数r的绝对值大小可以反映成对样本数据之间线性相关的程度:当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.2.一元线性回归模型及其应用(1)一元线性回归模型我们称式子Y=bx+a+e,E(e)=0,(2)一元线性回归模型参数的最小二乘估计当a,b的取值为b^Q=∑i=1n(yi-bxi-a)2达到最小.此时,我们将y^=b^x+(3)残差分析对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的y^称为预测值,观测值减去预测值称为残差如果在残差的散点图中,残差比较均匀地分布在横轴两边,说明残差比较符合一元线性回归模型的假定,是均值为0、方差为σ2的随机变量的观测值.(4)决定系数R2及其意义我们也可以用决定系数R2=1-∑i=1n(yi-y^i)2∑i=1n(3.分类变量与列联表(1)我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.(2)人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存.这种形式的数据统计表称为2×2列联表,关于分类变量X和Y的抽样数据的2×2列联表如表所示,XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d4.独立性检验(1)独立性检验的概念利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.(2)独立性检验的计算公式χ2=n((3)独立性检验基于小概率值α的检验规则当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.(4)χ2独立性检验中常用的小概率值和相应的临界值.α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828(1)独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.(2)根据χ2的值可以判断两个分类变量有关的可信程度,若χ2越大,则两分类变量有关的把握越大.1.通常|r|大于0.75时,认为两个变量有很强的线性相关性.2.经验回归直线一定过点(x,y).3.应用独立性检验应首先提出零假设H0:X和Y相互独立.1.一组样本数据:(1,y1),(2,y2),(3,y3),(4,y4),(m,y5),由最小二乘法求得经验回归方程为y^=5x-7,若y1+y2+y3+y4+y5A.5 B.6 C.7 D.8解析:依题意,x=2+m5,y因此,9=5×(2+m5解得m=6,所以实数m的值为6.2.(多选题)给出以下四个说法,其中正确的是(BD)A.由样本数据得到经验回归直线y^=b^x+a^至少经过点(x1,y1),(x2,y2),…,(xnB.在回归分析中,用决定系数R2来比较两个模型拟合效果,R2越大,表示残差平方和越小,即模型的拟合效果越好C.在经验回归方程y^D.若变量y和x之间的样本相关系数r=-0.9872,则变量y和x之间的线性相关程度很强解析:经验回归直线y^=b^x+a^经过点(x,y),不一定经过样本点,故A不正确;用决定系数R2来比较两个模型的拟合效果,R23.(2022·江苏南通模拟)某市卫健委用模型y=ln(kx+b)+1分析2022年4月份感染某病毒的人数,令z=ey后得到的经验回归方程为z^A.1 B.e-1 C.e D.3e解析:z^=ey=eln(kx+b)+14.(2022·江西南昌一模)根据分类变量X与Y的观察数据,计算得到χ2=2.974,依据下表给出的χ2独立性检验中的小概率值和相应的临界值,作出下列判断,正确的是(D)α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828A.在犯错概率不超过5%的条件下,认为变量X与Y无关B.在犯错概率不超过5%的条件下,认为变量X与Y有关C.在犯错概率不超过10%的条件下,认为变量X与Y无关D.在犯错概率不超过10%的条件下,认为变量X与Y有关解析:因为χ2=2.974>2.706=x0.1,所以在犯错误的概率不超过10%的条件下,认为变量X与Y有关.成对数据的统计相关性的判断1.(多选题)(2022·山东临沂二模)对两组数据进行统计后得到的散点图如图所示,关于其样本相关系数的结论正确的是(AC)A.r1<0 B.r2>1C.r1+r2>0 D.|r1|>|r2|解析:由散点图可知,样本相关系数r1的图象表示y与x负相关,故-1<r1<0,故A正确;样本相关系数r2的图象表示y与x正相关,故1>r2>0,故B错误;因为样本相关系数r2的点较样本相关系数r1的点密集,故|r2|>|r1|,故r1+r2>0,故C正确,D错误.2.某商家今年上半年各月的人均销售额(单位:千元)与利润率统计数据如表所示.月份123456人均销售额658347利润率/%12.610.418.53.08.116.3根据表中数据,下列说法正确的是(A)A.利润率与人均销售额呈现正相关关系B.利润率与人均销售额呈现负相关关系C.利润率与人均销售额成正比例函数关系D.利润率与人均销售额成反比例函数关系解析:画出利润率与人均销售额的散点图如图所示.由图可知利润率与人均销售额呈现正相关关系.3.变量X与Y相应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的样本相关系数,r2表示变量V与U之间的样本相关系数,则(C)A.r2<r1<0 B.0<r2<r1C.r2<0<r1 D.r2=r1解析:对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关,即r1>0;对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r2<0.判断线性相关关系中正相关与负相关的三种方法(1)散点图法:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数法:当r>0时,成对样本数据正相关,当r<0时,成对样本数据负相关.(3)经验回归方程法:当b^>0时,正相关;当b独立性检验[例1]甲、乙两城之间的长途客车均由A和B两家公司运营.为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:准点班次数未准点班次数A24020B21030(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)依据小概率值α=0.100的独立性检验,认为甲、乙两城之间的长途客车是否准点与客车的所属公司有关?附:χ2=n(α0.1000.0500.010xα2.7063.8416.635解:(1)由题意可得A公司甲、乙两城之间的长途客车准点的概率为240240+20=12B公司甲、乙两城之间的长途客车准点的概率为210210+30=7(2)零假设为H0:甲、乙两城之间的长途客车是否准点与客车的所属公司无关,χ2=500×(240×30-根据小概率值α=0.100的独立性检验,我们推断H0不成立,即认为甲、乙两城之间的长途客车是否准点与客车的所属公司有关.独立性检验的一般步骤(1)根据样本数据制成2×2列联表.(2)根据公式χ2=n((3)比较χ2与临界值的大小关系,作统计推断.[针对训练]甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如表所示.机床产品质量合计一级品二级品甲15050200乙12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)依据小概率值α=0.01的独立性检验,能否以此推断甲机床的产品质量与乙机床的产品质量有差异?解:(1)甲机床生产的产品中一级品的频率是150200=0.75,乙机床生产的产品中一级品的频率是120(2)零假设为H0:甲机床的产品质量与乙机床的产品质量无差异.根据2×2列联表,可得χ2=400×≈10.256>6.635=x0.01.根据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为甲机床的产品质量与乙机床的产品质量有差异.一元线性回归模型及残差分析线性回归分析[例2]为促进新能源汽车的推广,某市逐渐加大充电基础设施的建设,该市统计了近五年新能源汽车充电站的数量(单位:个),得到表格如表所示.年份编号x12345年份20172018201920202021新能源汽车充电站数量y/个37104147196226(1)已知可用线性回归模型拟合y与x的关系,请用样本相关系数加以说明;(2)求y关于x的经验回归方程,并预测2025年该市新能源汽车充电站的数量.参考数据:∑i=15yi=710,∑i=1∑i=15参考公式:样本相关系数r=∑i经验回归方程y^=b^x+a^中斜率和截距的最小二乘估计公式分别为ba^=y-b解:(1)由题表中数据可得,x=1+2+3+4+55=3,y=1∑i=15(xi-x)2=(-2)2+(-1)2+0+12+22=10,∑i=15(xi-x)(yi-y)=∑i=15xiyi-5xy则r≈4703因为y与x的样本相关系数近似为0.99,接近1,说明y与x的线性相关程度相当高,所以可以用线性回归模型拟合y与x的关系.(2)由(1)可得b^=∑i=1所以a^=y-b^x=142-47×3=1,所以所求的经验回归方程为y^=47x+1,将2025年对应的年份编号x=9代入经验回归方程得(1)经验回归方程中系数的两种求法①公式法:利用公式,求出b^,a②待定系数法:利用回归直线过(x,y)求系数.(2)回归分析的两种策略①利用经验回归方程进行预测:把经验回归方程看作一次函数,求函数值.②利用经验回归方程判断正、负相关:决定正相关还是负相关的是回归系数b^非线性回归分析[例3]某电影院统计了某部电影上映高峰后连续10场的观众人数,其中每场观众人数y(单位:百人)与场次x的统计数据如表所示,x12345y2.7721.921.361.12x678910y1.090.740.680.620.55通过散点图可以发现y与x之间具有相关性,且满足关系式y=aebx,设ω=lny.(1)利用表格中的前8组数据求样本相关系数r,并判断是否有99%的把握认为x与ω之间具有线性相关关系(当样本相关系数满足|r|>0.789时,则有99%的把握认为两个变量具有线性相关关系);(2)利用x与ω的相关性及表格中的前8组数据求出y与x之间的经验回归方程(结果保留两位小数).附:42≈6.48,6≈2.45,1.70≈1.30,e1.17≈3.22.前8组数据的相关量及公式:∑i=18xi=36,∑i=18yi=11.68,∑i=18ωi≈2.18,∑i=18(xi-x)2=42,∑i=18(yi-y)2≈3.61,∑i=18(ωi-ω)2≈1.70,∑i=18(xi-x)(yi-y)=-11.83,∑i=1r=∑i解:(1)因为r=∑i=18所以有99%的把握认为x与ω之间具有线性相关关系.(2)因为y=aebx,所以lny=lna+bx,b^=∑i=1a^=ω-b所以ω^=-0.20x+1.17=lny所以y^=e-0.20x+1.17≈3.22e-0.20x求非线性经验回归方程的步骤(1)确定变量,作出散点图.(2)根据散点图,选择恰当的拟合函数.(3)变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出经验回归方程.(4)分析拟合效果,通过计算决定系数或画残差图来判断拟合效果.(5)根据相应的变换,写出非线性经验回归方程.残差分析与决定系数[例4]现代物流成为继劳动力、自然资源外影响企业生产成本及利润的重要因素.某企业去年前八个月的物流成本和企业利润的数据(单位:万元)如表所示,月份12345678物流成本x8383.58086.58984.57986.5利润y114116106122132114m132残差e^i=yi0.20.61.8-3-1-4.6-1根据最小二乘法公式求得经验回归方程为y^(1)求m的值,并利用已知的经验回归方程求出8月份对应的残差值e^(2)请先求出经验回归模型y^=3.2x-151.8的决定系数R2(精确到0.0001);若根据非线性模型y=267.76lnx-1069.2求得解释变量(物流成本)对于响应变量(利润)决定系数R(3)通过残差分析,怀疑残差绝对值最大的那组数据有误,经再次核实后发现其真正利润应该为116万元.请重新根据最小二乘法的思想与公式,求出新的经验回归方程.附1(修正前的参考数据):∑i=18xi∑i=18xi2=56528,x=84,∑i附2:R2=1-∑i附3:b^=∑i=1a^=y-b解:(1)因为y^=3.2x-151.8,x所以y=3.2×84-151.8=117,所以114+116+106+122+132+114+m+132=117×8,解得m=100,8月份对应的残差值e^8=132-3.2(2)由已知公式得∑i=18(yi-y^i)2=0.22+0.62+1.82+(-3)2+(-1)2+(-4.6)2R2=1-∑i=18(y故线性回归模型y^(3)由题意,第八组数据的利润应为116万元,因为∑i=18xiyi∑i=18xi所以b^=∑i=1所以a^=115-2.7×故重新采集数据后,新的经验回归方程为y^决定系数R2对回归模型的检验(1)我们可以用决定系数R2=1-∑i(2)在线性回归模型中,R2越接近于1,表示回归的效果越好.[针对训练]某市某企业坚持以市场需求为导向,合理配置生产资源,不断改革、探索销售模式.下表是该企业每月生产的一种核心产品的产量x(单位:吨)与相应的生产总成本y(单位:万元)的5组对照数据.产量x/吨12345生产总成本y/万元3781012(1)根据上述数据,试求y关于x的经验回归方程y^=b^x+参考公式:b^=∑i=1nxiy(2)记第(1)问中所求y与x的经验回归方程y^=b^x+a^为模型①,同时该企业科研人员利用计算机根据数据又建立了y与x的非线性回归模型②:y^=请完成模型①的残差图,并根据残差图,判断哪一个模型更适合作为y关于x的回归方程?并说明理由;(3)根据模型①中y与x的经验回归方程,预测产量为6吨时,生产总成本为多少万元?解:(1)x=15×y=15×∑i=15xi2=12+22+3∑i=15xiyi=1×3+2×7+3×8+4×b^=∑i=1a^=y-b^x因此,经验回归方程为y^(2)模型①的残差表为x12345y3781012y3.85.9810.112.2e-0.81.10-0.1-0.2画出残差图,如图所示.结论:模型①更适合作为y关于x的经验回归方程,理由1:模型①的5个样本点的残差点落在的带状区域比模型②的带状区域更窄;理由2:模型①的5个样本点的残差点比模型②的残差点更贴近x轴.(3)根据模型①中y与x的经验回归方程,当x=6时,y^=2.1×所以预测产量为6吨时生产总成本为14.3万元.[例1]如图是一组试验数据的散点图,拟合方程y^=b^x+c^(x>0),令t=A.(0.01,0.02) B.(50,100)C.(0.02,0.04) D.(100,200)解析:根据题意可得y^=b^t+5=2所以b^=2,c^=1,所以y^=2t+1,由y[例2](2022·全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:样本号i根部横截面积xi材积量yi10.040.2520.060.4030.040.2240.080.5450.080.5160.050.3470.050.3680.070.4690.070.42100.060.40总和0.63.9并计算得∑i=110∑i=110xi(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:样本相关系数r=∑i=1n解:(1)估计该林区这种树木平均一棵的根部横截面积x=∑i=110估计该林区这种树木平均一棵的材积量y=∑i=110(2)∑i=110(xi-x)(yi-y)=∑i=110xiy∑i=110(xi-x)2=∑∑i=110(yi-y)2=∑所以∑i0.002×0.094所以样本相关系数r=∑i=110(3)设该林区这种树木总材积量的估计值为Ym3,由题意可知,该种树木的材积量与其根部横截面积近似成正比,所以3.90所以Y=186×3.90[选题明细表]知识点、方法题号散点图、回归分析1,2,3,4,6独立性检验5,7,9,10,11综合应用8,12,13,141.已知变量x与y正相关,且由观测数据算得样本平均数x=3,y=3.5,则由该观测数据算得经验回归方程可能为(A)A.y^=0.4x+2.3 B.yC.y^=-2x+9.5 D.y解析:由变量x与y正相关,排除C,D选项.将点(3,3.5)代入A,B选项的方程中可知,选项A成立.2.(多选题)(2022·广东惠州月考)某种产品的价格x(单位:元/kg)与需求量y(单位:kg)之间的对应数据如表所示,x1015202530y1110865根据表中的数据可得经验回归方程为y^=bA.y与x正相关B.y与x负相关C.经验回归直线过点(20,8)D.该产品价格为35元/kg时,日需求量大约为3.4kg解析:由表格数据可知,随着价格x的增加,需求量y随之减小,所以y与x负相关.因为x=10+15+20+25+305y=11+10+8+6+55经验回归方程y^=b所以8=b^·20+14.4,解得b所以当x=35时,y^=-0.32×3.一只红铃虫的产卵数y和温度x有关,现收集了6组观测数据,y(单位:个)与温度x(单位:℃)得到样本数据(xi,yi)(i=1,2,3,4,5,6),令zi=lnyi,并将(xi,zi)绘制成如图所示的散点图.若用非线性经验回归方程y^=aA.a^>1,b^>0 B.a^C.0<a^<1,b^>0 D.0<a^解析:因为y^=a^eb^x,令z=lny,则z与x的经验回归方程为z^=b^x+ln4.(2022·辽宁大连二模)色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检一批产品测得如下数据:色差x212325272931色度y151619202123已知该产品的色度y和色差x之间满足线性相关关系,且y^=0.8x+aA.0.6 B.0.4 C.-0.4 D.-0.6解析:由表中数据可得x=16×(21+23+25+27+29+31)=26,y=1619+20+21+23)=19,将(26,19)代入经验回归方程得a^所以y^将x=33代入,可得y^=0.8×因此其残差为25.2-24.6=0.6.5.某机构为研究中老年人坚持锻炼与患糖尿病、高血压、冠心病、关节炎四种慢性疾病之间的关系,随机调查部分中老年人,统计数据如下表1至表4,则这四种慢性疾病可以通过坚持锻炼来预防的可能性最大的是(B)表1患糖尿病未患糖尿病坚持锻炼614不坚持锻炼725表2患高血压未患高血压坚持锻炼218不坚持锻炼1121表3患冠心病未患冠心病坚持锻炼416不坚持锻炼923表4患关节炎未患关节炎坚持锻炼713不坚持锻炼626A.糖尿病 B.高血压C.冠心病 D.关节炎解析:由表1得χ12=由表2得χ22=由表3得χ32=由表4得χ42=所以这四种慢性疾病可以通过坚持锻炼来预防的可能性最大的是高血压.6.(2022·陕西西安模拟)小华为了研究数学名次和物理名次的相关关系,记录了本班五名同学的数学和物理的名次,如图.后来发现第四名同学数据记录有误,那么去掉数据D(3,10)后,下列说法错误的是(B)A.样本相关系数r变大B.残差平方和变大C.变量x,y的相关程度变强D.样本相关系数r越趋近于1解析:由散点图知,去掉D(3,10)后,y与x的线性相关程度变强,且为正相关,所以r变大,且样本相关系数r越趋近于1,去掉D(3,10)后,散点分布更均匀,残差平方和变小.故A,C,D正确,B错误.7.有两个分类变量X和Y,其中一组观测值为如表的2×2列联表:XY合计Y1Y2X1a15-a15X220-a30+a50合计204565其中a,15-a均为大于5的整数,则a=时,依据小概率值α=0.01的独立性检验,认为“X和Y之间有关系”.

附:χ2=n(α0.10.050.0250.010.005xα2.7063.8415.0246.6357.879解析:由题意知χ2≥6.635,则65[a(8.65≤a<10,a∈N,所以a=9.答案:98.某食品厂为了检查甲、乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取100件产品作为样本称出它们的质量(单位:mg),质量值落在(175,225]的产品为合格品,否则为不合格品.统计数据如下列2×2列联表,质量流水线合计甲乙合格品9296188不合格品8412合计100100200(1)依据小概率值α=0.15的独立性检验,能否认为产品的包装的合格性与流水线的选择有关联?附:χ2=n(临界值表:α0.150.10.050.025xα2.0722.7063.8415.024α0.010.0050.001—xα6.6357.87910.828—(2)公司工程师抽取几组一小时生产的产品数据进行不合格品情况检查分析,在数量为x(单位:百件)的产品中,得到不合格品数量y(单位:件)的情况汇总如表所示,x/百件147810y/件214243540求y关于x的经验回归方程y^=b^x+附:b^=∑i=1a^=y-b解:(1)根据2×2列联表可得χ2=200×(所以依据小概率值α=0.15的独立性检验,不能认为产品包装的合格性与流水线的选择有关联.(2)由已知可得x=1+4+7+8+105y=2+14+24+35+405又∑i=15xiyi=1×2+4×14+7×24+8×∑i=15xi2=12+42+7所以b^=∑i=15xiyi-5xy6=-2.92,所以y关于x的经验回归方程为y^当x=20时,y^=4.32×所以估计一小时生产2000件时的不合格品数约为83件.9.(多选题)有甲、乙两个班级进行数学考试,按照大于等于120分为优秀,120分以下为非优秀统计成绩,得到如下2×2列联表,班级成绩合计优秀非优秀甲班10b乙班c30合计105已知在这105人中随机抽取1人,成绩优秀的概率为27附表及公式:α0.050.010.001xα3.8416.63510.828χ2=n(A.2×2列联表中c的值为30,b的值为35B.2×2列联表中c的值为20,b的值为45C.根据2×2列联表中的数据,若依据小概率值α=0.05的独立性检验,则能认为成绩与班级有关系D.根据2×2列联表中的数据,若依据小概率值α=0.05的独立性检验,则不能认为成绩与班级有关系解析:因为在这105人中随机抽取1人,成绩优秀的概率为27所以成绩优秀的人数为105×27所以c=30-10=20,b=75-30=45,所以χ2=105×(10×30-所以依据小概率值α=0.05的独立性检验,能认为成绩与班级有关系.10.(2022·安徽芜湖模拟)为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0;“这种血清不能起到预防感冒的作用”,利用2×2列联表计算的结果,根据小概率值α=0.01的独立性检验,可以认为H0成立,那么χ2的一个可能取值为(A)α0.050.0250.010.0050.001xα3.8415.0246.6357.87910.828A.7.879 B.6.635 C.5.024 D.3.841解析:由题意,χ2>6.635,由选项知χ2的一个可能取值为7.879.11.疫苗是为预防、控制传染病的发生、流行,用于人体预防接种的预防性生物制品,为了考察某种疫苗预防效果,在试验时,得到如下统计数据,疫苗传染病合计未发病发病未注射30注射40合计7030100附表及公式:α0.050.010.0050.001xα3.8416.6357.87910.828χ2=n(现从试验动物中任取一只,取到“注射疫苗”动物的概率为0.5,则下列判断错误的是(D)A.注射疫苗发病的动物数为10B.从该试验未注射疫苗的动物中任取一只,发病的概率为2C.能在犯错概率不超过0.05的前提下,认为疫苗有效D.该疫苗的有效率为80%解析:现从试验动物中任取一只,取到“注射疫苗”动物的概率为0.5,则注射疫苗发病的动物数为100×0.5-40=10,故A正确;2×2列联表如下:疫苗传染病合计未发病发病未注射302050注射401050合计7030100从该试验未注射疫苗的动物中任取一只,发病的概率为2050=2因为χ2=100×(30×10-根据小概率值α=0.05的独立性检验,认为疫苗有效,故C正确;对于D选项,未考虑未注射疫苗的动物中也有不发病的情况,故D错误.12.某二手车经销商对其所经营的A型号二手汽车的使用年数x与销售价格y(单位:万元/辆)进行整理,得到数据如表所示,使用年数x234567售价y201286.44.43z=lny3.002.482.081.861.481.10如图所示,z关于x的折线图:(1)由折线图可以看出,可以用线性回归模型拟合z与x的关系,请用样本相关系数加以说明;(2)求y关于x的经验回归方程,并预测某辆A型号二手车使用年数为9年时售价约为多少;(b^,a(3)基于成本的考虑,该型号二手车的售价不得低于7118元,请根据(2)求出的经验回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年.参考公式:b^=∑i=1a^=y-b^x参考数据:∑i=16xiyi=187.4,∑i=16xizi=47.64,∑iln0.7118≈-0.34.解:(1)由题意知x=16×z=16×又∑i=16xizi∑i所以r≈47.64-所以z与x的样本相关系数大约为-0.99,说明z与x的线性相关程度很高.(2)b^=47.64所以a^=z-b^x所以z与x的经验回归方程是z^所以y关于x的经验回归方程是y^=e-0.36x+3.62令x=9,得y^=e-0.36×9+3.62=e0.38因为ln1.46≈0.38,所以y^即预测某辆A型号二手车使用年数为9年时售价约为1.46万元.(3)当y^即e-0.36x+3.62≥0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论