




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第八章8.18.1.1A级——基础过关练1.(多选)以下关于相关关系的说法错误的有()A.相关关系是函数关系B.函数关系是相关关系C.线性相关关系是正比例函数关系D.相关关系有两种,分别是线性相关关系和非线性相关关系【答案】ABC2.(2024年泰安期中)下列关系中,是相关关系的为()①学生的学习态度与学习成绩;②身高与体重;③铁块的大小与质量;④出租车的车费与行驶路程.A.①② B.①③C.②③ D.②④【答案】A3.对于给定的两个变量的统计数据,下列说法正确的是()A.都可以分析出两个变量的关系B.都可以用一条直线近似地表示两者的关系C.都可以作出散点图D.都可以用确定的表达式表示两者的关系【答案】C4.(2024年上海月考)通过抽样调研发现,当地第三季度的医院心脑血管疾病的人数和便利店购买冷饮的人数的相关系数很高.甲认为这是巧合,两者其实没有关系;乙认为冷饮的某种摄入成分导致了疾病;丙认为病人对冷饮会有特别需求;丁认为两者的相关关系是存在的,但不能视为因果.请判断哪位成员的意见最可能成立()A.甲 B.乙C.丙 D.丁【答案】D【解析】当地第三季度的医院心脑血管疾病的人数和便利店购买冷饮的人数的相关系数很高,但相关关系是一种非确定性关系,相关关系不等于因果关系,丁的意见最可能成立.故选D.5.观察下列四个散点图,两变量具有线性相关关系的是()ABCD【答案】A【解析】选项A中的点大致分布在一条直线附近.故选A.6.(2024年广东广大附中月考)(多选)对某高三学生在连续9次数学测试中的成绩(单位:分)进行统计得到如图所示的散点图.下列关于这位同学的数学成绩的分析中,正确的是()A.该同学的数学成绩总的趋势是在逐步提高B.该同学在这连续9次测试中的最高分与最低分的差超过40分C.该同学的数学成绩与测试次号之间没有相关关系D.该同学的数学成绩与测试次号之间具有线性相关性,且为正相关【答案】ABD【解析】散点图从左向右看呈上升趋势,所以该同学的数学成绩总的趋势是在逐步提高,A正确;该同学在这连续9次测试中的最高分大于130分,最低分小于90分,极差超过40分,B正确;该同学的数学成绩与测试次号之间具有比较明显的线性相关性,且为正相关,C错误,D正确.7.有下列关系:①人的年龄与其拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一树木,其横截面直径与高度之间的关系;⑤学生与其学号之间的关系.其中具有相关关系的是________(填序号).【答案】①③④【解析】②⑤为确定性关系.8.(2024年赣州期中)根据两个变量x,y之间的观测数据画成散点图如图所示,这两个变量________(填“具有”或“不具有”)线性相关关系.【答案】不具有【解析】图中的点分布杂乱,两个变量不具有线性相关关系.9.(2024年衡水月考)变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).变量Y与X之间________相关,变量V与U________相关.(填“正”或“负”)【答案】正负【解析】对于变量X与Y而言,Y随X的增大而增大,故变量Y与X正相关;对于变量U与V而言,V随U的增大而减小,故变量V与U负相关.10.(2024年济南期中)某公司利润y(单位:千万元)与销售总额x(单位:千万元)之间有如下对应数据:x10151720252832y11.31.822.62.73.3(1)画出散点图;(2)判断y与x是否具有线性相关关系.【答案】解:(1)散点图如图所示.(2)由图知,所有数据点接近直线排列,因此认为y与x具有线性相关关系.B级——能力提升练11.(2024年石家庄月考)(多选)去年某市一个公务员考生培训机构组织300位考生参考公务员模拟考试,根据分析,报考秘书职位的37位考生的《行政职业能力测验》(简称《行测》)和《申论》成绩与总成绩在全部考生中的排名情况如图所示,从这次考试成绩看,下列结论正确的有()A.考生甲的《行测》成绩名次比乙的好B.考生丁的《行测》成绩名次比其总成绩名次靠后C.考生丙的成绩名次在这37位考生中更靠前的科目是《申论》D.考生戊的成绩名次比起总成绩名次更靠前的科目是《行测》【答案】BC【解析】A,由图可知,考生甲的《行测》成绩名次比乙的差,错误;B,由图可知,考生丁的《行测》成绩名次比其总成绩名次靠后,正确;C,在这37位考生中,总成绩的排名中比丙排名靠后的人数比较少,所以丙的《申论》成绩排名更靠前,正确;D,戊的成绩名次比其总成绩名次更靠前的科目是《申论》,错误.故选BC.12.已知变量x和y对应的点沿直线y=x-1分布,变量y与z负相关,则x与y是________,x与z是________.(两条横线上填“正相关”或“负相关”)【答案】正相关负相关【解析】∵变量x和y对应的点沿直线y=x-1分布,∴x与y是正相关,又∵变量y与z负相关,∴x与z是负相关.13.(2024年肇庆期中)某个男孩的年龄与身高的统计数据如表所示:年龄x/岁123456身高y/cm788798108115120(1)画出散点图;(2)判断y与x是否具有线性相关关系,如果相关,是正相关还是负相关.解:(1)散点图如图所示.(2)由散点图知,所有数据点分布在一条直线附近,因此,认为y与x具有线性相关关系,且是正相关关系.C级——创新拓展练14.(2024年顺德期中)有人收集了10年中某城市居民年收入(即此城市所有居民在一年内的收入的总和)与某种商品的销售额的有关数据:(单位:亿元)第n年12345年收入32.231.132.935.837.1销售额25.030.034.037.039.0第n年678910年收入38.039.043.044.646.0销售额41.042.044.048.051.0(1)画出散点图,你能从散点图中发现居民年收入与该种商品销售额之间的近似关系吗?(2)如果它们之间近似成线性关系,请画出一条直线来近似表示这种关系.解:(1)画出散点图如图所示,从散点图中可以看出年收入与销售额之间的总体趋势呈一条直线,也就是说它们之间是线性相关关系.所画直线如图所示.第八章8.18.1.2A级——基础过关练1.样本相关系数r的取值范围是()A.[-1,1] B.[-1,0]C.[0,1] D.(-1,1)【答案】A2.设某产品产量与产品单位成本之间的样本相关系数为-0.97,这说明二者之间存在着()A.高度相关 B.中度相关C.弱度相关 D.极弱相关【答案】A3.(2024年清远期末)通过计算样本相关系数r可以反映两个随机变量之间的线性相关程度,以下四个选项是计算出的四个样本的相关系数r,则反映样本数据成正相关,并且线性相关程度最强的是()A.r=0.93 B.r=0.82C.r=0.04 D.r=-0.05【答案】A4.甲、乙、丙、丁四位同学各自对A,B两变量进行线性相关试验,并用回归分析方法分别求得样本相关系数r如下表:学生甲乙丙丁r0.820.780.690.85则这四位同学的试验结果能体现出A,B两变量有更强的线性相关性的是()A.甲 B.乙C.丙 D.丁【答案】D【解析】由样本相关系数的意义可知,样本相关系数的绝对值越接近于1,相关性越强,结合题意可知,丁的线性相关性最强.故选D.5.(2024年临汾期末)已知相关变量x和y的散点图如图所示,若用y=b1·ln(k1x)与y=k2x+b2拟合时的样本相关系数分别为r1,r2,则比较r1,r2的大小结果为()A.r1>r2 B.r1=r2C.r1<r2 D.不确定【答案】C【解析】由散点图可知,用y=b1ln(k1x)拟合比用y=k2x+b2拟合的程度高,故|r1|>|r2|.又因为x,y负相关,所以-r1>-r2,即r1<r2.6.(2024年松原期末)(多选)已知r是样本相关系数,则()A.r∈[-1,-0.75]时,两变量负相关很弱B.r∈[0.75,1]时,两变量正相关很强C.r∈(-0.75,-0.3]或[0.3,0.75)时,两变量相关性一般D.r=0.1时,两变量相关性很弱【答案】BCD7.已知某个样本点中的变量x,y线性相关,样本相关系数r>0,平移坐标系,则在以(eq\x\to(x),eq\x\to(y))为坐标原点的坐标系下的散点图中,大多数的点都落在第________象限.【答案】一、三【解析】因为r>0时,b>0,所以大多数的点都落在第一、三象限.8.(2024年随州期末)若已知eq\o(∑,\s\up6(n),\s\do6(i=1))(yi-eq\x\to(y))2是eq\o(∑,\s\up6(n),\s\do6(i=1))(xi-eq\x\to(x))2的4倍,eq\o(∑,\s\up6(n),\s\do6(i=1))(xi-eq\x\to(x))·(yi-eq\x\to(y))是eq\o(∑,\s\up6(n),\s\do6(i=1))(xi-eq\x\to(x))2的1.5倍,则样本相关系数r的值为________.【答案】0.75【解析】由r=eq\f(\o(∑,\s\up11(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\r(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2\o(∑,\s\up6(n),\s\do4(i=1))(yi-\o(y,\s\up6(-)))2)),得r=0.75.9.如图,有5组(x,y)数据,去掉点________,剩下的4组数据的样本相关系数最大.【答案】D(3,10)10.某基地蔬菜大棚采用无土栽培方式种植各类蔬菜,根据统计,该基地的西红柿增加量y(单位:千克)与使用液体肥料的质量x(单位:千克)之间的对应数据如下表所示.依据下表计算样本相关系数r(精确到0.01).x24568y34445参考数据:eq\r(0.3)≈0.55,eq\r(0.9)≈0.95.解:已知数据得eq\x\to(x)=eq\f(1,5)×(2+4+5+6+8)=5,eq\x\to(y)=eq\f(1,5)×(3+4+4+4+5)=4.∵eq\o(∑,\s\up6(5),\s\do6(i=1))(xi-eq\x\to(x))(yi-eq\x\to(y))=(-3)×(-1)+0+0+0+3×1=6,eq\r(eq\o(∑,\s\up6(5),\s\do6(i=1))(xi-eq\x\to(x))2)=eq\r((-3)2+(-1)2+02+12+32)=2eq\r(5),eq\r(eq\o(∑,\s\up6(5),\s\do6(i=1))(yi-eq\x\to(y))2)=eq\r((-1)2+02+02+02+12)=eq\r(2),∴r=eq\f(eq\o(∑,\s\up6(5),\s\do6(i=1))(xi-eq\x\to(x))(yi-eq\x\to(y)),eq\r(eq\o(∑,\s\up6(5),\s\do6(i=1))(xi-eq\x\to(x))2)eq\r(eq\o(∑,\s\up6(5),\s\do6(i=1))(yi-eq\x\to(y))2))=eq\f(6,2\r(5)×\r(2))=eq\r(0.9)≈0.95.B级——能力提升练11.(多选)下面的散点图与样本相关系数r一定不符合的是()【答案】ACD【解析】对于A,C,各点散布在从左上角到右下角的区域里,所以样本相关系数r<0,A,C均不符合;对于B,各点散布在从左下角到右上角的区域里,所以样本相关系数r>0,B符合;对于D,各点散布在从左下角到右上角的带状区域里,所以样本相关系数r∈(0,1),D不符合.故选ACD.12.(2024年贵阳期末)某市居民2019—2023年家庭年平均收入x(单位:万元)与年平均支出y(单位:万元)的统计资料如下表所示:年份20192020202120222023收入x11.512.11313.315支出y6.88.89.81012根据统计资料,居民家庭年平均收入的中位数是________,家庭年平均收入与年平均支出有________线性相关关系.【答案】13较强的【解析】由表中所给的数据知所求的中位数为13,画出x与y的散点图(或计算出x与y的样本相关系数)知它们有较强的线性相关关系.13.(2024年上海期末)为分析学生初中升学的数学成绩对高一数学学习的影响,在高一年级随机抽取10名学生,了解他们的入学成绩(单位:分)和高一期末考试数学成绩(单位:分)如下表所示:学生编号12345678910入学成绩x63674588817152995876高一期末成绩y65785282928973985675(1)画出散点图;(2)对变量x与y进行相关性检验,如果x与y之间具有线性相关关系,求样本相关系数r并作出分析.解:(1)散点图如图所示.(2)由题意可求得eq\x\to(x)=70,eq\x\to(y)=76,eq\o(∑,\s\up6(10),\s\do6(i=1))(xi-eq\x\to(x))(yi-eq\x\to(y))=1894,eq\o(∑,\s\up6(10),\s\do6(i=1))(xi-eq\x\to(x))2=2474,eq\o(∑,\s\up6(10),\s\do6(i=1))(yi-eq\x\to(y))2=2056,因此可得样本相关系数为r=eq\f(eq\o(∑,\s\up6(10),\s\do6(i=1))(xi-eq\x\to(x))(yi-eq\x\to(y)),eq\r(eq\o(∑,\s\up6(10),\s\do6(i=1))(xi-eq\x\to(x))2)eq\r(eq\o(∑,\s\up6(10),\s\do6(i=1))(yi-eq\x\to(y))2))=eq\f(1894,\r(2474)×\r(2056))≈0.8398,所以入学数学成绩与高一期末考试数学成绩存在较强的线性相关关系.C级——创新拓展14.(2024年盐城期中)研究表明,开始吸烟年龄X分别为16岁、18岁、20岁和22岁者,其得肺癌的相对危险度Y依次为15.10,12.81,9.72,3.21;每天吸烟支数U分别为10,20,30者,其得肺癌的相对危险度V分别为7.5,9.5和16.6,用r1表示变量X与Y之间的样本相关系数,用r2表示变量U与V之间的样本相关系数,则下列说法正确的是()A.r1=r2 B.0<r2<r1C.0<r1<r2 D.r1<0<r2【答案】D【解析】由题意可知,开始吸烟年龄递增时,得肺癌的相对危险度呈递减趋势,所以吸烟年龄与得肺癌的危险度呈负相关,所以r1<0,同理可知,得肺癌的危险度与每天吸烟支数呈正相关,所以r2>0.因此可得r1<0<r2.第八章8.28.2.2第1课时A级——基础过关练1.(多选)随机误差的主要来源有()A.线性回归模型与真实情况引起的误差B.省略了一些因素的影响产生的误差C.观测产生的误差D.估算产生的误差【答案】ABC2.已知x与y之间的一组数据:x0123ym35.57已求得关于y与x的经验回归方程为eq\o(y,\s\up6(^))=2.2x+0.7,则m的值为()A.1 B.0.85C.0.7 D.0.5【答案】D3.已知变量x,y之间具有线性相关关系,其散点图如图所示,则其经验回归方程可能为()A.eq\o(y,\s\up6(^))=x+2 B.eq\o(y,\s\up6(^))=x-2C.eq\o(y,\s\up6(^))=-x+2 D.eq\o(y,\s\up6(^))=-x-2【答案】C4.根据如下样本数据得到的经验回归方程为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),则()x345678y4.02.5-0.50.5-2.0-3.0A.eq\o(a,\s\up6(^))>0,eq\o(b,\s\up6(^))>0 B.eq\o(a,\s\up6(^))>0,eq\o(b,\s\up6(^))<0C.eq\o(a,\s\up6(^))<0,eq\o(b,\s\up6(^))>0 D.eq\o(a,\s\up6(^))<0,eq\o(b,\s\up6(^))<0【答案】B5.已知x与y之间的一组数据:x0123y1357若y与x线性相关,则y与x的经验回归直线eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))必过点()A.(2,2) B.(1.5,0)C.(1,2) D.(1.5,4)【答案】D【解析】∵eq\x\to(x)=eq\f(0+1+2+3,4)=1.5,eq\x\to(y)=eq\f(1+3+5+7,4)=4,∴经验回归直线必过点(1.5,4).6.(多选)已知某产品的单价x(单位:元)以及销量y(单位:件)情况统计如表所示,由表中数据求得经验回归方程eq\o(y,\s\up6(^))=-4x+eq\o(a,\s\up6(^)),则下列说法正确的是()单价x/元456789销量y/件908483807568A.销量的平均数为80件B.根据经验回归方程可以测得,单价每上升1元,销量就平均减少4件C.eq\o(a,\s\up6(^))=26D.根据经验回归方程可以预测,当单价为10元时,销量为66件【答案】ABD【解析】eq\x\to(x)=eq\f(1,6)(4+5+6+7+8+9)=6.5,eq\x\to(y)=eq\f(1,6)(90+84+83+80+75+68)=80,故A正确;将(6.5,80)代入经验回归方程得eq\o(a,\s\up6(^))=106,故经验回归方程为eq\o(y,\s\up6(^))=-4x+106,由于经验回归方程的斜率为-4,故B正确,C错误;根据经验回归方程可以预测,当单价为10元时,销量为-40+106=66(件),故D正确.7.某工厂对某产品的产量与成本的资料分析后有如下数据:产量x/千件2356成本y/万元78912由表中数据得到的经验回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))中eq\o(b,\s\up6(^))=1.1,预测当产量为9千件时,成本约为________万元.【答案】14.5【解析】由表中数据得eq\x\to(x)=4,eq\x\to(y)=9,代入经验回归方程得eq\o(a,\s\up6(^))=4.6,∴当x=9时,eq\o(y,\s\up6(^))=1.1×9+4.6=14.5(万元).8.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩y(单位:分)对总成绩x(单位:分)的经验回归方程为eq\o(y,\s\up6(^))=6+0.4x.由此可以估计:若两个同学的总成绩相差50分,则他们的数学成绩大约相差________分.【答案】20【解析】令两人的总成绩分别为x1,x2,则对应的数学成绩估计为eq\o(y,\s\up6(^))1=6+0.4x1,eq\o(y,\s\up6(^))2=6+0.4x2,所以|eq\o(y,\s\up6(^))1-eq\o(y,\s\up6(^))2|=|0.4(x1-x2)|=0.4×50=20.9.某种细胞的存活率y(%)与存放温度x(℃)之间具有线性相关关系,其样本数据如下表所示:存放温度x/℃20151050-5-10存活率y/%6142633436063计算得eq\o(x,\s\up6(-))=5,eq\o(y,\s\up6(-))=35,eq\o(∑,\s\up6(7),\s\do6(i=1))xiyi=-175,eq\o(∑,\s\up6(7),\s\do6(i=1))xeq\o\al(2,i)=875,并求得经验回归方程为eq\o(y,\s\up6(^))=-2x+45,但实验人员发现表中数据x=-5的对应值y=60录入有误,更正为y=53,则更正后经验的回归方程为___________.【答案】eq\o(y,\s\up6(^))=-1.9x+43.5【解析】由题意知,更正后eq\o(x,\s\up6(-))=5,eq\o(y,\s\up6(-))=eq\f(1,7)(35×7-60+53)=34,eq\o(∑,\s\up6(7),\s\do6(i=1))xiyi=-175+5×60-5×53=-140,eq\o(∑,\s\up6(7),\s\do6(i=1))xeq\o\al(2,i)=875,∴eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(7),\s\do6(i=1))xiyi-7\o(x,\s\up6(-))\o(y,\s\up6(-)),\o(∑,\s\up6(7),\s\do6(i=1))xeq\o\al(2,i)-7\o(x,\s\up6(-))2)=eq\f(-140-7×5×34,875-7×25)=-1.9,eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-))=34-(-1.9)×5=43.5,∴更正后的经验回归方程为eq\o(y,\s\up6(^))=-1.9x+43.5.10.一项关于16艘轮船的研究中,船的吨位区间为[192,3246](单位:吨),船员的人数为5~32,船员人数y关于吨位x的经验回归方程为eq\o(y,\s\up6(^))=9.5+0.0062x.(1)若两艘船的吨位相差1000,求船员平均相差的人数;(2)估计吨位最大的船和最小的船的船员人数.解:(1)设两艘船的吨位分别为x1,x2,则eq\o(y,\s\up6(^))1-eq\o(y,\s\up6(^))2=9.5+0.0062x1-(9.5+0.0062x2)=0.0062×1000≈6,即船员平均相差6人.(2)当x=192时,eq\o(y,\s\up6(^))=9.5+0.0062×192≈11;当x=3246时,eq\o(y,\s\up6(^))=9.5+0.0062×3246≈30.故估计吨位最大和最小的船的船员数分别为30和11.B级——能力提升练11.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:h)与当天投篮命中率y之间的关系:时间x12345命中率y0.40.50.60.60.4小李这5天的平均投篮命中率为________;用经验回归分析的方法,预测小李该月6号打6h篮球的投篮命中率为________.【答案】0.50.53【解析】eq\x\to(y)=eq\f(0.4+0.5+0.6+0.6+0.4,5)=eq\f(2.5,5)=0.5,eq\x\to(x)=eq\f(1+2+3+4+5,5)=3.由公式,得eq\o(b,\s\up6(^))=0.01,从而eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=0.5-0.01×3=0.47.所以经验回归方程为eq\o(y,\s\up6(^))=0.47+0.01x.所以当x=6时,eq\o(y,\s\up6(^))=0.47+0.01×6=0.53.12.(2023年黄冈期末)某公司的生产部门调研发现,该公司第二、三季度的月用电量Y与月份x线性相关,且数据统计如下表所示:月份456789月用电量/千瓦时61627554656但核对电费报表时发现一组数据统计有误.(1)请指出哪组数据有误,并说明理由;(2)在排除有误数据后,求月用电量与月份之间的经验回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),并预测统计有误那个月份的用电量.(结果精确到0.1)解:(1)作散点图如图所示.因为用电量与月份之间线性相关,所以散点图的样本点分布在经验回归直线附近比较窄的带状区域内,而点(7,55)离其他点所在区域较远,故(7,55)这组数据有误.(2)排除(7,55)这一组有误数据后,计算得eq\x\to(x)=6.4,eq\x\to(y)=30.2,eq\o(∑,\s\up6(5),\s\do6(i=1))xeq\o\al(2,i)=222,eq\o(∑,\s\up6(5),\s\do6(i=1))xiyi=1138,所以eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(5),\s\do6(i=1))xiyi-5\o(x,\s\up6(-))\o(y,\s\up6(-)),\o(∑,\s\up6(5),\s\do6(i=1))xeq\o\al(2,i)-5\o(x,\s\up6(-))2)≈9.98,eq\o(a,\s\up6(^))=eq\o(y,\s\up6(^))-eq\o(b,\s\up6(^))eq\x\to(x)≈-33.67.所以经验回归方程为eq\o(y,\s\up6(^))=9.98x-33.67,当x=7时,eq\o(y,\s\up6(^))≈36.2,即7月份的用电量大约为36.2千瓦时.C级——创新拓展练13.(多选)已知由样本数据点集合{(xi,yi)|i=1,2,3,…,n},求得的回归直线方程为eq\o(y,\s\up6(^))=1.5x+0.5,且eq\o(x,\s\up6(^))=3,现发现两个数据点(1.2,2.2)和(4.8,7.8)的误差较大,去除后重新求得的回归直线l的斜率为1.2,则下列说法正确的是()A.变量x与y呈正相关关系B.去除后y的估计值增加速度变快C.去除后与去除前样本点的中心不变D.去除后的回归直线方程为eq\o(y,\s\up6(^))=1.2x+1.4【答案】ACD【解析】因为回归直线方程为eq\o(y,\s\up6(^))=1.5x+0.5,1.5>0,所以变量x与y呈正相关关系,A正确;因为1.5>1.2,所以去除后y的估计值增加速度变慢,B错误;当eq\x\to(x)=3时,eq\x\to(y)=3×1.5+0.5=5,所以去除前样本点的中心为(3,5),又因为eq\f(1.2+4.8,2)=3,eq\f(2.2+7.8,2)=5,所以去掉两个数据点(1.2,2.2)和(4.8,7.8)后,样本点的中心还是(3,5),C正确;因为去除后重新求得的回归直线l的斜率为1.2,所以可设l:eq\o(y,\s\up6(^))=1.2x+eq\o(a,\s\up6(^)),将点(3,5)代入直线l,得5=1.2×3+eq\o(a,\s\up6(^)),解得eq\o(a,\s\up6(^))=1.4,所以去除后的回归直线方程为eq\o(y,\s\up6(^))=1.2x+1.4,D正确.第八章8.28.2.2第2课时A级——基础过关练1.在回归分析中,R2的值越大,说明残差平方和()A.越大 B.越小C.可能大也可能小 D.以上均错【答案】B2.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的决定系数R2分别如下表所示:学生甲乙丙丁R20.950.500.850.77则建立的回归模型拟合效果最好的同学是()A.甲 B.乙C.丙 D.丁【答案】A3.在线性回归模型中,变量x与y的一组样本数据对应的点均在直线y=eq\f(1,4)x+eq\f(1,2)上,则R2等于()A.eq\f(1,4) B.eq\f(1,2)C.1 D.2【答案】C4.甲、乙、丙、丁4位同学各自对A,B两变量进行回归分析,分别得到散点图与残差平方和eq\o(∑,\s\up6(n),\s\do6(i=1))(yi-eq\o(y,\s\up6(^))i)2如下表所示:学生甲乙丙丁散点图残差平方和115106124103试验结果体现拟合A,B两变量关系的模型拟合精度高的同学是()A.甲 B.乙C.丙 D.丁【答案】D【解析】根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小,则由回归分析建立的线性回归模型的拟合效果越好,由试验结果知丁要好些.5.色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检一批该产品测得如下数据:色差x212325272931色度y151617212223已知该产品的色差和色度之间满足线性相关关系,且eq\o(y,\s\up6(^))=0.25x+eq\o(b,\s\up6(^)),现有一对测量数据为(32,21.25),则该组数据的残差(测量值与预测值的差)为()A.0.65 B.0.75C.-0.75 D.0.95【答案】B【解析】样本中心点坐标为(26,19),代入经验回归方程得到eq\o(b,\s\up6(^))=12.5,所以eq\o(y,\s\up6(^))=0.25x+12.5.将x=32代入,求解得到对应的预估值为20.5,因而其残差为21.25-20.5=0.75.故选B.6.(多选)下列说法错误的有()A.一组数据的预测值与真实值之间的误差越大,残差越小B.线性回归方程对应的直线eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))至少经过其样本数据点中的一个点C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D.在回归分析中,决定系数R2为0.98的模型比决定系数R2为0.80的模型拟合的效果差【答案】ABD【解析】对于A,一组数据的预测值与真实值之间的误差越大,残差越大,所以A错误;对于B,经验回归方程对应的直线eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))可能不过任何一个样本数据点,所以B错误;对于C,残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,所以C正确;对于D,回归分析中,决定系数R2为0.98的模型比决定系数R2为0.80的模型拟合的效果好,所以D错误.故选ABD.7.某连锁经营公司所属5个零售店某月的销售额和利润额资料如下表所示:商店名称ABCDE销售额x/千万元35679利润额y/百万元23345已知y关于x的经验回归方程为eq\o(y,\s\up6(^))=0.5x+0.4,则当销售额为5千万元时,残差为________.【答案】0.1【解析】当x=5时,eq\o(y,\s\up6(^))=0.5×5+0.4=2.9,表格中对应y=3,于是残差为3-2.9=0.1.8.以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=lny,其变换后得到经验回归方程z=0.3x+4,则c=________.【答案】e4【解析】由题意,得ln(cekx)=0.3x+4,所以lnc+kx=0.3x+4,比较两边系数,得lnc=4,所以c=e4.9.对两个具有非线性相关关系的变量x,y进行回归分析,设μ=lny,υ=(x-4)2,利用二乘法得到μ关于υ的经验回归方程为eq\o(μ,\s\up6(^))=-0.5υ+2,则eq\o(y,\s\up6(^))的最大值是________.【答案】e2【解析】将μ=lny,υ=(x-4)2代入经验回归方程eq\o(μ,\s\up6(^))=-0.5υ+2,得eq\o(y,\s\up6(^))=e-0.5(x-4)2+2.当x=4时,eq\o(y,\s\up6(^))=e-0.5(4-4)2+2=e2,故eq\o(y,\s\up6(^))最大值为e2.10.(2024年福州期末)为了让人民享受到更优质的教育服务,我国逐年加大对教育的投入.为了预测2025年全国普通本科招生数,建立了招生数y(单位:万人)与时间变量t的三个回归模型,其中根据2001年至2019年的数据(时间变量t的值依次取1,2,3,…,19)建立模型①:eq\o(y,\s\up6(^))=166.9e0.058t(决定系数Req\o\al(2,1)≈0.88)和模型②:eq\o(y,\s\up6(^))=152.4+16.3t(样本相关系数r1≈0.97,决定系数Req\o\al(2,2)≈0.94).根据2014年至2019年的数据(时间变量t的值依次取1,2,3,…,6)建立模型③:eq\o(y,\s\up6(^))=372.8+9.8t(样本相关系数r2≈0.99,决定系数Req\o\al(2,3)≈0.98).(1)可以根据模型①得到2025年全国普通本科招生数的预测值为597.88万人,请你分别利用模型②③,求2025年全国普通本科招生数的预测值;(2)你认为用哪个模型得到的预测值更可靠?说明理由.(写出一个即可)解:(1)利用模型②得2025年全国普通本科招生数的预测值为eq\o(y,\s\up6(^))=152.4+16.3×25=559.9(万人),利用模型③得2025年全国普通本科招生数的预测值为eq\o(y,\s\up6(^))=372.8+9.8×12=490.4(万人).(2)利用模型③得到的预测值更可靠,理由如下:理由一:从计算结果可以看出,模型③的决定系数Req\o\al(2,3)≈0.98最大,说明其拟合效果最好,因此利用模型③得到的预测值更可靠.理由二:模型①的决定系数比模型②③小很多,说明其拟合效果最差.对于模型②③,模型③的样本相关系数r2≈0.99比模型②的样本相关系数r1≈0.97大,说明模型③的两变量的线性相关性比模型②更强,因此利用模型③得到的预测值更可靠.B级——能力提升练11.(多选)某电子商务平台每年都会举行“年货节”商业促销狂欢活动,现统计了该平台从2016年到2024年共9年“年货节”期间的销售额(单位:亿元)并作出散点图,将销售额y看成以年份序号x(2016年作为第1年)的函数.运用excel软件,分别选择回归直线和三次函数回归曲线进行拟合,效果如图所示,则下列说法正确的有()A.销售额y与年份序号x呈正相关关系B.三次函数回归模型的残差平方和大于直线回归模型的残差平方和C.三次函数回归曲线的拟合效果好于回归直线的拟合效果D.根据三次函数回归曲线可以预测2025年“年货节”期间的销售额约为2125.78亿元【答案】AC【解析】由散点图的变化趋势可知,销售额y与年份序号x呈正相关关系,故选项A正确;由散点图以及直线回归模型和三次函数回归模型的位置关系可知,三次函数回归模型的残差平方和小于直线回归模型的残差平方和,故选项B错误;因为0.999>0.936,所以三次函数回归曲线的拟合效果好于回归直线的拟合效果,故选项C正确;因为三次函数为y=0.168x3+28.141x2-29.027x+6.889,则当x=10时,y=2698.719亿元,故选项D错误.故选AC.12.为了研究某种病毒在特定环境下随时间变化的繁殖情况,得到了一些数据,绘制成散点图,发现用模型y=cekx拟合比较合适.令z=lny,得到eq\o(z,\s\up6(^))=1.3x+eq\o(a,\s\up6(^)),经计算发现x,z满足下表,则k=________,c=________.天数x23456z1.54.55.56.57【答案】1.3e-0.2【解析】由表知,eq\x\to(x)=eq\f(1,5)×(2+3+4+5+6)=4,eq\x\to(z)=eq\f(1,5)×(1.5+4.5+5.5+6.5+7)=5,由经验回归直线eq\o(z,\s\up6(^))=1.3x+eq\o(a,\s\up6(^))恒过点eq\b\lc\(\rc\)(\a\vs4\al\co1(\x\to(x),\x\to(z))),知5=1.3×4+eq\o(a,\s\up6(^)),解得eq\o(a,\s\up6(^))=-0.2,∴eq\o(z,\s\up6(^))=1.3x-0.2,即lny=1.3x-0.2,∴y=e1.3x-0.2=e-0.2·e1.3x,∴k=1.3,c=e-0.2.13.某电视厂家准备在元旦举行促销活动,现根据近七年的广告费与销售量的数据确定此次广告费支出.广告费支出x(单位:万元)和销售量y(单位:万台)的数据如下表所示:年份2016201720182019202020212022广告费支出x1246111319销售量y1.93.24.04.45.25.35.4(1)若用线性回归模型拟合y与x的关系,求出y关于x的经验回归方程;(2)若用y=c+deq\r(x)模型拟合y与x的关系,可得经验回归方程eq\o(y,\s\up6(^))=1.63+0.99eq\r(x),经计算线性回归模型和该模型的R2分别约为0.75和0.88,请用R2说明选择哪个回归模型更好.解:(1)∵eq\x\to(x)=8,eq\o(y,\s\up6(-))=4.2,eq\o(∑,\s\up6(7),\s\do6(i=1))xiyi=279.4,eq\o(∑,\s\up6(7),\s\do6(i=1))xeq\o\al(2,i)=708,∴eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(7),\s\do6(i=1))xiyi-7\o(x,\s\up6(-))\o(y,\s\up6(-)),\o(∑,\s\up6(7),\s\do6(i=1))xeq\o\al(2,i)-7\o(x,\s\up6(-))2)=eq\f(279.4-7×8×4.2,708-7×82)=0.17,eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\x\to(x)=4.2-0.17×8=2.84,∴y关于x的经验回归方程为eq\o(y,\s\up6(^))=0.17x+2.84.(2)∵0.75<0.88且R2越大,反映残差平方和越小,模型的拟合效果越好,∴选用eq\o(y,\s\up6(^))=1.63+0.99eq\r(x)更好.C级——创新拓展练14.(2023年葫芦岛模拟)全球化时代,中国企业靠什么在激烈的竞争中成为世界一流企业?由人民日报社指导,《中国经济周刊》主办的第十八届中国经济论坛在人民日报社举行,就中国企业如何提升全球行业竞争力进行了研讨.数据显示,某企业近年加大了科技研发资金的投入,其科技投入x(单位:百万元)与收益y(单位:百万元)的数据统计如下表所示:科技投入x1234567收益y19202231405070根据数据特点,甲认为样本点分布在指数型曲线y=2bx+a的周围,据此他对数据进行了一些初步处理.如下表所示:eq\o(z,\s\up6(-))eq\o(∑,\s\up6(7),\s\do6(i=1))xeq\o\al(2,i)eq\o(∑,\s\up6(7),\s\do6(i=1))xiyieq\o(∑,\s\up6(7),\s\do6(i=1))xizieq\o(∑,\s\up6(7),\s\do6(i=1))(yi-eq\o(y,\s\up6(-)))2eq\o(∑,\s\up6(7),\s\do6(i=1))(yi-eq\o(yi,\s\up6(^)))2514012391492134130其中zi=log2yi,eq\o(z,\s\up6(-))=eq\f(1,7)eq\o(∑,\s\up6(7),\s\do6(i=1))zi.(1)请根据表中数据,建立y关于x的非线性回归方程.(系数精确到0.1)(2)①乙认为样本点分布在直线y=mx+n的周围,并计算得经验回归方程为eq\o(y,\s\up6(^))=8.25x+3,以及该回归模型的决定系数Req\o\al(2,乙)=0.893,试比较甲、乙两人所建立的模型,谁的拟合效果更好?②由①所得的结论,计算该企业欲使收益达到1亿元,科技投入的费用至少要多少百万元?(精确到0.1)参考数据:log25≈2.3.解:(1)将y=2bx+a两边取对数得log2y=bx+a,令z=log2y,则eq\o(z,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)).∵eq\x\to(x)=4,∴eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(7),\s\do6(i=1))xizi-7\o(x,\s\up6(-))\o(z,\s\up6(-)),\o(∑,\s\up6(7),\s\do6(i=1))xeq\o\al(2,i)-7\o(x,\s\up6(-))2)=eq\f(149-7×4×5,140-7×42)≈0.3,eq\o(a,\s\up6(^))=eq\x\to(z)-eq\o(b,\s\up6(^))eq\x\to(x)=5-0.3×4=3.8,∴经验回归方程为eq\o(z,\s\up6(^))=0.3x+3.8,即eq\o(y,\s\up6(^))=20.3x+3.8.(2)①甲建立的回归模型的Req\o\al(2,甲)=1-eq\f(130,2134)≈0.939>0.893=Req\o\al(2,乙),∴甲建立的回归模型拟合效果更好.②由①知,甲建立的回归模型拟合效果更好.设20.3x+3.8≥100,得0.3x+3.8≥log2100=2+2log25,解得x≥9.3.∴科技投入的费用至少要9.3百万元,下一年的收益才能达到1亿元.第八章8.28.3.1A级——基础过关练1.可以粗略地判断两个分类变量是否有关系的是()A.散点图 B.等高堆积条形图C.假设检验的思想 D.以上都不对【答案】B2.在2×2列联表中,下列两个比值相差越大,两个分类变量之间的关系越强的是()A.eq\f(a,a+b)与eq\f(c,c+d) B.eq\f(a,c+d)与eq\f(c,a+b)C.eq\f(a,a+d)与eq\f(c,b+c) D.eq\f(a,b+d)与eq\f(c,a+c)【答案】A3.用等高堆积条形图粗略估计两个分类变量是否相关,观察下列各图,其中两个分类变量关系最强的是()ABCD【答案】D4.(2024年石家庄期末)下面的等高堆积条形图可以说明的问题是()A.心脏搭桥手术和血管清障手术对诱发心脏病的影响是绝对不同的B.心脏搭桥手术和血管清障手术对诱发心脏病的影响没有什么不同C.此等高条形图看不出两种手术有什么不同的地方D.心脏搭桥手术和血管清障手术对诱发心脏病的影响在某种程度上是不同的,但是没有100%的把握【答案】D【解析】由等高堆积条形图可知心脏搭桥手术和血管清障手术对诱发心脏病的频率不同,所以心脏搭桥手术和血管清障手术对诱发心脏病的影响在某种程度上是不同的,但是没有100%的把握,所以选项D正确.故选D.5.为了解某大学的学生是否爱好体育锻炼,用简单随机抽样方法在校园内调查了120位学生,得到如下2×2列联表:项目男女合计爱好ab73不爱好c25合计74则a-b-c等于()A.7 B.8C.9 D.10【答案】C【解析】根据题意,可得c=120-73-25=22,a=74-22=52,b=73-52=21,∴a-b-c=52-21-22=9.故选C.6.(2024年福州期末)(多选)户外运动已经成为一种时尚,某单位为了了解员工喜欢户外运动是否与性别有关联,从本单位所有员工共计650人中采用比例分配的分层随机抽样的方法抽取50人进行问卷调查,得到了如下2×2列联表:单位:人性别户外运动合计喜欢不喜欢男性a5b女性10cd合计ef50在这50人中随机抽取1人,抽到喜欢户外运动员工的概率是0.6,则下列说法正确的是()A.抽取的50人中喜欢户外运动的有30人B.a=20,c=15C.e=30,f=10D.女性中喜欢户外运动的频率为0.4【答案】ABD【解析】从50人中随机抽取1人,抽到喜欢户外运动员工的概率是0.6,可得50人中喜欢户外运动的人数为50×0.6=30,即e=30,f=20.因为喜欢户外运动的女性有10人,所以喜欢户外运动的男性有30-10=20人,即a=20,b=25.因为不喜欢户外运动的男性有5人,所以不喜欢户外运动的女性有20-5=15人,即c=15,d=25.女性中喜欢户外运动的频率为eq\f(10,25)=0.4.故选ABD.7.某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集的数据是_________.【答案】男正教授人数,副教授人数;女正教授人数,副教授人数8.(2024年新乡期中)下图是调查某学校高一、高二年级学生参加社团活动的等高堆积条形图,阴影部分的高表示参加社团的频率.已知该校高一、高二年级学生人数均为600(所有学生都参加了调查),现从参加社团的同学中按分层随机抽样的方式抽取45人,则抽取的高二学生人数为________.【答案】27【解析】根据等高堆积条形图可知,参加社团的高一和高二年级学生的人数比为2∶3,由分层随机抽样的性质可得抽取的高二学生人数为45×eq\f(3,5)=27.9.下表是不完整的2×2列联表,其中3a=c,b=2d,则a=________.类别y1y2合计x1ab55x2cd合计120【答案】15【解析】由题意得eq\b\lc\{\rc\(\a\vs4\al\co1(a+b=55,,c+d=120-55,))又因为3a=c,b=2d,所以eq\b\lc\{\rc\(\a\vs4\al\co1(a+2d=55,,3a+d=65,))解得a=15.10.为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:组别尿棕色素合计阳性数阴性数铅中毒病人29736对照组92837合计383573试画出列联表的等高堆积条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系.解:等高堆积条形图如图所示:其中两个白色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.B级——能力提升练11.(多选)为了解市民对地铁1号线开通的关注情况,某调查机构在地铁开通后的某两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构,并制作出如下等高堆积条形图:根据图中(35岁以上含35岁)的信息,下列结论中一定正确的有()A.样本中男性比女性更关注地铁1号线全线开通B.样本中多数女性是35岁以上C.样本中35岁以下的男性人数比35岁以上的女性人数多D.样本中35岁以上的人对地铁1号线的开通关注度更高【答案】ABD【解析】设等高堆积条形图对应2×2列联表如下:性别35岁以上35岁以下合计男性aca+c女性bdb+d合计a+bc+da+b+c+d根据第1个等高堆积条形图可知,35岁以上男性比35岁以上女性多,即a>b;35岁以下男性比35岁以下女性多,即c>d.根据第2个等高堆积条形图可知,男性中35岁以上的比35岁以下的多,即a>c;女性中35岁以上的比35岁以下的多,即b>d.对于A,男性人数为a+c,女性人数为b+d,因为a>b,c>d,所以a+c>b+d,所以A正确;对于B,35岁以上女性人数为b,35岁以下女性人数为d,因为b>d,所以B正确;对于C,35岁以下男性人数为c,35岁以上女性人数为b,无法从图中直接判断b与c的大小关系,所以C不一定正确;对于D,35岁以上的人数为a+b,35岁以下的人数为c+d,因为a>c,b>d,所以a+b>c+d,所以D正确.故选ABD.12.为了考察长头发与女性头晕是否有关系,随机抽查301名女性,得到如下列联表,试根据表格中已有数据填空.头发类型头晕状况合计经常头晕很少头晕长发35①121短发37143②合计72③④空格中的数据应分别为:①__________;②________;③________;④________.【答案】86180229301【解析】最右侧的合计是对应的行上的两个数据的和,由此可求出①和②;而最下面的合计是相应的列上两个数据的和,由①和②的结果可求得③④.13.某校在高一部分学生中调查男女同学对某项体育运动的喜欢情况,其二维堆积条形图如图所示(阴影部分代表喜欢,白色代表不喜欢).(1)写出2×2列联表;(2)在这次调查中,从喜欢这项体育运动的一名男生和两名女生中任选两人进行专业培训,求恰是一男一女的概率.解:(1)观察二维堆积条形图可得,经调查的男生总共45人,其中喜欢这项运动的有15人,不喜欢的有30人;经调查的女生总共45人,其中喜欢这项运动的有5人,不喜欢的有40人.由此写出列联表如下:性别某项运动合计喜欢不喜欢男153045女54045合计207090(2)所求概率为p=eq\f(Ceq\o\al(1,1)Ceq\o\al(1,2),Ceq\o\al(2,3))=eq\f(2,3),即恰是一男一女的概率为eq\f(2,3).C级——创新拓展练14.针对某新型病毒,某科研机构已研发出甲、乙两种疫苗,为比较两种疫苗的效果,选取100名志愿者,将他们随机分成两组,每组50人.第一组志愿者注射甲种疫苗,第二组志愿者注射乙种疫苗,经过一段时间后,对这100名志愿者进行该新型病毒抗体检测,发现有eq\f(1,10)的志愿者未产生该新型病毒抗体,在未产生该新型病毒抗体的志愿者中,注射甲种疫苗的志愿者占eq\f(1,5).根据题中数据,完成列联表.类别是否产生抗体合计产生抗体未产生抗体甲乙合计解:由题意可得未产生该新型病毒抗体的志愿者的人数为100×eq\f(1,10)=10,则注射甲种疫苗的志愿者中未产生抗体的人数为10×eq\f(1,5)=2,产生抗体的人数为50-2=48,注射乙种疫苗的志愿者中未产生抗体的人数为10-2=8,产生抗体的人数为50-8=42.所得列联表如下.类别是否产生抗体合计产生抗体未产生抗体甲48250乙42850合计9010100第八章8.28.3.2A级——基础过关练1.想要检验是否喜欢参加体育活动是不是与性别有关,应该检验()A.零假设H0:男性喜欢参加体育活动B.零假设H0:女性不喜欢参加体育活动C.零假设H0:喜欢参加体育活动与性别有关D.零假设H0:喜欢参加体育活动与性别无关【答案】D2.(2024年汕头期中)利用独立性检验对两个随机事件是否有关系进行研究时,若根据α=0.005的独立性检验认为“X与Y有关系”,则具体计算出的数据应该是()A.χ2≥6.635 B.χ2<6.635C.χ2≥7.879 D.χ2<7.879【答案】C3.为了考察某种中成药预防流感的效果,抽样调查40人,得到如下数据:药物流感患流感未患流感服用218未服用812根据表中数据,计算χ2的值为()A.2.4 B.4.8C.24 D.48【答案】B4.考察棉花种子是否经过处理跟生病之间的关系得到有关数据,根据数据计算得χ2=0.164,则根据小概率值α=0.1的独立性检验,下列判断正确的是()A.种子是否经过处理跟是否生病有关B.种子是否经过处理跟是否生病无关C.种子是否经过处理决定是否生病D.以上都是错误的【答案】B【解析】由χ2=0.164<2.706=x0.1,即没有充分证据认为种子是否经过处理跟是否生病有关.5.为加强高三学生的素质教育,促进学生全面发展,某校对高三学生文化课与体育课的成绩进行了调查统计,结果如下:文化课体育课合计不及格及格及格57221278不及格164359合计73264337在探究体育课成绩和文化课成绩是否相关时,根据以上数据可得到χ2约为()A.0.004 B.1.255C.2.058 D.38.214【答案】B【解析】由题中数据,知χ2=eq\f(337×(57×43-221×16)2,73×264×278×59)≈1.255.故选B.6.(2024年滨州期末)(多选)为考查某种营养品对儿童身高增长的影响,选取部分儿童进行试验,根据100个有放回简单随机样本的数据,得到如下列联表,由表可知下列说法正确的有()营养品身高合计有明显增长无明显增长食用a1050未食用b3050合计6040100A.a=40B.b=20C.χ2≈12.667D.根据小概率值α=0.001的独立性检验,可以认为该营养品对儿童身高增长有影响【答案】ABD【解析】a=50-10=40,A正确;b=60-a=60-40=20,B正确;零假设为H0:该营养品对儿童身高增长无影响,因为χ2=eq\f(100×(40×30-10×20)2,60×40×50×50)≈16.667>10.828=x0.001,所以根据小概率值α=0.001的独立性检验,推断H0不成立,即可以认为该营养品对儿童身高增长有影响,C错误,D正确.7.根据分类变量x与y的观察数据,计算得到χ2=2.974,根据小概率值α=0.05的独立性检验,分析变量x与y__________(填“相互独立”或“不相互独立”).【答案】相互独立【解析】χ2=2.974<3.841=x0.05,所以分析变量x与y相互独立.8.(2024年烟台期末)已知P(χ2≥6.635)=0.01,P(χ2≥10.828)=0.001.在检验喜欢某项体育运动与性别是否有关的过程中,某研究员搜集数据并计算得到χ2=7.235,则根据小概率值α=________的χ2独立性检验,分析喜欢该项体育运动与性别有关.【答案】0.01【解析】因为6.635<7.235<10.828,所以根据小概率值α=0.01的χ2独立性检验,分析喜欢该项体育运动与性别有关.9.(2024年长春期中)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的eq\f(1,2),男生追星的人数占男生人数的eq\f(1,3),女生追星的人数占女生人数的eq\f(2,3),若根据小概率值α=0.05的独立性检验,判断中学生追星与性别有关,则男生至少有______人.参考数据及公式如下:α0.0500.0100.001xα3.8416.63510.828参考公式:χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),其中n=a+b+c+d.【答案】30【解析】设男生人数为x,依题意可得列联表如下:类别喜欢追星不喜欢追星合计男生eq\f(x,3)eq\f(2x,3)x女生eq\f(x,3)eq\f(x,6)eq\f(x,2)合计eq\f(2x,3)eq\f(5x,6)eq\f(3x,2)根据小概率值α=0.05的独立性检验,判断中学生追星与性别有关,则χ2>3.841,由χ2=eq\f(\f(3x,2)\b\lc\(\rc\)(\a\vs4\al\co1(\f(x2,18)-\f(4x2,9)))\s\up12(2),\f(2x,3)×\f(5x,6)×x×\f(x,2))=eq\f(3,20)x>3.841,解得x>25.61,由题知x应为6的整数倍,∴根据小概率值α=0.05的独立性检验,判断中学生追星与性别有关,则男生至少有30人.10.(2024年潮州期末)人的性格可以大体分为“外向型”和“内向型”两种,树人中学为了了解这两种性格特征与人的性别是否存在关联,采用简单随机抽样的方法抽取90名学生,得到如下数据:性别外向型内向型男性4515女性2010(1)以上述统计结果的频率估计概率,从该校男生中随机抽取2人、女生中随机抽取1人担任志愿者.设这三人中性格外向型的人数为X,求X的数学期望.(2)对表格中的数据,依据α=0.1的独立性检验,可以得出独立性检验的结论是这两种性格特征与人的性别没有关联.如果将表格中的所有数据都扩大为原来10倍,在相同的检验标准下,再用独立性检验推断这两种性格特征与人的性别之间的关联性,得到的结论是否一致?请说明理由.附:参考公式:χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).α0.10.050.01xα2.7063.8416.635解:(1)由统计结果可知,外向型男生在所有男生中占比为eq\f(3,4),外向型女生在所有女生中占比为eq\f(2,3),故从该校男生中随机抽取一人为外向型男生的概率是eq\f(3,4),从该校女生中随机抽取一人为外向型女生的概率是eq\f(2,3).(方法一)X的所有可能取值为0,1,2,3,则P(X=0)=eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(1,4)))eq\s\up12(2)×eq\f(1,3)=eq\f(1,48),P(X=1)=Ceq\o\al(1,2)×eq\f(3,4)×eq\f(1,4)×eq\f(1,3)+eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(1,4)))eq\s\up12(2)×eq\f(2,3)=eq\f(1,6),P(X=2)=eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(3,4)))eq\s\up12(2)×eq\f(1,3)+Ceq\o\al(1,2)×eq\f(3,4)×eq\f(1,4)×eq\f(2,3)=eq\f(21,48),P(X=3)=eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(3,4)))eq\s\up12(2)×eq\f(2,3)=eq\f(3,8),所以E(X)=0×eq\f(1,48)+1×eq\f(1,6)+2×eq\f(21,48)+3×eq\f(3,8)=eq\f(13,6).(方法二)从该校男生中随机抽取2人,抽到性格外向型的人数记为Y1,从该校女生中随机抽取1人,抽到性格外向型的人数记为Y2,则Y1~Beq\b\lc\(\rc\)(\a\vs4\al\co1(2,\f(3,4))),Y2~Beq\b\lc\(\rc\)(\a\vs4\al\co1(1,\f(2,3))),所以E(Y1)=2×eq\f(3,4)=eq\f(3,2),E(Y2)=1×eq\f(2,3)=eq\f(2,3).所以E(X)=E(Y1+Y2)=E(Y1)+E(Y2)=eq\f(3,2)+eq\f(2,3)=eq\f(13,6).(2)零假设为H0:这两种性格特征与人的性别无关联.由所获得的所有数据都扩大为原来10倍,可知χ2=eq\f(900×(450×100-150×200)2,600×300×650×250)=eq\f(90,13)≈6.923>2.706=x0.1,依据α=0.1的独立性检验,可以推断这两种性格特征与人的性别有关联,与原来的结论不一致,原因是每个数据扩大为原来的10倍,相当于样本量变大为原来的10倍,导致推断结论发生了变化.B级——能力提升练11.(多选)有两个分类变量X,Y,其列联表如下:XY合计Y=y1Y=y2X=x1a20-a20X=x215-a30+a45合计155065其中a,15-a均为大于5的整数,若依据α=0.05的独立性检验可以认为Y与X有关,则a的可能取值为()A.6 B.7C.8 D.9【答案】CD【解析】根据a>5且15-a>5,a∈Z,知a可取6,7,8,9,由表中数据及题意,得χ2=eq\f(13×(13a-60)2,20×45×3×2)≥3.841=x0.05,知a可能取值为8,9.12.(2024年海南期末)某制药公司为了验证一种药物对治疗“抑郁症”是否有效,随机选取了100名抑郁症患者进行试验,并根据试验数据得到下列2×2列联表:项目用药未用药症状明显减轻3733症状没有减轻822根据表中数据,计算可得χ2=________(结果精确到0.001),依据小概率值α=________(填临界值表中符合条件的最小值)的独立性检验,可以认为该药物对治疗“抑郁症”是有效的.附:χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828【答案】5.8200.05【解析】由2×2列联表中数据得χ2=eq\f(100(37×22-8×33)2,45×55×70×30)=eq\f(1100,189)≈5.820,因为5.820>3.841=x0.05,所以α=0.05.13.(2024年深圳期末)某花圃为提高某品种花苗质量,开展技术创新活动,A,B在实验地分别用甲、乙方法培育该品种花苗.为观测其生长情况,分别在实验地随机抽取各50株,对每株进行综合评分,将每株所得的综合评分制成如图所示的频率分布直方图.记综合评分为80及以上的花苗为优质花苗.(1)求图中a的值,并求综合评分的中位数;(2)填写下面的2×2列联表,并根据小概率值α=0.005的独立性检验,分析优质花苗与培育方法是否有关,请说明理由.项目优质花苗非优质花苗合计甲培育法20乙培育法10合计解:(1)由直方图的性质,得0.005×10+0.010×10+0.025×10+10a+0.020×10=1,解得a=0.040.因为(0.02+0.04)×10=0.6>0.5,所以中位数位于[80,90)内,设中位数为x,则有0.020×10+0.040×(90-x)=0.5,解得x=82.5.故综合评分的中位数为82.5.(2)由(1)得优质花苗的频率为0.6,所以样本中优质花苗的数量为60,得如下列联表:项目优质花苗非优质花苗合计甲培育法203050乙培育法401050合计6040100零假设为H0:优质花苗与培育方法无关,χ2=eq\f(100×(20×10-30×40)2,60×40×50×50)≈16.667>7.879=x0.005,所以根据小概率值α=0.005的独立性检验,推断H0不成立,即认为优质花苗与培育方法有关.C级——创新拓展练14.(2024年济南模拟)直播带货是助农的一种新模式,这种模式是利用主流媒体的公信力,聚合销售主播的力量助力打通农产品产销链条,切实助力边远地区农民增收.某边远地区有统计数据显示,2023年该地利用网络直播形式销售农产品的销售主播年龄等级分布如图1所示,一周内使用直播销售的频率分布扇形图如图2所示,若将销售主播按照年龄分为年轻人(20岁~39岁)和非年轻人(19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的称为经常使用直播销售用户,使用次数为5次或不足5次的称为不常使用直播销售用户,且经常使用直播销售用户中有eq\f(5,6)是年轻人.图1图2现对该地相关居民进行“经常使用直播销售与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为200的样本,请你根
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度城市基础设施建设债权转让与融资合同
- 2025年度商铺转让三方合同附带品牌授权与培训支持
- 2025年度石料场生产承包环境保护与修复责任合同
- 2025年度教育培训机构兼职正式聘用教学合同
- 2025年度购房合同解除补偿协议范文
- 2025年度农村出租房租赁与农村养老服务业合作合同
- 二零二五年度股权代持协议书:文化娱乐股权代持与IP开发合作合同
- 2025年旅游行业现状分析:国内旅游人次预计达到63亿
- 2024-2025学年北京市二中高三上学期期中调研生物试卷
- 2025年吉林省吉林市单招职业适应性测试题库汇编
- (新版)网络攻防知识考试题库(含答案)
- 建筑工程资料档案盒侧面标签
- 工程设计变更工程量计算表
- 广东粤教版第3册上信息技术课件第5课神奇的变化-制作形状补间动画(课件)
- 动力工程及工程热物理专业英语课件
- 幼儿系列故事绘本课件达芬奇想飞-
- (中职)中职生礼仪实用教材完整版PPT最全教程课件整套教程电子讲义(最新)
- 出纳收入支出日记账Excel模板
- 给水排水用格栅除污机通用技术条件
- 一年级下册综合实践活动课件-身边的水果和蔬菜全国通用16张
- 市政工程主要施工机械设备
评论
0/150
提交评论