2024版新教材高考数学一轮复习第9章统计与统计案例第3节成对数据的统计分析学案含解析新人教A版20230519181_第1页
2024版新教材高考数学一轮复习第9章统计与统计案例第3节成对数据的统计分析学案含解析新人教A版20230519181_第2页
2024版新教材高考数学一轮复习第9章统计与统计案例第3节成对数据的统计分析学案含解析新人教A版20230519181_第3页
2024版新教材高考数学一轮复习第9章统计与统计案例第3节成对数据的统计分析学案含解析新人教A版20230519181_第4页
2024版新教材高考数学一轮复习第9章统计与统计案例第3节成对数据的统计分析学案含解析新人教A版20230519181_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2024版新教材高考数学一轮复习第9章统计与统计案例第3节成对数据的统计分析学案含解析新人教A版20230519181第三节成对数据的统计分析一、教材概念·结论·性质重视1.相关关系两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.2.散点图将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图.利用散点图,可以判断两个变量是否相关,相关时是正相关还是负相关.3.正相关和负相关(1)当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关.(2)负相关:当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关.相关关系与函数关系的区别与联系(1)相同点:两者均是指两个变量的关系.(2)不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系;②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.4.线性相关和非线性相关(1)一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.(2)一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.5.样本相关系数(1)r=eq\f(\o(Σ,\s\up10(n),\s\do6(i=1))(xi-\x\to(x))(yi-\x\to(y)),\r(\o(Σ,\s\up10(n),\s\do6(i=1))(xi-\x\to(x))2)\r(\o(Σ,\s\up10(n),\s\do6(i=1))(yi-\x\to(y))2))=eq\f(\o(Σ,\s\up10(n),\s\do6(i=1))xiyi-n\x\to(x)\x\to(y),\r(\o(Σ,\s\up10(n),\s\do6(i=1))x\o\al(2,i)-n\x\to(x)2)\r(\o(Σ,\s\up10(n),\s\do6(i=1))y\o\al(2,i)-n\x\to(y)2)),称r为变量x和变量y的样本相关系数.(2)样本相关系数r是一个描述成对样本数据的数字特征,它的正负性和绝对值的大小可以反映成对样本数据的变化特征:①当r>0时,称成对样本数据正相关;②当r<0时,称成对样本数据负相关.(3)样本相关系数r的取值范围为[-1,1],样本相关系数r的绝对值大小可以反映成对数据之间线性相关的程度:①当|r|越接近1时,成对数据的线性相关程度越强;②当|r|越接近0时,成对数据的线性相关程度越弱.6.经验回归方程我们将eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,其中(1)经验回归方程不一定都有实际意义.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的经验回归方程才有实际意义.(2)根据经验回归方程进行预报,得到的仅是一个估计值,而不一定是真实发生的值.(3)经验回归直线一定过样本点的中心.7.利用R2刻画回归效果R2的计算公式为R2=1-eq\f(\i\su(i=1,n,)(yi-\o(y,\s\up6(^))i)2,\i\su(i=1,n,)(yi-\x\to(y))2),其意义是R2越大,残差平方和eq\i\su(i=1,n,)(yi-eq\o(y,\s\up6(^))i)2越小,即模型的拟合效果越好;R2越小,残差平方和越大,即模型的拟合效果越差.8.独立性检验(1)χ2的计算公式:记n=a+b+c+d,则χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).(2)利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.(3)应用独立性检验解决实际问题包括以下几个环节:①提出零假设H0:X和Y相互独立,并给出在问题中的解释;②根据抽样数据整理出2×2列联表,计算χ2的值,并与临界xα值比较;③根据检验规则得出推断结论;④在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.根据χ2的值可以判断两个分类变量有关的可信程度.若χ2的值越大,则两个分类变量有关系的把握越大.二、基本技能·思想·活动体验1.判断下列说法的正误,对的打“√”,错的打“×”.(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系. (√)(2)通过经验回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))可以估计预报变量的取值和变化趋势. (√)(3)经验回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))中,若eq\o(a,\s\up6(^))<0,则变量x和y负相关. (×)(4)因为由任何一组观测值都可以求得一个经验回归方程,所以没有必要进行相关性检验. (×)2.(多选题)关于回归分析,下列说法正确的是()A.在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定B.线性相关系数可以是正的也可以是负的C.在回归分析中,如果r2=1或r=±1,说明x与y之间完全线性相关D.样本相关系数r∈(-1,1)ABC解析:选项D中,样本的相关系数应满足-1≤r≤1,故D错误,ABC都正确.3.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的R2分别如下表:甲乙丙丁R20.980.780.500.85建立的回归模型拟合效果最好的是()A.甲B.乙C.丙D.丁A解析:R2越大,表示回归模型的拟合效果越好.4.高二第二学期期中考试,按照甲、乙两个班学生的数学成绩优秀和及格统计人数后,得到如下列联表:优秀及格总计甲班113445乙班83745总计197190则随机变量χ2的值约为()A.0.600B.0.828C.2.712D.6.004A解析:根据列联表中的数据,可得χ2=eq\f(90×(11×37-34×8)2,45×45×19×71)≈0.600.故选A.5.若变量y与x的非线性回归方程是eq\o(y,\s\up6(^))=2eq\r(x)-1,则当eq\o(y,\s\up6(^))的值为2时,x的估计值为________.eq\f(9,4)解析:由2eq\r(x)-1=2,得x=eq\f(9,4),即x的估计值为eq\f(9,4).考点1相关关系的判断——基础性1.(多选题)下列变量之间的关系是相关关系的是()A.二次函数y=ax2+bx+c中,a,c是已知常数,取b为自变量,因变量是判别式Δ=b2-4acB.光照时间和果树亩产量C.降雪量和交通事故发生率D.每亩田施肥量和粮食亩产量BCD解析:在A中,若b确定,则a,b,c都是常数,Δ=b2-4ac也就唯一确定了,因此,这两者之间是确定性的函数关系.一般来说,光照时间越长,果树亩产量越高;降雪量越大,交通事故发生率越高;施肥量越多,粮食亩产量越高,所以B,C,D是相关关系.2.以下是在某地搜集到的不同楼盘房屋的销售价格y(单位:万元)和房屋面积x(单位:m2)的数据:房屋面积x/m211511080135105销售价格y/万元49.643.238.858.444(1)画出数据对应的散点图.(2)判断房屋的销售价格和房屋面积之间是否具有相关关系.如果有相关关系,是正相关还是负相关?解:(1)数据对应的散点图如图所示.(2)通过以上数据对应的散点图可以判断,房屋的销售价格和房屋面积之间具有相关关系,并且是正相关.两个变量是否相关的两种判断方法(1)根据实际经验,借助积累的经验进行分析判断.(2)通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.考点2一元线性回归模型及其应用——应用性考向1线性回归分析维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y来衡量,这个指标越高,耐热水性能也越好.而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x(g/L)去控制这一指标,为此必须找出它们之间的关系.现安排一批实验,获得如下数据:甲醛浓度(g/L)18202224262830缩醛化度(克分子%)26.8628.3528.7528.8729.7530.0030.36(1)画散点图,并判断成对样本数据是否线性相关;(2)求相关系数r(精确到0.01),并通过样本相关系数判断甲醛浓度与缩醛化度的相关程度和变化趋势的异同.解:(1)画出散点图如图所示.由散点图可以看出,成对数据呈现出相关关系.(2)eq\x\to(x)=eq\f(168,7)=24,eq\x\to(y)=eq\f(202.94,7),eq\o(Σ,\s\up10(7),\s\do6(i=1))xiyi=4900.16,eq\o(Σ,\s\up10(7),\s\do6(i=1))xeq\o\al(2,i)=4144,eq\o(Σ,\s\up10(7),\s\do6(i=1))yeq\o\al(2,i)≈5892,所以r=eq\f(\o(Σ,\s\up10(7),\s\do6(i=1))xiyi-7\x\to(x)\x\to(y),\r(\b\lc\(\rc\)(\a\vs4\al\co1(\o(Σ,\s\up10(7),\s\do6(i=1))x\o\al(2,i)-7\x\to(x)2))\b\lc\(\rc\)(\a\vs4\al\co1(\o(Σ,\s\up10(7),\s\do6(i=1))y\o\al(2,i)-7\x\to(y)2))))≈eq\f(4900.16-7×24×\f(202.94,7),\r((4144-7×242)×\b\lc\[\rc\](\a\vs4\al\co1(5892-7×\b\lc\(\rc\)(\a\vs4\al\co1(\f(202.94,7)))eq\s\up8(2)))))≈0.96.由此推断,甲醛浓度与缩醛化度正线性相关,即甲醛浓度与缩醛化度有相同的变化趋势,且相关程度很强.考向2非线性回归分析(2020·南平质检)千百年来,人们一直在通过不同的方式传递信息.在古代,烽火狼烟、飞鸽传书、快马驿站等通信方式被人们广泛传知;第二次工业革命后,科技的进步带动了电讯事业的发展,电报、电话的发明让通信领域发生了翻天覆地的变化;之后,计算机和互联网的出现则使得“千里眼”“顺风耳”变为现实……此时此刻,5G的到来即将给人们的生活带来颠覆性的变革.“5G领先”一方面是源于我国顶层设计的宏观布局,另一方面则来自政府高度重视、企业积极抢滩、企业层面的科技创新能力和先发优势.某科技创新公司基于领先技术的支持,丰富的移动互联网应用等明显优势,随着技术的不断完善,该公司的5G经济收入在短期内逐月攀升.业内预测,该创新公司在第1个月至第7个月的5G经济收入y(单位:百万元)关于月份x的数据如下表:时间(月份)1234567收入(百万元)611213466101196根据以上数据绘制如下散点图.(1)为了更充分运用大数据、人工智能、5G等技术,公司需要派出员工实地检测产品性能和使用状况.公司领导要从报名的五名科技人员A,B,C,D,E中随机抽取3个人前往,则A,B同时被抽到的概率为多少?(2)根据散点图判断,y=ax+b与y=c·dx(a,b,c,d均为大于零的常数)哪一个适宜作为5G经济收入y关于月份x的经验回归方程类型?(给出判断即可,不必说明理由)并根据你判断结果及表中的数据,求出y关于x的回归方程.(3)请你预测该公司8月份的5G经济收入.参考数据:eq\o(Σ,\s\up10(7),\s\do6(i=1))yieq\o(Σ,\s\up10(7),\s\do6(i=1))lgyieq\o(Σ,\s\up10(7),\s\do6(i=1))xiyieq\o(Σ,\s\up10(7),\s\do6(i=1))xivi100.45100.5443.510.78253550.122.823.47v=lgy,vi=lgyi.参考公式:对于一组具有线性相关关系的数据(xi,vi)(i=1,2,3,…,n),其经验回归直线eq\o(v,\s\up6(^))=eq\o(β,\s\up6(^))x+eq\o(α,\s\up6(^))的斜率和截距的最小二乘估计公式分别为eq\o(β,\s\up6(^))=eq\f(\o(Σ,\s\up10(n),\s\do6(i=1))xivi-n\x\to(x)\x\to(v),\o(Σ,\s\up10(n),\s\do6(i=1))x\o\al(2,i)-n\x\to(x)2),eq\o(α,\s\up6(^))=eq\x\to(v)-eq\o(β,\s\up6(^))eq\x\to(x).解:(1)从报名的科技人员A,B,C,D,E中随机抽取3个人,则所有的情况为{A,B,C},{A,B,D},{A,B,E},{A,C,D},{A,C,E},{A,D,E},{B,C,D},{B,C,E},{B,D,E},{C,D,E},共10种.记“A,B同时被抽到”为事件Q,则事件Q包含的样本点为{A,B,C},{A,B,D},{A,B,E},共3个,故P(Q)=eq\f(3,10).(2)根据散点图判断,y=c·dx适宜作为5G经济收入y关于月份x的回归方程类型.由y=c·dx,两边同时取常用对数得lgy=lg(c·dx)=lgc+xlgd.设lgy=v,所以v=lgc+xlgd.因为eq\x\to(x)=eq\f(1,7)×(1+2+3+4+5+6+7)=4,所以eq\x\to(v)=eq\f(1,7)eq\o(Σ,\s\up10(7),\s\do6(i=1))vi=eq\f(1,7)eq\o(Σ,\s\up10(7),\s\do6(i=1))lgyi=eq\f(1,7)×10.78=1.54,eq\o(Σ,\s\up10(7),\s\do6(i=1))xeq\o\al(2,i)=12+22+32+42+52+62+72=140,所以lgeq\o(d,\s\up6(^))=eq\f(eq\o(Σ,\s\up10(7),\s\do6(i=1))xivi-7\x\to(x)\x\to(y),eq\o(Σ,\s\up10(7),\s\do6(i=1))x\o\al(2,i)-7\x\to(x)2)=eq\f(50.12-7×4×1.54,140-7×42)=eq\f(7,28)=0.25.把样本中心(4,1.54)的坐标代入eq\x\to(v)=lgeq\o(c,\s\up6(^))+lgeq\o(d,\s\up6(^))·x,得1.54=lgeq\o(c,\s\up6(^))+0.25×4,所以lgeq\o(c,\s\up6(^))=0.54,所以eq\o(v,\s\up6(^))=0.54+0.25x,所以lgeq\o(y,\s\up6(^))=0.54+0.25x,所以y关于x的回归方程为eq\o(y,\s\up6(^))=100.54+0.25x=3.47×100.25x.(3)当x=8时,eq\o(y,\s\up6(^))=100.54+0.25x=3.47×100.25×8=347,所以预测8月份的5G经济收入为347百万元.非线性回归分析的步骤非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步骤如下:(2020·广州一模)某种昆虫的日产卵数和时间变化有关,现收集了该昆虫第1天到第5天的日产卵数据:第x天12345日产卵数y(个)612254995对数据初步处理后得到了如图所示的散点图和表中的统计量的值.eq\o(Σ,\s\up6(5),\s\do6(i=1))xieq\o(Σ,\s\up6(5),\s\do6(i=1))xeq\o\al(2,i)eq\o(Σ,\s\up6(5),\s\do6(i=1))(lnyi)eq\o(Σ,\s\up6(5),\s\do6(i=1))(xi·lnyi)155515.9454.75(1)根据散点图,利用计算机模拟出该种昆虫日产卵数y关于x的经验回归方程为y=ea+bx(其中e为自然对数的底数),求实数a,b的值(精确到0.1).(2)根据某项指标测定,若日产卵数在区间(e6,e8)上的时段为优质产卵期.利用(1)的结论,估计在第6天到第10天中任取2天,其中恰有1天为优质产卵期的概率.附:对于一组数据(v1,μ1),(v2,μ2),…,(vn,μn),其经验回归直线的斜率和截距的最小二乘估计公式分别为eq\o(β,\s\up6(^))=eq\f(\o(Σ,\s\up10(n),\s\do6(i=1))viui-n\x\to(v)\x\to(u),\o(Σ,\s\up10(n),\s\do6(i=1))v\o\al(2,i)-n\x\to(v)2),eq\o(α,\s\up6(^))=eq\x\to(u)-eq\o(β,\s\up6(^))·eq\x\to(v).解:(1)因为y=ea+bx,两边取自然对数,得lny=a+bx.令m=x,n=lny,得n=a+bm.因为eq\o(b,\s\up6(^))=eq\f(54.75-5×\f(15,5)×\f(15.94,5),55-5×32)=eq\f(6.93,10)=0.693,所以b≈0.7.因为eq\o(a,\s\up6(^))=eq\x\to(n)-eq\o(b,\s\up6(^))eq\x\to(m)=eq\f(15.94,5)-0.7×3=1.088,所以a≈1.1,即a≈1.1,b≈0.7.(2)根据(1)得y=e1.1+0.7x.由e6<e1.1+0.7x<e8,得7<x<eq\f(69,7).所以在第6天到第10天中,第8,9天为优质产卵期.从未来第6天到第10天中任取2天的所有可能事件有(6,7),(6,8),(6,9),(6,10),(7,8),(7,9),(7,10),(8,9),(8,10),(9,10),共10种.其中恰有1天为优质产卵期的有(6,8),(6,9),(7,8),(7,9),(8,10),(9,10),共6种.设从未来第6天到第10天中任取2天,其中恰有1天为优质产卵期的事件为A,则P(A)=eq\f(6,10)=eq\f(3,5).所以从未来第6天到第10天中任取2天,其中恰有1天为优质产卵期的概率为eq\f(3,5).考点3残差分析——基础性(2020·聊城6月高三模拟)2019年上半年我国多个省市暴发了“非洲猪瘟”疫情,生猪大量病死,存栏量急剧下降,一时间猪肉价格暴涨,其他肉类价格也跟着大幅上扬,严重影响了居民的生活.为了解决这个问题,我国政府一方面鼓励有条件的企业和散户防控疫情,扩大生产;另一方面积极向多个国家开放猪肉进口,扩大肉源,确保市场供给稳定.某大型生猪生产企业分析当前市场形势,决定响应政府号召,扩大生产决策层调阅了该企业过去生产相关数据,就“一天中一头猪的平均成本与生猪存栏数量之间的关系”进行研究.现相关数据统计如下表:生猪存栏数量x(千头)23458头猪每天平均成本y(元)3.22.421.91.5(1)研究员甲根据以上数据认为y与x具有线性回归关系,请帮他求出y关于x的线性回归方程eq\o(y,\s\up6(^))(1)=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))(计算结果精确到0.01).(2)研究员乙根据以上数据得出y与x的回归模型:eq\o(y,\s\up6(^))(2)=eq\f(4.8,x)+0.8.为了评价两种模型的拟合效果,请完成以下任务:①完成下表(计算结果精确到0.01)(备注:eq\o(e,\s\up6(^))i称为对于点(xi,yi)的残差);生猪存栏数量x(千头)23458头猪每天平均成本y(元)3.22.421.91.5模型甲估计值eq\o(y,\s\up6(^))eq\o\al((1),i)残差eq\o(e,\s\up6(^))eq\o\al((1),i)模型乙估计值eq\o(y,\s\up6(^))eq\o\al((2),i)3.22.421.761.4残差eq\o(e,\s\up6(^))eq\o\al((2),i)0000.140.1②分别计算模型甲与模型乙的残差平方和Q1及Q2,并通过比较Q1,Q2的大小,判断哪个模型拟合效果更好.(3)根据市场调查,生猪存栏数量达到1万头时,饲养一头猪每一天的平均收入为7.5元;生猪存栏数量达到1.2万头时,饲养一头猪每一天的平均收入为7.2元.若按(2)中拟合效果较好的模型计算一天中一头猪的平均成本,问:该生猪存栏数量选择1万头还是1.2万头能获得更多利润?请说明理由.(利润=收入-成本)参考数据:eq\o(Σ,\s\up10(5),\s\do6(i=1))(xi-eq\x\to(x))(y1-eq\x\to(y))=-5.3,eq\o(Σ,\s\up10(5),\s\do6(i=1))(xi-eq\x\to(x))2=21.2.解:(1)由题知:eq\o(x,\s\up6(-))=4.4,eq\o(y,\s\up6(-))=2.2,eq\o(b,\s\up6(^))=eq\f(\o(Σ,\s\up10(n),\s\do6(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\o(Σ,\s\up10(n),\s\do6(i=1))(xi-\o(x,\s\up6(-)))2)=eq\f(-5.3,21.2)=-0.25,eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\x\to(x)=2.2+0.25×4.4=3.30,故eq\o(y,\s\up6(^))(1)=-0.25x+3.30.(2)①经计算,可得下表:生猪存栏数量x(千头)23458头猪每天平均成本y(元)3.22.421.91.5模型甲估计值eq\o(y,\s\up6(^))eq\o\al((1),i)2.802.552.302.051.30残差eq\o(e,\s\up6(^))eq\o\al((1),i)0.40-0.15-0.30-0.150.20模型乙估计值eq\o(y,\s\up6(^))eq\o\al((2),i)3.22.421.761.4残差eq\o(e,\s\up6(^))eq\o\al((2),i)0000.140.1Q1=(0.40)2+(-0.15)2+(-0.30)2+(-0.15)2+(0.20)2=0.335,Q2=(0.14)2+(0.1)2=0.0296.因为Q1>Q2,故模型eq\o(y,\s\up6(^))(2)=eq\f(4.8,x)+0.8的拟合效果更好.(3)若生猪存栏数量达到1万头,由(2)中模型乙可知,每头猪的成本为eq\f(4.8,10)+0.8=1.28(元),这样一天获得的总利润为(7.5-1.28)×10000=62200(元);若生猪存栏数量达到1.2万头,由(2)中模型乙可知,每头猪的成本为eq\f(4.8,12)+0.8=1.2(元),这样一天获得的总利润为(7.2-1.2)×12000=72000(元).因为72000>62200,所以选择生猪存栏数量1.2万头能获得更多利润.在进行线性回归分析时,要按线性回归分析步骤进行.在求R2时,通常采用分步计算的方法,R2越大,模型的拟合效果越好.关于x与y有如下数据:x24568y3040605070有如下的两个线性模型:(1)eq\o(y,\s\up6(^))=6.5x+17.5;(2)eq\o(y,\s\up6(^))=7x+17.试比较哪一个拟合效果更好.解:由(1)可得yi-eq\o(y,\s\up6(^))i与yi-eq\x\to(y)的关系如下表:yi-eq\o(y,\s\up6(^))i-0.5-3.510-6.50.5yi-eq\x\to(y)-20-1010020所以eq\o(Σ,\s\up10(5),\s\do6(i=1))(yi-eq\o(y,\s\up6(^))i)2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155,eq\o(Σ,\s\up10(5),\s\do6(i=1))(yi-eq\x\to(y))2=(-20)2+(-10)2+102+02+202=1000.所以Req\o\al(2,1)=1-eq\f(eq\o(Σ,\s\up10(5),\s\do6(i=1))(yi-\o(y,\s\up6(^))i)2,eq\o(Σ,\s\up10(5),\s\do6(i=1))(yi-\x\to(y))2)=1-eq\f(155,1000)=0.845.由(2)可得yi-eq\o(y,\s\up6(^))i与yi-eq\x\to(y)的关系如下表:yi-eq\o(y,\s\up6(^))i-1-58-9-3yi-eq\x\to(y)-20-1010020所以eq\o(Σ,\s\up10(5),\s\do6(i=1))(yi-eq\o(y,\s\up6(^))i)2=(-1)2+(-5)2+82+(-9)2+(-3)2=180,所以Req\o\al(2,2)=1-eq\f(eq\o(Σ,\s\up10(5),\s\do6(i=1))(yi-\o(y,\s\up6(^))i)2,eq\o(Σ,\s\up10(5),\s\do6(i=1))(yi-\x\to(y))2)=1-eq\f(180,1000)=0.82.所以Req\o\al(2,1)>Req\o\al(2,2).所以(1)的拟合效果更好.考点4列联表与独立性检验——综合性某省进行高中新课程改革已经四年了,为了了解教师对新课程教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查.共调查了50人,其中有老教师20人,青年教师30人.老教师对新课程教学模式赞同的有10人,不赞同的有10人;青年教师对新课程教学模式赞同的有24人,不赞同的有6人.(1)根据以上数据建立一个2×2列联表;(2)依据小概率α=0.001值,能否推断青年教师和老教师在新课程教学模式的使用上有差异?解:(1)2×2列联表如下所示.赞同不赞同总计老教师101020青年教师24630总计341650(2)假设H0:青年教师和老教师在新课程教学模式的使用上没有差异.由公式得χ2=eq\f(50×(10×6-24×10)2,34×16×20×30)≈4.963<10.828=x0.001,我们推断H0不成立,即认为青年教师和老教师在新课程教学模式的使用上有差异,此推断犯错误的概率不大于0.001.(1)利用χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))求出χ2的值.再利用小概率α的值以及对应的临界值来判断有多大的把握判断两个事件有关.(2)解题时应注意准确计算,不可错用公式,准确进行比较与判断.(2020·新高考全国卷Ⅰ)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表SO2PM2.5[0,50](50,150](150,475][0,35]32184(35,75]6812(75,115]3710(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;(2)根据所给数据,完成下面的2×2列联表:SO2PM2.5[0,150](150,475][0,75](75,115](3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?解:(1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且SO2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150的概率p=eq\f(64,100)=0.64.(2)根据抽查数据,可得2×2列联表如下:SO2PM2.5[0,150](150,475][0,75]6416(75,115]1010(3)根据(2)的列联表得χ2=eq\f(100×(64×10-16×10)2,74×26×20×80)≈7.484.因为7.484>6.635,故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关. 第9章统计与统计案例九多选题命题热点之统计统计中的多选题主要考查统计图表的识图和用图、样本的数字特征的计算以及用样本估计总体的方法与应用等,综合性一般较强.解答统计类的多选题,要熟练掌握统计图表的相关知识方法、样本的集中趋势与离散程度的估计方法.统计图表及应用(2020·滨州三模)2020年3月12日,国务院新闻办公室发布会重点介绍了改革开放40年,特别是党的十八大以来我国脱贫攻坚、精准扶贫取得的显著成绩,这些成绩为全面脱贫初步建成小康社会奠定了坚实的基础.下图是统计局公布的2010~2019年年底的贫困人口和贫困发生率统计表,则下列结论正确的是()(年底贫困人口的经验回归方程为eq\o(y,\s\up6(^))=-1609.9x+15768,其中x=年份-2009,贫困发生率的经验回归方程为eq\o(y,\s\up6(^))=-1.6729x+16.348,其中x=年份-2009)A.2010~2019年十年间脱贫人口逐年减少,贫困发生率逐年下降B.2012~2019年连续八年每年减贫超过1000万,且2019年贫困发生率最低C.2010~2019年十年间超过1.65亿人脱贫,其中2015年贫困发生率低于6%D.根据图中趋势线可以预测,到2020年底我国将实现全面脱贫BD解析:每年脱贫的人口如下表所示.期初期末脱贫人口2009年底至2010年年底165662010年底至2011年年底165661223843282011年底至2012年年底12238989923392012年底至2013年年底9899824916502013年底至2014年年底8249701712322014年底至2015年年底 7017557514422015年底至2016年年底5575433512402016年底至2017年年底4335304612892017年底至2018年年底3046166013862018年底至2019年年底16605511109由于缺少2009年年底数据,故无法统计十年间脱贫人口的数据,故AC选项错误.根据上表可知:2012~2019年连续八年每年减贫超过1000万,且2019年贫困发生率最低,故B选项正确.根据上表可知,2012~2019年连续八年每年减贫超过1000万,2019年年底,贫困人口为551万,故预计到2020年底我国将实现全面脱贫,故D选项正确.综上所述,正确的选项为BD.(1)经常考查的统计图表有条形图、折线图、扇形图、频率分布直方图等,试题一般以生产生活的具体实例或时事热点为背景,考查数据处理的能力.(2)解决此类问题要准确地识图,清楚图中横轴与纵轴所表示的量,图中折线的变化趋势及对应的意义,提取关键信息,对照选项作答.(多选题)如图是国家统计局发布的2018年3月到2019年3月全国居民消费价格的涨跌幅情况折线图(注:2019年2月与2018年2月相比较称同比,2019年2月与2019年1月相比较称环比).根据该折线图,下列结论正确的是()A.2018年3月至2019年3月全国居民消费价格同比均上涨B.2018年3月至2019年3月全国居民消费价格环比有涨有跌C.2019年3月全国居民消费价格同比涨幅最大D.2019年3月全国居民消费价格环比变化最快ABD解析:对于选项A,从图中可以看出同比涨跌幅均为正数,故A正确;对于选项B,从图中可以看出

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论