2024-2025学年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用学案含解析新人教A版选修2-31_第1页
2024-2025学年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用学案含解析新人教A版选修2-31_第2页
2024-2025学年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用学案含解析新人教A版选修2-31_第3页
2024-2025学年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用学案含解析新人教A版选修2-31_第4页
2024-2025学年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用学案含解析新人教A版选修2-31_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGE第三章统计案例,你坐过火车、乘过飞机吗?晕车、晕机与性别有无关系?肺癌是人类的一大杀手,吸烟与患肺癌的关联性原委有多大?你了解过你们班同学的身高与体重吗,身高与体重是否线性相关?你统计过你们班同学的考试成果吗,物理成果的凹凸与数学成果关联度有多大?……这些都是统计学探讨的内容.本章我们将要学习独立性检验和回来分析的基本思想、方法.学习本章要留意学习收集、整理、分析数据的方法,体会统计分析的基本思想、建模思想和现代计算技术在统计中的应用,体会统计思维和确定性思维的差异.3.1回来分析的基本思想及其初步应用自主预习·探新知情景引入2024年6月17日四川宜宾发生6.1级地震,此后40分钟内连发四次余震,最高震级5.1级,此次地震余震频繁而且震级还高,你知道地震的震级与地震次数之间有什么关系吗?新知导学一、回来直线方程1.回来分析是处理两个变量之间__相关关系__的一种统计方法.若两个变量之间具有线性相关关系,则称相应的回来分析为__线性回来分析__.2.回来直线方程为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),其中eq\o(b,\s\up6(^))=__eq\f(\o(∑,\s\up6(n))\o(,\s\do4(i=1))xi-\x\to(x)yi-\x\to(y),\o(∑,\s\up6(n))\o(,\s\do4(i=1))xi-\x\to(x)2)__eq\o(a,\s\up6(^))=__eq\a\vs4\al(\x\to(y)-\o(b,\s\up6(^))\x\to(x))__,__(eq\x\to(x),eq\x\to(y))__称为样本点的中心.3.线性相关关系强与弱的推断:用__相关系数r__来描述线性相关关系的强弱.对于变量x、y随机抽取到的n对数据(x1,y1)、(x2,y2)、…、(xn,yn),其相关系数r=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\r(\i\su(i=1,n,)xi-\x\to(x)2\i\su(i=1,n,)yi-\x\to(y)2))=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\r(\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2\i\su(i=1,n,y)\o\al(2,i)-n\x\to(y)2)).当r>0时,表明两个变量__正相关__;当r<0时,表明两个变量__负相关__.r的肯定值越接近1,表明两个变量的线性相关性越__强__;r的肯定值接近于0时,表明两个变量之间几乎不存在线性相关关系.通常当|r|大于__0.75__时,认为两个变量有很强的线性相关关系.二、线性回来分析1.随机误差(1)随机误差的概念:当样本点散布在某一条直线的旁边,而不是在一条直线上时,不能用一次函数y=bx+a来描述两个变量之间的关系,而是用线性回来模型__y=bx+a+e__来表示,这里__x__称为说明变量,__y__称为预报变量,__e__称为随机误差,E(e)=__0__,D(e)=__σ2__.(2)随机误差及其产生的缘由从散点图中我们可以看到,样本点散布在某一条直线旁边,而不是在一条直线上,所以不能用一次函数y=bx+a来描述它们之间的关系,我们用下面的线性回来模型来表示:y=bx+a+e,其中a、b为模型的未知数,e称为随机误差.产生随机误差的主要缘由有以下3个方面:①用线性回来模型近似真实模型(真实模型是客观存在的,通常我们并不知道真实模型是什么)所引起的误差.可能存在非线性的函数能更好地描述y与x之间的关系,但是现在却用线性函数来表述这种关系,结果会产生误差.这种由模型近似所引起的误差包含在e中.②忽视了某些因素的影响.影响变量y的因素不只变量x,可能还包括其他很多因素(例如在描述身高和体重关系的模型中,体重不仅受身高的影响,还会受遗传基因、饮食习惯、生长环境等其他因素的影响),它们的影响都体现在e中.③观测误差.由于测量工具等缘由,导致y的观测值产生误差(比如一个人的体重是确定的数,但由于测量工具的影响和测量人技术的影响可能会得到不同的观测值,与真实值之间存在误差),这样的误差也包含在e中.2.残差对于样本点(x1,y1)、(x2,y2)、…、(xn,yn),其回来方程为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),用eq\o(y,\s\up6(^))作为回来模型eq\b\lc\{\rc\(\a\vs4\al\co1(y=bx+a+e,Ee=0,De=σ2))中bx+a的估计值,随机误差ei=yi-bxi-a的估计值eq\o(e,\s\up6(^))i=__yi-eq\o(b,\s\up6(^))xi-eq\o(a,\s\up6(^))__(i=1,2,…,n),称为相应于点(xi,yi)的残差.3.残差图以__残差__为纵坐标,__样本编号__(或身高数据,或体重的估计值等)为横坐标作出的图形,称为残差图.4.在线性回来模型中,R2表示说明变量对预报变量改变的__贡献率__.R2越接近于1,表示说明变量和预报变量的线性相关性越强;反之,R2越小,说明随机误差对预报变量的效应越大.相关指数R2的计算公式是R2=1-eq\f(\o(∑,\s\up6(n))\o(,\s\do4(i=1))yi-\o(y,\s\up6(^))i2,\o(∑,\s\up6(n))\o(,\s\do4(i=1))yi-\x\to(y)2).R2的值越大,说明残差平方和越小,也就是说模型的拟合效果(即回来效果)越__好__.在含有一个说明变量的线性模型中,R2恰好等于__相关系数r__的平方.预习自测1.在对两个变量x,y进行线性回来分析时,有下列步骤:①对所求出的回来直线方程作出说明;②收集数据(xi,yi),i=1,2,…,n;③求线性回来方程;④求相关系数;⑤依据所搜集的数据绘制散点图.假如依据可行性要求能够作出变量x,y具有线性相关的结论,则在下列操作依次中正确的是(D)A.①②⑤③④ B.③②④⑤①C.②④③①⑤ D.②⑤④③①[解析]对两个变量进行回来分析时,首先收集数据(xi,yi),i=1,2,…,n;依据所搜集的数据绘制散点图.视察散点图的形态,推断线性相关关系的强弱,求相关系数,写出线性回来方程,最终依据所求出的回来直线方程作出说明;故正确依次是②⑤④③①,故选D.2.(2024·南充模拟)已知变量x与变量y之间具有相关关系,并测得如下一组数据:x651012y6532则变量x与y之间的线性回来直线方程可能为(B)A.eq\o(y,\s\up6(^))=0.7x-2.3 B.eq\o(y,\s\up6(^))=-0.7x+10.3C.eq\o(y,\s\up6(^))=-10.3x+0.7 D.eq\o(y,\s\up6(^))=10.3x-0.7[解析]依据表中数据,得;eq\x\to(x)=eq\f(1,4)(6+5+10+12)=eq\f(33,4),eq\x\to(y)=eq\f(1,4)(6+5+3+2)=4,且变量y随变量x的增大而减小,是负相关,所以,验证eq\x\to(x)=eq\f(33,4)时,eq\o(y,\s\up6(^))=-0.7×eq\f(33,4)+10.3≈4,即回来直线eq\o(y,\s\up6(^))=-0.7x+10.3过样本中心点(eq\x\to(x),eq\x\to(y)).故选B.3.(2024·武汉高二检测)在一次对人体脂肪含量和年龄关系的探讨中,探讨人员获得了一组样本数据:年龄2327394145495053565860脂肪9.517.821.225.927.526.328.229.631.433.535.2通过计算得到回来方程为eq\o(y,\s\up6(^))=0.577x-0.448,利用这个方程,我们得到年龄37岁时体内脂肪含量为20.90%,那么数据20.90%的意义是(D)A.某人年龄37岁,他体内脂肪含量为20.90%B.某人年龄37岁,他体内脂肪含量为20.90%的概率最大C.某人年龄37岁,他体内脂肪含量的期望值为20.90%D.20.90%是对年龄为37岁的人群中的大部分人的体内脂肪含量所作出的估计[解析]利用回来方程eq\o(y,\s\up6(^))=0.577x-0.448,可得x=37时,eq\o(y,\s\up6(^))=20.901,即到年龄37岁时体内脂肪含量约为20.90%,故20.90%是对年龄为37岁的人群中的大部分人的体内脂肪含量所作出的估计,故选D.4.为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了100次和150次试验,并且利用线性回来方法,求得回来直线分别为l1和l2,已知两个人在试验中发觉对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是(A)A.l1和l2有交点(s,t)B.l1与l2相交,但交点不肯定是(s,t)C.l1与l2必定平行D.l1与l2必定重合[解析]由题意知(s,t)是甲、乙两位同学所做试验的样本点的中心,而线性回来直线恒过样本点的中心,故选A.5.(2024·全国卷Ⅰ)某校一个课外学习小组为探讨某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽试验,由试验数据得到下面的散点图:由此散点图,在10℃至40℃之间,下面四个回来方程类型中最相宜作为发芽率y和温度x的回来方程类型的是(D)A.y=a+bx B.y=a+bx2C.y=a+bex D.y=a+blnx[解析]由散点图分布可知,散点图分布在一个对数函数的图象旁边,因此,最适合作为发芽率y和温度x的回来方程类型的是y=a+blnx.故选D.互动探究·攻重难互动探究解疑命题方向❶变量间的相关性检测典例1关于两个变量x和y的7组数据如下表所示:x21232527293235y711212466115325试推断y与x是否线性相关.[解析]eq\o(x,\s\up6(-))=eq\f(1,7)(21+23+25+27+29+32+35)≈27.4,eq\o(y,\s\up6(-))=eq\f(1,7)(7+11+21+24+66+115+325)≈81.3,eq\i\su(i=1,7,x)eq\o\al(2,i)=212+232+252+272+292+322+352=5414,eq\i\su(i=1,7,x)iyi=21×7+23×11+25×21+27×24+29×66+32×115+35×325=18542.eq\i\su(i=1,7,y)eq\o\al(2,i)=72+112+212+242+662+1152+3252=124393,∴r=eq\f(\i\su(i=1,7,x)iyi-7\o(x,\s\up6(-))\o(y,\s\up6(-)),\r(\i\su(i=1,7,x)\o\al(2,i)-7\x\to(x)2\i\su(i=1,7,y)\o\al(2,i)-7\x\to(y)2))=eq\f(18542-7×27.4×81.3,\r(5414-7×27.42×124393-7×81.32))≈eq\f(2948.66,3520.92)=0.8639.由于r=0.8639>0.75,∴x与y具有线性相关关系.『规律总结』变量间是否具有线性相关关系,可通过散点图或相关系数作出推断,散点图只是粗略作出推断,用相关系数能够较精确的推断相关的程度.┃┃跟踪练习1__■现随机抽取了我校10名学生在入学考试中的数学成果(x)与入学后的第一次考试数学成果(y),数据如下表:学生号12345678910x12010811710410311010410599108y84648468696869465771请问:这10个学生的两次数学考试成果是否具有显著的线性相关关系?[解析]eq\o(x,\s\up6(-))=eq\f(1,10)(120+108+…+99+108)=107.8,eq\o(y,\s\up6(-))=eq\f(1,10)(84+64+…+57+71)=68,eq\i\su(i=1,10,x)eq\o\al(2,i)=1202+1082+…+992+1082=116584,eq\i\su(i=1,10,y)eq\o\al(2,i)=842+642+…+572+712=47384,eq\i\su(i=1,10,x)iyi=120×84+108×64+…+108×71=73796,所以,相关系数为r=eq\f(73796-10×107.8×68,\r(116584-10×107.8247384-10×682))≈0.7506,由0.7506>0.75知,两次数学考试成果有显著的线性相关关系.命题方向❷求线性回来方程典例2某班5名学生的数学和物理成果如表:学生学科成果ABCDE数学成果(x)8876736663物理成果(y)7865716461(1)画出散点图;(2)求物理成果y对数学成果x的线性回来方程;(3)一名学生的数学成果是96,预料他的物理成果.[解析](1)散点图如图.(2)eq\x\to(x)=eq\f(1,5)×(88+76+73+66+63)=73.2,eq\x\to(y)=eq\f(1,5)×(78+65+71+64+61)=67.8.eq\i\su(i=1,5,x)iyi=88×78+76×65+73×71+66×64+63×61=25054.eq\i\su(i=1,5,x)eq\o\al(2,i)=882+762+732+662+632=27174,所以=eq\f(\i\su(i=1,5,x)iyi-5\x\to(x)·\x\to(y),\i\su(i=1,5,x)\o\al(2,i)-5\x\to(x)2)≈0.625,=eq\x\to(y)-eq\x\to(x)≈67.8-0.625×73.2=22.05,所以y对x的回来直线方程是=0.625x+22.05.(3)当x=96时,=0.625×96+22.05≈82,即可以预料他的物理成果是82.『规律总结』1.散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,从图中看它们有无关系,关系的亲密程度,再进行相关的回来分析.2.求回来直线方程,首先应留意到,只有在散点图大致呈线性时,求出的回来直线方程才有实际意义,否则,求出的回来直线方程毫无意义.┃┃跟踪练习2__■(2024·湖南郴州质检)为了探究车流量与PM2.5的浓度是否相关,现采集到北方某城市2024年12月份某星期星期一到星期日某一时间段车流量与PM2.5的数据如下表:时间星期一星期二星期三星期四星期五星期六星期日车流量x/万辆1234567PM2.5的浓度y(微克/立方米)28303541495662(1)由散点图知y与x具有线性相关关系,求y关于x的线性回来方程;(2)①利用(1)所求的回来方程,预料该市车流量为8万辆时PM2.5的浓度;②规定:当一天内PM2.5的浓度平均值在(0,50]内,空气质量等级为优;当一天内PM2.5的浓度平均值在(50,100]内,空气质量等级为良.为使该市某日空气质量为优或良,则应限制当天车流量在多少万辆以内?(结果以万辆为单位,保留整数.)参考公式:回来直线的方程是eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),其中eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x).[解析](1)由数据可得eq\x\to(x)=eq\f(1,7)(1+2+3+4+5+6+7)=4,eq\x\to(y)=eq\f(1,7)(28+30+35+41+49+56+62)=43,eq\i\su(i=1,7,x)iyi=1372,eq\i\su(i=1,7,x)eq\o\al(2,i)=140,eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,7,x)iyi-7\x\to(x)\x\to(y),\i\su(i=1,7,x)\o\al(2,i)-7\x\to(x)2)=eq\f(1372-1204,140-112)=6,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=43-6×4=19,故y关于x的线性回来方程为eq\x\to(y)=6x+19.(2)①当车流量为8万辆,即x=8时,eq\o(y,\s\up6(^))=6×8+19=67.故当车流量为8万辆时,PM2.5的浓度约为67微克/立方米.②依据题意得6x+19≤100,即x≤13.5,故要使该市某日空气质量为优或良,应限制当天车流量在13万辆以内.命题方向❸线性回来分析典例3某运动员训练次数与训练成果之间的数据关系如下:次数(x)3033353739444650成果(y)3034373942464851(1)作出散点图;(2)求出回来方程;(3)作出残差图;(4)计算R2,并说明运动员的训练次数对成果的影响占百分之几.[解析](1)作出该运动员训练次数x与成果y的散点图,如图所示.由散点图可知,它们之间具有相关关系.(2)eq\x\to(x)=39.25,eq\x\to(y)=40.875,eq\i\su(i=1,8,x)eq\o\al(2,i)=12656,eq\i\su(i=1,8,x)iyi=13180,所以eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,8,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,8,)xi-\x\to(x)2)≈1.0415,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=-0.003875,∴回来直线方程为eq\o(y,\s\up6(^))=1.0415x-0.003875.(3)残差分析:下面的表格列出了运动员训练次数和成果的原始数据以及相应的残差数据.xyeq\o(e,\s\up6(^))=y-eq\o(y,\s\up6(^))3030-1.24113334-0.365635370.551437390.468439421.385444460.177946480.09495051-1.0711作残差图如图所示.由图可知,残差点比较匀称地分布在水平带状区域内,说明选择的模型比较合适.(4)计算相关指数R2≈0.9855,说明白该运动员的成果的差异有98.55%是由训练次数引起的.『规律总结』1.解答本类题目应先通过散点图来分析两个变量间的关系是否线性相关,再利用求回来方程的公式求解回来方程,并利用残差图或R2来分析函数模型的拟合效果,在此基础上,借助回来方程对实际问题进行分析.2.“R2、残差图”在回来分析中的作用:(1)R2是用来刻画回来效果的,由R2=1-eq\f(\i\su(i=1,n,)yi-\o(y,\s\up6(^))i2,\i\su(i=1,n,)yi-\x\to(y)2)可知R2越大,意味着残差平方和越小,也就是说模型的拟合效果就越好.(2)残差图也是用来刻画回来效果的,推断依据是:残差点比较匀称地分布在水平带状区域中,带状区域越窄,说明模型拟合精度越高,回来方程预报精度越高.┃┃跟踪练习3__■为探讨质量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同质量的6个物体进行测量,数据如表所示:x51015202530y7.258.128.959.9010.911.8(1)作出散点图,并求线性回来方程;(2)求出R2;(3)进行残差分析.[解析](1)散点图如图所示.因为eq\o(x,\s\up6(-))=eq\f(1,6)×(5+10+15+20+25+30)=17.5,eq\o(y,\s\up6(-))=eq\f(1,6)×(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487,eq\i\su(i=1,6,x)eq\o\al(2,i)=2275,eq\i\su(i=1,6,x)iyi=1076.2计算得,eq\o(b,\s\up6(^))≈0.183,eq\o(a,\s\up6(^))≈6.285,所求线性回来方程为eq\o(y,\s\up6(^))=0.183x+6.285.(2)列表如下:yi-eq\o(y,\s\up6(^))i0.050.005-0.08-0.0450.040.025yi-eq\o(y,\s\up6(-))-2.24-1.37-0.540.411.412.31所以eq\i\su(i=1,6,)(yi-eq\o(y,\s\up6(^))i)2≈0.01318,eq\i\su(i=1,6,)(yi-eq\o(y,\s\up6(-)))2=14.6784.所以,R2=1-eq\f(0.01318,14.6784)≈0.9991,回来模型的拟合效果较好.(3)由残差表中的数值可以看出第3个样本点的残差比较大,须要确认在采集这个数据的时候是否有人为的错误,假如有的话,须要订正数据,重新建立回来模型;由表中数据可以看出残差点比较匀称地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回来模型的精度较高,由以上分析可知,弹簧长度与重量成线性关系.命题方向❹非线性回来问题典例4有一测量水流的试验装置——量水堰,测得试验数据如下表:i1234567水高h(厘米)0.71.12.54.98.110.213.5流量Q(升/分)0.0820.251.811.237.866.5134依据表中数据,建立Q与h之间的回来方程.[思路分析]作散点图,视察确定y与x的近似函数关系,作变量替换,列出新的对应值表求出对应的线性回来方程,再作变量替换得回来方程.[解析]依据测得数据作出散点图,如图,依据已有的函数学问,可以发觉样本点分布在某一条幂函数型曲线Q=αhβ(α、β是待定的正常数)①的四周.为此将Q=αhβ两边取对数,得到lgQ=βlgh+lgα②,令lgQ=y,lgh=x,于是②式可化为y=βx+lgα.这样y就是x的线性函数了.可以利用线性回来模型来建立y和x之间的线性回来方程y=bx+a(β=b,lgα=a)了.ihiQixi=lghiyi=lgQixeq\o\al(2,i)xiyi10.70.082-0.1549-1.08620.0240.168321.10.250.0414-0.60210.0017-0.024932.51.80.39790.25530.15830.101644.911.20.69021.04920.47640.724258.137.80.90851.57400.82541.4300610.266.51.00861.82281.01731.8385713.51341.13032.12711.27762.4043∑eq\i\su(i=1,7,)xi=4.022eq\i\su(i=1,7,)yi=5.1401eq\i\su(i=1,7,)xeq\o\al(2,i)=3.7807eq\i\su(i=1,7,)xiyi=6.642先作出上面数据表,由表得到β≈2.5097,lgα≈-0.7077,则α≈0.1960.于是所得的回来方程为Q=0.193h2.5097.『规律总结』1.在建立阅历公式时,选择合适的函数类型是特别重要的.通常是依据试验数据,画出散点图,从中视察其改变规律,并与已知函数的图象对比,看接近于什么函数,依据实践阅历来确定选取公式的类型,所选的类型是否符合实际,还须要通过实践来检验.有时候还须要选择不同的模拟函数作比较.2.假如视察散点图,发觉点的分布不呈条状分布,而是与某种曲线相近,这时可选择这条曲线对应的函数作为拟合函数,作恰当变换,转化为线性函数,用线性回来模型求解.例如:①反比例函数y=a+eq\f(b,x)可作变换t=eq\f(1,x),得y=a+bt.②幂函数型y=axb(a>0)可作变换Y=lny,m=lna,t=lnx,则有Y=m+bt.③指数型函数y=kabx(a>0且a≠1,k>0)可作变换Y=lny,m=lnk,则有:Y=m+(blna)x┃┃跟踪练习4__■为了探讨某种细菌随时间x的改变繁殖个数y的改变,收集数据如下:时间x/天123456繁殖个数y612254995190(1)将天数作说明变量,繁殖个数作预报变量,作出这些数据的散点图;(2)描述说明变量与预报变量之间的关系;(3)计算残差、相关指数R2.[解析](1)由表中数据作散点图如下图所示.(2)由散点图看出样本点分布在一条指数函数y=c1ec2x的图象的四周,其中c1和c2是待定系数.于是令z=lny,则z=bx+a(a=lnc1,b=c2),因此变换后的样本点应当分布在直线z=bx+a的四周,因此可以用线性回来模型来拟合z与x的关系,则变换后的样本数据如下表:x123456z1.792.483.223.894.555.25由表中数据得到线性回来方程eq\o(z,\s\up6(^))=0.69x+1.115.因此细菌繁殖个数关于时间的回来方程为eq\o(y,\s\up6(^))=e0.69x+1.115.(3)列出残差表:编号i123456eq\o(y,\s\up6(^))i6.0812.1224.1748.1896.06191.52yi612254995190eq\o(e,\s\up6(^))i-0.08-0.120.830.82-1.06-1.52eq\i\su(i=1,6,)eq\o(e,\s\up6(^))eq\o\al(2,i)=eq\i\su(i=1,6,)(yi-eq\o(y,\s\up6(^))i)2=4.8161,eq\i\su(i=1,6,)(yi-eq\o(y,\s\up6(-)))2=24630.1,R2=1-eq\f(4.8161,24630.1)≈0.9998.故说明变量天数对预报变量繁殖个数说明白99.98%,说明该回来模型拟合效果特别好.学科核心素养利用线性回来方程进行预报变量的估计(规律方法)利用线性回来方程可以进行预报,线性回来方程将部分观测值所反映的规律进行延长,是我们对有线性相关关系的两个变量进行分析和限制的依据.典例5(2024·福州模拟)对具有线性相关关系的变量x,y,测得一组数据如下表:x24568y2040607980依据上表,利用最小二乘法得它们的回来直线方程为eq\o(y,\s\up6(^))=10.5x+eq\o(a,\s\up6(^)),据此模型来预料当x=20时,y的估计值为(C)A.210 B.210.5C.211.5 D.212.5[解析]由已知得eq\x\to(x)=5,eq\x\to(y)=54,则(5,54)满意回来直线方程eq\o(y,\s\up6(^))=10.5x+eq\o(a,\s\up6(^)),解得eq\o(a,\s\up6(^))=1.5.因此eq\o(y,\s\up6(^))=10.5x+1.5,当x=20时,eq\o(y,\s\up6(^))=10.5×20+1.5=211.5.故选C.『规律总结』已知变量的某个值去预料相应预报变量的某个值时,先求出其所满意的回来直线方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),把已知x取某一个值代入回来方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))中,从而可求出y的估计值.┃┃跟踪练习5__■某车间为了规定工时定额,须要确定加工零件所花费的时间,为此做了4次试验,得到数据如下:零件的个数x(个)2345加工的时间y(小时)2.5344.5(1)在给定的坐标系中画出表中数据的散点图;(2)求y关于x的线性回来方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^));(3)试预料加工10个零件须要的时间.参考公式:eq\b\lc\{\rc\(\a\vs4\al\co1(\o(b,\s\up6(^))=\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,n,)xi-\x\to(x)2)=\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),\o(a,\s\up6(^))=\x\to(y)-\o(b,\s\up6(^))\x\to(x)))[解析](1)散点图如图所示:(2)由题中表格数据得eq\x\to(x)=3.5,eq\x\to(y)=3.5,eq\i\su(i=1,4,)(xi-eq\x\to(x))(yi-eq\x\to(y))=3.5,eq\i\su(i=1,4,)(xi-eq\x\to(x))2=5.由公式计算得eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,4,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,4,)xi-\x\to(x)2)=0.7,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x),所以所求线性回来方程为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))=0.7x+1.05.(3)当x=10时,eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))=0.7×10+1.05=8.05,所以预料加工10个零件须要8.05小时.易混易错警示求回来方程典例6在一化学反应过程中,某化学物质的反应速度y(g/min)与一种催化剂的量x(g)有关,现收集了如表所示的8组数据,则y与x的回来方程是__eq\o(y,\s\up6(^))=e0.1812x-0.8485__.催化剂是x(g)1518212427303336化学物质反应速度y(g/min)6830277020565350[错解]由表中数据可得eq\x\to(x)=25.5,eq\x\to(y)=95.125,eq\i\su(i=1,8,x)eq\o\al(2,i)=5580,eq\i\su(i=1,8,x)iyi=24297,所以eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,8,x)iyi-8\x\to(x)\x\to(y),\i\su(i=1,8,x)\o\al(2,i)-8\x\to(x)2)≈12.94,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=-234.845.所以回来方程式为eq\o(y,\s\up6(^))=-234.845+12.94x.[辨析]错误

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论