2024-2025学年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用学案含解析新人教A版选修2-3_第1页
2024-2025学年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用学案含解析新人教A版选修2-3_第2页
2024-2025学年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用学案含解析新人教A版选修2-3_第3页
2024-2025学年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用学案含解析新人教A版选修2-3_第4页
2024-2025学年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用学案含解析新人教A版选修2-3_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGE3.1回来分析的基本思想及其初步应用内容标准学科素养1.能知道用回来分析处理两个变量之间的不确定关系的统计方法.2.会利用散点图分析两个变量是否存在相关关系,会用残差及R2来刻画线性回来模型的拟合效果.3.能记住建立回来模型的方法和步骤;能知道如何利用线性回来模型求非线性回来模型.利用数据分析提升数学建模及数学运算授课提示:对应学生用书第51页[基础相识]学问点一线性回来模型eq\a\vs4\al(预习教材P80-84,思索并完成以下问题)“名师出高徒”这句谚语的意思是什么?出名气的老师就肯定能教出厉害的学生吗?这两者之间是否有关?某电脑公司有5名产品推销员,其工作年限与年推销金额数据如下表:推销员编号12345工作年限x/年35679推销金额y/万元23345请问如何表示推销金额y与工作年限x之间的相关关系?y关于x的线性回来方程是什么?提示:画出散点图,由图可知,样本点散布在一条直线旁边,因此可用回来直线表示变量之间的相关关系.设所求的线性回来方程为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),则eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,5,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,5,)xi-\x\to(x)2)=eq\f(10,20)=0.5,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=0.4.所以年推销金额y关于工作年限x的线性回来方程为eq\o(y,\s\up6(^))=0.5x+0.4.学问梳理1.概念:回来分析是对具有相关关系的两个变量进行统计分析的一种常用方法.2.步骤:画散点图→求回来方程→用回来方程进行预报.3.在线性回来方程eq\o(y,\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))x中,eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,n,)xi-\x\to(x)2)=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x),其中eq\x\to(x)=eq\f(1,n)eq\i\su(i=1,n,x)i,eq\x\to(y)=eq\f(1,n)eq\i\su(i=1,n,y)i,(eq\x\to(x),eq\x\to(y))称为样本点的中心,回来直线过样本点的中心.4.线性回来模型y=bx+a+e,其中e称为随机误差,自变量x称为说明变量,因变量y称为预报变量.学问点二刻画回来效果的方式eq\a\vs4\al(预习教材P84-88,思索并完成以下问题)(1)具有相关关系的两个变量的回来方程是唯一的吗?(2)预报变量eq\o(y,\s\up6(^))与真实值y一样吗?(3)预报值eq\o(y,\s\up6(^))与真实值y之间误差大了好还是小了好?提示:(1)不肯定.(2)不一样.(3)越小越好.学问梳理1.残差平方和法(1)eq\o(e,\s\up6(^))i=yi-eq\o(y,\s\up6(^))i=yi-eq\o(b,\s\up6(^))xi-eq\o(a,\s\up6(^))(i=1,2,…,n)称为相应于点(xi,yi)的残差.(2)残差平方和eq\i\su(i=1,n,)(yi-eq\o(y,\s\up6(^))i)2越小,模型的拟合效果越好.2.残差图法残差点比较匀称地落在水平的带状区域中,说明选用的模型比较合适.这样的带状区域的宽度越窄,说明模型拟合精度越高,回来方程的预报精度越高.3.利用相关指数R2刻画回来效果其计算公式为:R2=1-eq\f(\i\su(i=1,n,)yi-\o(y,\s\up6(^))i2,\i\su(i=1,n,)yi-\x\to(y)2),其几何意义:R2越接近于1,表示回来的效果越好.学问点三建立回来模型的基本步骤学问梳理确定探讨对象,明确哪个变量是说明变量,哪个变量是预报变量.画出说明变量和预报变量的散点图,视察它们之间的关系(如是否存在线性关系等).由阅历确定回来方程的类型(如视察到数据呈线性关系,则选用线性回来方程).按肯定规则(如最小二乘法)估计回来方程中的参数.得出结果后分析残差图是否有异样(如个别数据对应残差过大,残差呈现不随机的规律性等).若存在异样,则检查数据是否有误,或模型是否合适等.[自我检测]1.推断下列命题是否正确.(正确的打“√”,错误的打“×”)(1)残差平方和越小,线性回来模型的拟合效果越好.()(2)在画两个变量的散点图时,预报变量在x轴上,说明变量在y轴上.()(3)R2越小,线性回来模型的拟合效果越好.()答案:(1)√(2)×(3)×2.假如记录了x,y的几组数据分别为(0,1),(1,3),(2,5),(3,7),那么y关于x的线性回来直线必过点()A.(2,2) B.(1.5,2)C.(1,2) D.(1.5,4)答案:D3.从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为________.答案:正相关授课提示:对应学生用书第52页探究一求线性回来方程[阅读教材P81例1]从某高校中随机选取8名女高校生,其身高和体重数据如表所示.编号12345678身高/cm165165157170175165155170体重/kg4857505464614359求依据女高校生的身高预报体重的回来方程,并预报一名身高为172cm的女高校生的体重.题型:求线性回来方程方法步骤:(1)画出散点图.(2)确定身高和体重有很好的线性相关关系.(3)由eq\o(b,\s\up6(^))和eq\o(a,\s\up6(^))的计算公式得出回来直线方程.(4)由所给x的值进行预报y的值.[例1]某商场经营一批进价是30元/件的小商品,在市场试验中发觉,此商品的销售单价x(x取整数)元与日销售量y台之间有如下关系:x35404550y56412811(1)y与x是否具有线性相关关系?假如具有线性相关关系,求出回来直线方程.(方程的斜率精确到1)(2)设经营此商品的日销售利润为P元,依据(1)写出P关于x的函数关系式,并预报当销售单价x为多少元时,才能获得最大日销售利润.[解析](1)散点图如图所示,从图中可以看出这些点大致分布在一条直线旁边,因此两个变量线性相关.设回来直线方程为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),由题知eq\x\to(x)=42.5,eq\x\to(y)=34,则求得eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,4,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,4,)xi-\x\to(x)2)≈-3.eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)≈34-(-3)×42.5=161.5.∴eq\o(y,\s\up6(^))=-3x+161.5.(2)依题意有P=(-3x+161.5)(x-30)=-3x2+251.5x-4845=-3eq\b\lc\(\rc\)(\a\vs4\al\co1(x-\f(251.5,6)))2+eq\f(251.52,12)-4845.∴当x=eq\f(251.5,6)≈42时,P有最大值,约为426.故预报当销售单价为42元时,才能获得最大日销售利润.方法技巧1.求线性回来方程的基本步骤(1)列出散点图,从直观上分析数据间是否存在线性相关关系.(2)计算:eq\x\to(x),eq\x\to(y),eq\i\su(i=1,n,x)eq\o\al(2,i),eq\i\su(i=1,n,y)eq\o\al(2,i),eq\i\su(i=1,n,x)iyi.(3)代入公式求出eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))中参数eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^))的值.(4)写出线性回来方程并对实际问题作出估计.2.需特殊留意的是,只有在散点图大致呈线性时,求出的回来方程才有实际意义,否则求出的回来方程毫无意义.跟踪探究1.某探讨机构对高三学生的记忆力x和推断力y进行统计分析,得下表数据:x681012y2356(1)请画出上表数据的散点图;(2)请依据上表供应的数据,用最小二乘法求出y关于x的线性回来方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^));(3)试依据求出的线性回来方程,预料记忆力为9的同学的推断力.eq\b\lc\(\rc\)(\a\vs4\al\co1(相关公式:\o(b,\s\up6(^))=\f(\i\su(i=1,n,x)iyi-n\o(x,\s\up6(-))·\o(y,\s\up6(-)),\i\su(i=1,n,x)\o\al(2,i)-n\o(x,\s\up6(-))2),\o(a,\s\up6(^))=\o(y,\s\up6(-))-\o(b,\s\up6(^))\o(x,\s\up6(-))))解析:(1)如图:(2)eq\i\su(i=1,4,x)iyi=6×2+8×3+10×5+12×6=158,eq\o(x,\s\up6(-))=eq\f(6+8+10+12,4)=9,eq\o(y,\s\up6(-))=eq\f(2+3+5+6,4)=4,eq\i\su(i=1,4,x)eq\o\al(2,i)=62+82+102+122=344,eq\o(b,\s\up6(^))=eq\f(158-4×9×4,344-4×92)=eq\f(14,20)=0.7,eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-))=4-0.7×9=-2.3,故线性回来方程为eq\o(y,\s\up6(^))=0.7x-2.3.(3)由(2)中线性回来方程可知,当x=9时,eq\o(y,\s\up6(^))=0.7×9-2.3=4,预料记忆力为9的同学的推断力约为4.探究二线性回来分析[阅读教材P84思索]如何发觉数据中的错误?如何衡量模型的拟合效果?以例1中的女高校生身高和体重的原始数据以及相应的残差数据进行分析.题型:推断模型的拟合效果方法步骤:(1)求出残差,并画出残差图进行分析.(2)求出残差平方和进行分析.(3)求出R2进行分析.[例2]已知某种商品的价格x(单位:元/件)与需求量y(单位:件)之间的关系有如下一组数据:x1416182022y1210753求y对x的回来直线方程,并说明回来模型拟合效果的好坏.[解析]eq\o(x,\s\up6(-))=eq\f(1,5)(14+16+18+20+22)=18,eq\o(y,\s\up6(-))=eq\f(1,5)(12+10+7+5+3)=7.4,eq\i\su(i=1,5,x)eq\o\al(2,i)=142+162+182+202+222=1660,eq\i\su(i=1,5,y)eq\o\al(2,i)=122+102+72+52+32=327,eq\i\su(i=1,5,x)iyi=14×12+16×10+18×7+20×5+22×3=620,所以eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,5,x)iyi-5\o(x,\s\up6(-))\o(y,\s\up6(-)),\i\su(i=1,5,x)\o\al(2,i)-5\o(x,\s\up6(-))2)=eq\f(620-5×18×7.4,1660-5×182)=-1.15,eq\o(a,\s\up6(^))=7.4+1.15×18=28.1,所以所求回来直线方程是eq\o(y,\s\up6(^))=-1.15x+28.1.列出残差表:yi-eq\o(y,\s\up6(^))i00.3-0.4-0.10.2yi-eq\o(y,\s\up6(-))4.62.6-0.4-2.4-4.4所以eq\i\su(i=1,5,)(yi-eq\o(y,\s\up6(^))i)2=0.3,eq\i\su(i=1,5,)(yi-eq\o(y,\s\up6(-)))2=53.2,R2=1-eq\f(\i\su(i=1,5,)yi-\o(y,\s\up6(^))i2,\i\su(i=1,5,)yi-\o(y,\s\up6(-))2)≈0.994,所以回来模型的拟合效果很好.方法技巧1.解答线性回来问题,应通过散点图来分析两变量间的关系是否线性相关,然后再利用求回来方程的公式求解回来方程,并利用残差图或相关指数R2来分析函数模型的拟合效果,在此基础上,借助回来方程对实际问题进行分析.2.刻画回来效果的三种方法(1)残差图法,残差点比较匀称地落在水平的带状区域内说明选用的模型比较合适.(2)残差平方和法:残差平方和eq\i\su(i=1,n,)(yi-eq\o(y,\s\up6(^))i)2越小,模型的拟合效果越好.(3)相关指数法:R2=1-eq\f(\i\su(i=1,n,)yi-\o(y,\s\up6(^))i2,\i\su(i=1,n,)yi-\o(y,\s\up6(-))2)越接近1,表明回来的效果越好.跟踪探究2.关于x与y有如下数据:x24568y3040605070有如下的两个线性模型:(1)eq\o(y,\s\up6(^))=6.5x+17.5;(2)eq\o(y,\s\up6(^))=7x+17.试比较哪一个拟合效果更好.解析:由(1)可得yi-eq\o(y,\s\up6(^))i与yi-eq\o(y,\s\up6(-))的关系如下表:yi-eq\o(y,\s\up6(^))i-0.5-3.510-6.50.5yi-eq\o(y,\s\up6(-))-20-1010020∴eq\i\su(i=1,5,)(yi-eq\o(y,\s\up6(^))i)2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155,eq\i\su(i=1,5,)(yi-eq\o(y,\s\up6(-)))2=(-20)2+(-10)2+102+02+202=1000.∴Req\o\al(2,1)=1-eq\f(\i\su(i=1,5,)yi-\o(y,\s\up6(^))i2,\i\su(i=1,5,)yi-\o(y,\s\up6(-))2)=1-eq\f(155,1000)=0.845.由(2)可得yi-eq\o(y,\s\up6(^))i与yi-eq\o(y,\s\up6(-))的关系如下表:yi-eq\o(y,\s\up6(^))i-1-58-9-3yi-eq\o(y,\s\up6(-))-20-1010020∴eq\i\su(i=1,5,)(yi-eq\o(y,\s\up6(^))i)2=(-1)2+(-5)2+82+(-9)2+(-3)2=180,eq\i\su(i=1,5,)(yi-eq\o(y,\s\up6(-)))2=(-20)2+(-10)2+102+02+202=1000.∴Req\o\al(2,2)=1-eq\f(\i\su(i=1,5,)yi-\o(y,\s\up6(^))i2,\i\su(i=1,5,)yi-\o(y,\s\up6(-))2)=1-eq\f(180,1000)=0.82.由于Req\o\al(2,1)=0.845,Req\o\al(2,2)=0.82,0.845>0.82,∴Req\o\al(2,1)>Req\o\al(2,2).∴(1)的拟合效果好于(2)的拟合效果.探究三非线性回来模型[阅读教材P86例2]一只红铃虫的产卵数y和温度x有关.现收集了7组观测数据列于下表中,试建立y关于x的回来方程.温度x/℃21232527293235产卵数y/个711212466115325题型:非线性回来模型方法步骤:(1)画出散点图(2)写出非线性回来方程:y=c1ec2x.(3)通过某种变换令z=lny,得出线性回来直线z=bx+a.(4)用线性回来方程来建立y与x间的非线性回来方程.[例3]某公司为确定下一年度投入某种产品的宣扬费,需了解年宣扬费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣扬费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.eq\o(x,\s\up6(-))eq\o(y,\s\up6(-))eq\o(w,\s\up6(-))eq\i\su(i=1,8,)(xi-eq\o(x,\s\up6(-)))2eq\i\su(i=1,8,)(wi-eq\o(w,\s\up6(-)))2eq\i\su(i=1,8,)(xi-eq\o(x,\s\up6(-)))·(yi-eq\o(y,\s\up6(-)))eq\i\su(i=1,8,)(wi-eq\o(w,\s\up6(-)))·(yi-eq\o(y,\s\up6(-)))46.65636.8289.81.61469108.8表中wi=eq\r(xi),eq\o(w,\s\up6(-))=eq\f(1,8)eq\i\su(i=1,8,w)i.(1)依据散点图推断,y=a+bx与y=c+deq\r(x)哪一个相宜作为年销售量y关于年宣扬费x的回来方程类型?(给出推断即可,不必说明理由)(2)依据(1)的推断结果及表中数据,建立y关于x的回来方程;(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x,依据(2)的结果回答下列问题:①年宣扬费x=49时,年销售量及年利润的预报值是多少?②年宣扬费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回来直线v=α+βu的斜率和截距的最小二乘估计分别为eq\o(β,\s\up6(^))=eq\f(\i\su(i=1,n,)ui-\o(u,\s\up6(-))vi-\o(v,\s\up6(-)),\i\su(i=1,n,)ui-\o(u,\s\up6(-))2),eq\o(α,\s\up6(^))=eq\o(v,\s\up6(-))-eq\o(β,\s\up6(^))eq\o(u,\s\up6(-)).[解析](1)由散点图可以推断,y=c+deq\r(x)相宜作为年销售量y关于年宣扬费x的回来方程类型.(2)令w=eq\r(x),先建立y关于w的线性回来方程.由于eq\o(d,\s\up6(^))=eq\f(\i\su(i=1,8,)wi-\o(w,\s\up6(-))yi-\o(y,\s\up6(-)),\i\su(i=1,8,)wi-\o(w,\s\up6(-))2)=eq\f(108.8,1.6)=68,eq\o(c,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(d,\s\up6(^))eq\o(w,\s\up6(-))=563-68×6.8=100.6,所以y关于w的线性回来方程为eq\o(y,\s\up6(^))=100.6+68w,因此y关于x的回来方程为eq\o(y,\s\up6(^))=100.6+68eq\r(x).(3)①由(2)知,当x=49时,年销售量y的预报值eq\o(y,\s\up6(^))=100.6+68eq\r(49)=576.6,年利润z的预报值eq\o(z,\s\up6(^))=576.6×0.2-49=66.32.②依据(2)的结果知,年利润z的预报值eq\o(z,\s\up6(^))=0.2(100.6+68eq\r(x))-x=-x+13.6eq\r(x)+20.12.所以当eq\r(x)=eq\f(13.6,2)=6.8,即x=46.24时,eq\o(z,\s\up6(^))取得最大值.故年宣扬费为46.24千元时,年利润的预报值最大.方法技巧求非线性回来方程的步骤(1)确定变量,作出散点图.(2)依据散点图,选择恰当的拟合函数.(3)变量置换,通过变量置换把非线性回来问题转化为线性回来问题,并求出线性回来方程.(4)分析拟合效果:通过计算相关指数或画残差图来推断拟合效果.(5)依据相应的变换,写出非线性回来方程.跟踪探究3.在一次抽样调查中测得样本的5个样本点,数值如下表:x0.250.5124y1612521试建立y与x之间的回来方程.解析:由数值表可作散点图如图,依据散点图可知y与x近似地呈反比例函数关系,设eq\o(y,\s\up6(^))=eq\f(k,x),令t=eq\f(1,x),则eq\o(y,\s\up6(^))=kt,原数据变为:t4210.50.25y1612521由置换后的数值表作散点图如下:由散点图可以看出y与t呈近似的线性相关关系,列表如下:itiyitiyiteq\o\al(2,i)1416641622122443155140.5210.2550.2510.250.0625∑7.753694.2521.3125所以eq\o(t,\s\up6(-))=1.55,eq\o(y,\s\up6(-))=7.2.所以eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,5,t)iyi-5\o(t,\s\up6(-))\o(y,\s\up6(-)),\i\su(i=1,5,t)\o\al(2,i)-5\o(t,\s\up6(-))2)≈4.1344,eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(t,\s\up6(-))≈0.8.所以eq\o(y,\s\up6(^))=4.1344t+0.8.所以y与x之间的回来方程是eq\o(y,\s\up6(^))=eq\f(4.1344,x)+0.8.授课提示:对应学生用书第54页[课后小结]回来分析的步骤:①确定探讨对象,明确哪个变量是说明变量,哪个变量是预报变量;②画出确定好的说明变量和预报变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论