数学课堂导学:回归分析的基本思想及其初步应用_第1页
数学课堂导学:回归分析的基本思想及其初步应用_第2页
数学课堂导学:回归分析的基本思想及其初步应用_第3页
数学课堂导学:回归分析的基本思想及其初步应用_第4页
数学课堂导学:回归分析的基本思想及其初步应用_第5页
已阅读5页,还剩10页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学必求其心得,业必贵于专精学必求其心得,业必贵于专精学必求其心得,业必贵于专精课堂导学三点剖析一、回归方程及其应用【例1】研究某灌溉渠道水的流速Y与水深x之间的关系,测得一组数据如下:水深x/m1。401。501.601。701.801.902。002。10流速Y/(m·s—1)1。701.791.881。952.032。102.162.21(1)求Y对x的回归直线方程;(2)预测水深为1.95m时水的流速是多少?思路分析:从散点图可以直观地看出变量x与Y之间有无线性相关关系,为此把这8对数据描绘在平面直角坐标系中,得到平面上8个点,如图所示.由图容易看出,x与Y之间有近似的线性相关关系,或者说,可以用一个回归直线方程=a+bx来反映这种关系,这些是我们在必修模块数学3中学过的知识。进一步观察这8个点,容易发现它们并不是“严格地"在一条直线上,对于某个xi,由上式能确定一个=a+bxi,一般地说,由于测量流速可能存在误差,或者受某些随机因素的影响,或者上面的回归直线方程本身就不够精确,与测得的数据yi很可能不相等,即yi=i+ei(i=1,2,…,8),其中ei是随机误差项。于是,就有yi=a+bxi+ei(i=1,2,…,8),这就是本题的线性模型。从上述线性模型出发,我们可以求出a与回归系数b的估计值,,使得全部误差e1,e2,…,e8的平方和达到最小,当然,这是一种很好的估计.最后得到的求,的数学公式为=.解析:(1)可采用列表的方法计算a与回归系数b.序号xyx2xy11。401.701.962.38021。501。792.252.68531.601.882。563.00841.701.952.893。31551.802.033.243。65461。902.103。613。99072.002。164。004。32082.102.214。414。641∑14.0015.8224。9227.993于是,=×14.00=1.75,=×15.82=1。9775,=≈0。733。=1。9775—×1。75≈0。694.Y对x的回归直线方程为=+x=0.694+0。733x.回归系数=0。733的意思是,在此灌溉渠道中,水深每增加0。1m,水的流速平均增加0.733m/s(本例数据是以0.1m为水深间隔测得的),=0。694可以解释为水的流速中不受水深影响的部分.(2)由(1)中求出的回归直线方程,把x=1。95代入,易得=0.694+0。733×1.95≈2.12(m/s)。计算结果表明,当水深为1。95m时可以预测渠水的流速约为2。12m/s.二、熟悉建立回归模型的基本步骤,会分析残差图的异常情况【例2】1993年到2002年中国的国内生产总值(GDP)的数据如下:年份GDP199334634。4199446759。4199558478.1199667884.6199774462.6199878345。2199982067.5200089468.1200197314。82002104790。6(1)作GDP和年份的散点图,根据该图猜想它们之间的关系应是什么?(2)建立年份的解释变量,GDP为预报变量的回归模型,并计算残差.(3)根据你得到的模型,预报2003年的GDP,并查资料,看看你的预报与实际的GDP的误差是多少?(4)你认为这个模型能较好地刻画GDP和年份的关系吗?请说明理由.解析:(1)(2)从上图中可以看出,x与y之间有近似的线性相关关系,即可以用一个回归直线方程=x+表示通过计算可得=×19975=1997.5=×734204.7=73420.47=7206.5=73420.47-7206。5×1997。5=-14321563。28∴y对x的回归直线模型为=7206。5x—14321563.28残差为:x19931994199519961997y34634.446759。458478.167884.674462。6—6356。82-1438。323073。885273.884645.38x19981999200020012002y78345。282067。589468。197314。8104790.61321.48-2162。72—1968.2-1328.42-1059.12(3)=7206.5×2003-14321563.28=113056.22(亿元)2003年的实际GDP为117390亿元,误差为4333.78亿元.(4)以样本编号为横坐标,残差为纵坐标作残差图。从残差图可以看出这个模型能较好地刻画GDP和年份的关系.三、比较拟合效果的基本步骤【例3】一只红铃虫的产卵数y和温度x有关.现收集了7组观测数据列于表1中,试建立y与x之间的回归方程。表1温度x/℃21232527293235产卵数y/个711212466115325解析:根据收集的数据作散点图(图1)。在散点图中,样本点并没有分布在某个带状区域内,因此两个变量不呈现线性相关关系,所以不能直接利用线性回归方程来建立两个变量之间的关系.根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线y=的周围,其中c1和c2是待定参数.现在,问题变为如何估计待定参数c1和c2.我们可以通过对数变换把指数关系变为线性关系.令z=lny,则变换后样本点应该分布在直线z=bx+a(a=lnc1,b=c2)的周围。这样,就可以利用线性回归模型来建立y和x之间的非线性回归方程了。由表1的数据可以得到变换后的样本数据表2,图2给出了表2中数据的散点图。从图2中可以看出,变换后的样本点分布在一条直线的附近,因此可以用线性回归方程来拟合。表2x21232527293235z1。9462。3983。0453。1784。1904。7455.784由表2中的数据得到线性回归方程=0。272x-3。843。因此红铃虫的产卵数对温度的非线性回归方程为=e0.272x-3.843.(1)另一方面,可以认为图1中样本点集中在某二次曲线y=c3x2+c4的附近,其中c3和c4为待定参数。因此可以对温度变量做变换,即令t=x2,然后建立y与t之间的线性回归方程,从而得到y与x之间的非线性回归方程。表3是红铃虫的产卵数和对应的温度的平方,图3是相应的散点图。表3t44152962572984110241225Y711212466115325从图3中可以看出,y与t的散点图并不分布在一条直线的周围,因此不宜用线性回归方程来拟合它,即不宜用二次曲线y=c3x2+c4来拟合y和x之间的关系.这个结论还可以通过残差分析得到.各个击破【类题演练1】在一段时间内:某种商品价格x(万元)和需求量Y(t)之间的一组数据为价格x:1.41。61。822。2需求量Y:121075133(1)画出散点图;解析:(1)(2)求出Y对x的回归直线方程,并在(1)的散点图中画出它的图象;解析:采用列表的方法计算a与回归系数b。序号xyx2xy123451.41。61。822.212107531.962。563.2444.8416.81612。6106。6∑93716.662x=×9=1.8=×37=7。4=≈—11。5=7。4+11。5×1。8=28.1Y对x的回归直线方程为=+x=28。1-11。5x(3)如价格定为1.9万元,预测需求量大约是多少(精确到0。01t)?解析:当x=1。9时,Y=28。1-11。5×1.9=6。25,所以价格定为1.9万元,需求量大约是6。25(t).【变式提升1】弹簧长度Y(cm)随所挂物体质量x(g)不同而变化的情况如下:物体质量x:51015202530弹簧长度y:7.258.128.959。9010。9611.80(1)画出散点图;解析:(1)(2)求Y对x的回归直线方程;解析:采用列表的方法计算a与回归系数b序号xyx2xy123456510152025307.258.128。959.9010.9611.802510022540062590036.2581。2134。25198274354∑10556。9822751077。7=×105=17。5=×56。98≈9.50=≈0。183=9.50-0.183×17。5≈6.30Y对x的回归直线方程为=6.30+0。183x(3)预测所挂物体质量为27g时的弹簧长度(精确到0.01cm)。解析:当质量为27g时,有=6。30+0.183×27≈11.24cm所以当挂物体的质量为27kg时,弹簧的长度大约为11。24cm.【类题演练2】如果美国10家工业公司提供了以下数据:公司销售总额x1/百万美元利润x2/百万美元通用汽车1269744224福特969333835埃克森866563510IBM634383758通用电气552643939美孚509761809菲利普·莫利斯390692946克莱斯勒36156359杜邦352092480德士古324162413(1)作销售总额和利润的散点图,根据该图猜想它们之间的关系应是什么形式;解析:散点图如图所示由图可猜想它们之间是线性相关关系.(2)建立销售总额的解释变量,利润的预报变量的回归模型,并计算残差;解析:通过计算可得:=62309.1=2927.3=0.02=1681.1∴回归模型为=0.02x+1681.1由公式=yi—xi—得其残差为x12697496933866566343855264y422438353510375839393。42215.2495。78808。141152。62x5097639069361563520932416y1809294635924802413-891。62483.52—2045.2294。7283.58(3)计算相关指数,你认为这个模型能较好地刻画销售总额和利润之间的关系吗?请说明理由.解析:R2=1-=1-=0。404∴这个模型不能较好地刻画销售总额和利润之间的关系.【类题演练3】某农场对单位面积化肥用量x(kg)和水稻相应产量Y(kg)的关系作了统计,得到数据如下:x:15202530354045Y:330345365405445450455如果x和Y之间具有线性相关关系,求出回归直线方程,并预测当单位面积化肥用量为32kg时水稻的产量大约是多少(精确到0。01kg).解析:用列表的方法计算a与回归系数b.序号xyx2x12345671520253035404533024536540544545045522540062590012251600202549506900912512150155751800020475∑2102795700087175=×210=30=×2795≈399.3=≈4。746=399。3—4。746×30=256。92Y对x的回归直线方程为=+x=256.92+4.746x当x=32时,=256。92+4。746×32≈408.79答:回归直线方程为=256.92+4。746x,当单位面积化肥为32kg时,水稻的产量大约为408.79kg。【变式提升3】随着人们经济收入的不断增长,个人购买家庭轿车已不再是一种时尚。车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题。某汽车销售公司做了一次抽样调查,并统计得出某款车的使用年限x与所支出的总费用y(万元)有如下的数据资料:使用年限x23456总费用y2.23。85。56.5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论