数学互动课堂回归分析_第1页
数学互动课堂回归分析_第2页
数学互动课堂回归分析_第3页
数学互动课堂回归分析_第4页
数学互动课堂回归分析_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学必求其心得,业必贵于专精学必求其心得,业必贵于专精学必求其心得,业必贵于专精互动课堂疏导引导1.回归分析的基本思想回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.其基本思想是通过散点图直观地了解两个变量的关系,然后通过最小二乘法建立回归模型,最后通过分析相关指数、随机误差等评价模型的好坏.疑难疏引理解两个变量之间的线性关系要注意下面的几个问题:(1)相关关系是非随机变量与随机变量之间的关系,而函数关系是两个非随机变量间的关系;(2)函数关系是一种因果关系,而相关关系不一定有因果关系,也可能是伴随关系.(3)现实生活中存在大量的相关关系,相关关系是进行回归分析的基础.2.非线性回归问题两个变量不呈线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型.如y=,我们可以通过对数变换把指数关系变为线性关系.令z=lny,则变换后样本点应该分布在直线z=bx+a(a=lnc1,b=c2)的周围。(如例2)3。如何评判回归模型的好坏可以通过比较两个模型的残差平方和的大小来判断拟合效果,残差平方和越小的模型,拟合的效果越好.类似地,还可以用相关指数R2来比较两个模型的拟合效果,R2越大,模型的拟合效果越好。例如例2中,可以认为样本点集中在某二次曲线y=bx2+a附近,可令t=x2。t=x2360049006400810010002012100y6。137.909.9912.1515.0217.50t=x2144001690019600225002560028900y20.9226。8631.1138.8547。2555。05由上表数据可得y与t的线性回归方程:=1.899×10-3t-3.322,即=1。899×10—3x2-3。322.②下面分析一下这两种函数模型,哪一种拟合效果较好?分别求出两种模型的残差平方和和相关指数,通过比较残差平方和或相关指数来判定,模型①的残差平方和与相关指数在例2中已求,下面求模型②的残差平方和与相关指数.x60708090100110y6。137.909.9912。1515。021.503.515.988.8312.0615.6719.662。621.921。160.09—0.65—2.16x120130140150160170y20.9226。8631。1138.8547。2555.0524.0228。7733.9039。4145.2951.56-3.1-1。91-2.79—0。561。963.49则此函数模型的残差平方和=54.37,总偏差平方和:()2==2831。5,相关指数R2==0.981。对于两种函数模型①和②残差平方和分别为33.71和54。37,因此模型①的拟合效果要优于模型②.另外,也可比较相关指数R2,模型①和②的R2分别为0.988和0.981,因此模型①的拟合效果好于模型②案例测得10对某国父子身高(单位:英寸)如下:父高x60626465666768707274儿高y63。665.26665。566。967。167.468.370.170(1)对变量y与x进行相关性检验。(2)如果y与x之间具有性性相关关系,求回归直线方程。(3)如果父亲的身高为73英尺,估计儿子的身高。【探究】由于x、y的不确定关系,先进行相关关系的检验,再求回归方程.解:(1)=66。8,=67.01.=44794.r==≈0。9801.又查表得r0。05=0。632.因为r>0.05,所以y与x之间具有线性相关关系。(2)设回归直线方程为.由=≈0。4645.=67.01—0。4645×66.8≈35.98.故所求的回归直线方程为:=0.4645x+35.98.(3)当x=73时,=0.4645×73+35。98=69。9.所以当父亲身高为73英寸时,估计儿子身高约为69。9英寸.求回归直线方程,一般先要考查y与x是否具有线性相关关系,若具有这样的关系,则它的回归曲线为直线.规律总结①作为非确定性关系的相关关系包括两种情况:其一,两个变量中,一个变量为可控制变量,另一个变量为随机变量;其二,两个变量均为随机变量,主要研究第一种情况。②一元线性回归分析是回归分析中最简单,也是最基本的一种类型,它类似于代数方程理论中的一元一次方程。③求回归直线方程和相关系数通常是用计算器完成的,列出相应的表格可便于求出回归直线方程中的系数和相关系数.④对两个变量的线性相关性进行检验,有几种彼此等价的方法,相关系数检验法只是其中的一种。⑤相关检验的步骤为:(1)在《相关系数检验的临界值表》中查出与显著性水平0。05与自由度n—2(n为观测值组数)相应的相关系数临界值r0。05。(2)根据公式:r=计算r的值.(3)检验所得结果。如果|r|≤r0。05,接受统计假设,如果|r|>r0。05,拒绝统计假设。活学巧用例1关于人体的脂肪含量(百分比)和年龄关系的研究中,研究人员获得了一组数据:年龄x23273941454950脂肪y9。517.321.225。927.526.328。2年龄x53545657586061脂肪y29.630。231.430.833。535。234。6(1)作散点图;(2)求y与x之间的回归线方程;(3)求相关指数R2,并说明其含义;(4)给出37岁人的脂肪含量的预测值。解:(1)图略。(2)设方程为,则由计算器算得=-0。448,=0.577,所以=0.577x—0。448。(3)残差平方和=()2=—xiyi=37.14.总偏差平方和:==645.23。R2==0.942.R2为0。942,表明年龄解释了94.2%的脂肪含量变化.(4)当x=37时,=0.577×37—0.448=20。90。点评:我们不能说37岁人的脂肪含量一定是20.90%,因为这只是预测值.脂肪含量除受年龄影响外还受其他因素,即残差变量的影响,事实上,20。90%是对年龄为37岁人群中的大部分人的体内脂肪含量所作出的估计.统计既有随机性,又有规律性.例2某地区不同身高的未成年男性的体重平均值如下表:身高x/cm60708090100110体重y/kg6。137。909。9912.1515.0217。50身高x/cm120130140150160170体重y/kg20。9226。8631。1138.8547.2555。05(1)试建立y与x之间的回归方程.(2)若体重超过相同身高男性体重平均值的1。2倍为偏胖,低于0。8倍为偏瘦,那么这个地区一名身高为175cm体重为82kg的在校男生体重是否正常?(3)求残差平方和与R2.解:根据上表中数据画出散点图如图.(1)由图看出,样本点分布在某条指数函数曲线y=的周围,于是令z=lny。x60708090100110120130140150160170z1.812.072.302.502.712.863.043.293。443.663.864.01作出散点图如图.由表中数据可得z与x之间的回归直线方程:=0。693+0.020x,则有=e0。693+0。020x。①(2)当x=175时,预测平均体重=e0.693+0。020×175≈66。22,由于66。22×1.2≈79。47<82,所以这个男生偏胖.(3)x60708090100110y6.137.909.9912。1515。0217.506.648。119。9012.1014.7818。05—0。51—0。210.090。050。24-0。55X120130140150160170Y20.9226。8631。1138.8547.2555。0522。0426。9232。8840.1749.0659.91-1。12—0.06-1。77-1.32-1。81—4。86残差平方和:≈33.71,总偏差平方和:==2831。5,相关指数:R2==0。988.例3假设关于某设备的使用年限x和所支出的维修费用y(万元)有如下统计资料:x23456y2。23.85。56.57。0若由资料知,y为x呈线性相关关系,试求:(1)回归直线方程;(2)估计使用年限为10年时,维修费用约是多少?分析:知道x与y呈线性相关关系.解:由题意知:i12345xi23456yi2.23.85.56.57。0x

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论