可线性化回归分析_第1页
可线性化回归分析_第2页
可线性化回归分析_第3页
可线性化回归分析_第4页
可线性化回归分析_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章——统计案例[学习目标]1.进一步体会回归分析的基本思想.2.通过非线性回归分析,判断几种不同模型的拟合程度.§1回归分析1.3可线性化的回归分析1知识梳理自主学习2题型探究重点突破3当堂检测自查自纠对不具有线性相关关系的两个变量做统计分析,通过变量代换,转化为线性回归模型.知识点一非线性回归分析思考有些变量间的关系并不是线性相关,怎样确定回归模型?答首先要作出散点图,如果散点图中的样本点并没有分布在某个带状区域内,则两个变量不呈现线性相关关系,不能直接利用线性回归方程来建立两个变量之间的关系,这时可以根据已有函数知识,观察样本点是否呈指数函数关系或二次函数关系,选定适当的回归模型.曲线方程曲线图形变换公式变换后的线性函数y=axbc=lnav=lnxu=lny_____________u=c+bv知识点二非线性回归方程y=aebxc=lnau=lnyy=aec=lna

v=u=lnyu=c+bxu=c+bvy=a+blnxv=lnxu=yu=a+bv思考如果两个变量呈现非线性相关关系,怎样求出回归方程?答可以通过对解释变量进行变换,如对数变换或平方变换,先得到另外两个变量间的回归方程,再得到所求两个变量的回归方程.例1

某产品的广告费用x与销售额y的统计数据如下表:题型一线性回归分析广告费用x(万元)4235销售额y(万元)49263954(1)由数据易知y与x具有线性相关关系,若b=9.4,求线性回归方程y=a+bx;∴回归直线方程为y=9.1+9.4x.(2)据此模型预报广告费用为4万元时的销售额.解当x=4时,y=9.1+9.4×4=46.7,故广告费用为6万元时销售额为46.7万元.跟踪训练1

为了研究3月下旬的平均气温(x)与4月20日前棉花害虫化蛹高峰日(y)的关系,某地区观察了2006年到2011年的情况,得到了下面的数据:年份200620072008200920102011x/℃24.429.632.928.730.328.9y/日19611018i123456xi24.429.632.928.730.328.9yi19611018(1)对变量x,y进行相关性检验;解制表.故变量y和x存在很强的线性相关关系.(2)据气象预测,该地区在2012年3月下旬平均气温为27℃,试估计2012年4月化蛹高峰日为哪天.例2

在一化学反应过程中,化学物质的反应速度y(g/min)与一种催化剂的量x(g)有关,现收集了8组观测数据列于表中:题型二可线性化的回归分析催化剂的量x/g1518212427303336化学物质的反应速度y(g·min-1)6830277020565350解根据收集的数据,作散点图(如图),根据已有的函数知识,可以发现样本点分布在某一条指数函数曲数y=c1ec2x的周围,其中c1和c2是待定的参数.令z=lny,则z=lny=lnc1+c2x,即变换后的样本点应该分布在直线z=a+bx(a=lnc1,b=c2)的周围.由y与x的数据表可得到变换后的z与x的数据表:x1518212427303336z1.7922.0793.4013.2964.2485.3234.1745.858作出z与x的散点图(如图).由散点图可观察到,变换后的样本点分布在一条直线的附近,所以可用线性回归方程来拟合.由z与x的数据表,可得线性回归方程:z=0.848+0.81x,所以y与x之间的非线性回归方程为y=e0.848+0.81x.反思与感悟

可线性化的回归分析问题,画出已知数据的散点图,选择跟散点拟合得最好的函数模型进行变量代换,作出变换后样本点的散点图,用线性回归模型拟合.跟踪训练2

电容器充电后,电压达到100V,然后开始放电,由经验知道,此后电压U随时间t变化的规律用公式U=Aebt(b<0)表示,现测得时间t(s)时的电压U(V)如下表:t/s012345678910U/V100755540302015101055试求:电压U对时间t的回归方程.(提示:对公式两边取自然对数,把问题转化为线性回归分析问题)解对U=Aebt两边取对数得lnU=lnA+bt,令y=lnU,a=lnA,x=t,则y=a+bx,得y与x的数据如下表:x012345678910y4.64.34.03.73.43.02.72.32.31.61.6由y=lnU,得U=ey,U=e4.61-0.313x=e4.16·e-0.313x,因此电压U对时间t的回归方程为U=e4.61·e-0.313x.题型三非线性回归模型的综合应用例3

某地区不同身高的未成年男性的体重平均值如下表:身高x/cm60708090100110体重y/kg6.137.909.9912.1515.0217.50身高x/cm120130140150160170体重y/kg20.9226.8631.1138.8547.2555.05试建立y与x之间的回归方程.解根据题干表中数据画出散点图如图所示.由图看出,样本点分布在某条指数函数曲线y=c1ec2x的周围,于是令z=lny.画出散点图如图所示.x60708090100110120130140150160170z1.812.072.302.502.712.863.043.293.443.663.864.01由表中数据可得z与x之间的线性回归方程:z=0.663+0.020x,则有y=e0.663+0.020x.反思与感悟

根据已有的函数知识,可以发现样本分布在某一条指数型函数曲线y=c1ec2x的周围,其中c1和c2是待定参数;可以通过对x进行对数变换,转化为线性相关关系.跟踪训练3

在试验中得到变量y与x的数据如下表:试求y与x之间的回归方程,并预测x=40时,y的值.x1923273135y41124109325解作散点图如图所示,从散点图可以看出,两个变量x,y不呈线性相关关系,根据学过的函数知识,样本点分布的曲线符合指数型函数y=c1ec2x,通过对数变化把指数关系变为线性关系,令z=lny,则z=bx+a(a=lnc1,b=c2).列表:x1923273135z1.3862.3983.1784.6915.784作散点图如图所示,从散点图可以看出,两个变量x,z呈很强的线性相关关系.由表中的数据得到线性回归方程为:z=0.277x-3.998.所以y关于x的指数回归方程为:y=e0.277x-3.998.所以,当x=40时,y=e0.277×40-3.998≈1190.347.A123412342.某种产品的广告费支出与销售额(单位:百万元)之间有如下对应数据:广告费24568销售额3040605070则广告费与销售额间的相关系数为(

)A.0.819 B.0.919C.0.923 D.0.95B3.根据统计资料,我国能源生产发展迅速.下面是我国能源生产总量(单位:亿吨标准煤)的几个统计数据:1234年份1996200120062011产量12.916.119.322.3根据有关专家预测,到2020年我国能源生产总量将达到27.6亿吨左右,则专家所选择的回归模型是下列四种模型中的哪一种(

)A.y=ax+b(a≠0)B.y=ax

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论