曲线拟合精选课件_第1页
曲线拟合精选课件_第2页
曲线拟合精选课件_第3页
曲线拟合精选课件_第4页
曲线拟合精选课件_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、曲线拟合Curve fitting 郑大公卫统计教研室平智广 医学研究中X和Y的数量关系常常不是线性的,如毒物剂量与动物死亡率,人的生长曲线,药物动力学等,都不是线性的。如果用线性描述将丢失大量信息,甚至得出错误结论。一、非线性关系的类型与特点根据非线性关系的性质和特点可大致分为6类:1. 指数形式关系2.对数形式关系3. 幂形式关系4.双曲形式关系5. S型形式关系6.多项式形式关系两种形式:a 0,b0a 0,b0,b0时,Y随x的而,曲线凹向上;当a0,b0 b 0时,Y随x的而,曲线凸向上;当b0,0b0,b1a 0,b0,b1时,Y随x的而,曲线凹向上;当a0,0b0,b0,b0a0

2、,b0,b0时,Y随x的而,速率趋小,曲线凸向上,并向y=1/b渐进;当a0,b0时,Y随x的而,速率趋大,曲线凹向上,并向y=-a/b渐近。(五) S型曲线S型曲线由于其曲线形状与动、植物的生长过程的基本特点类似,故又称生长曲线,曲线一开始时增长较慢,而在以后的某一范围内迅速增长,达到一定的限度后增长又缓慢下来,曲线呈拉长的”S”,故称S曲线最著名的曲线是Logistic生长曲线,它最早由比利时数学家P.F.Vehulst于1838年导出,但直至20世纪20年代才被生物学家及统计学家R.Pearl和L.J. Reed 重新发现,并逐渐被人们所发现。目前它已广泛应用于多领域的模拟研究。(6)多

3、项式回归当两个变数间的曲线关系很难确定时,可以适应多项式去逼近,称为多项式回归(polynomial regression)。最简单的是二次多项式,其方程为:它的图象是抛物线。当b20时,曲线凹向上,有一个极小值; b2 0 时,曲线凸向上,有一个极大值。曲线直线化估计(Curve estimation)非线性/曲线回归(Nonlinear/curvilinear regression) 解决办法二、曲线直线化拟合曲线回归方程的步骤:根据变数X与Y之间的确切关系,选择适当的曲线类型。对选定的曲线类型,在线性化后按最小二乘法原理配置直线回归方程。将直线回归方程转换成相应的曲线回归方程,并对有关统

4、计参数作出推断。比较决定系数选取“最佳”曲线方程(一) 对数关系曲线的拟合例1:上海医科大学微生物学教研室以已知浓度X的免疫球蛋白A(IgA, g/ml)作火箭电泳, 测得火箭高度Y(mm)如表1所示。试拟合Y关于X的非线性回归方程。 XY 0.2 7.6 0.412.3 0.615.7 0.818.2 1.018.7 1.221.4 1.422.6 1.623.8合计140.3表1 免疫球蛋白与火箭高度的关系1.绘制散点图,决定曲线类型2.曲线直线化变换 XYXlnX(lnX)2 Y2 (lnX)Y 残差平方 0.27.6-1.60942.5902 57.76 -12.2314 7.23 0

5、.1380 0.412.3-0.91630.8396 151.29 -11.2705 12.62 0.1017 0.615.7-0.51080.2609 246.49 -8.0196 15.77 0.0053 0.818.2-0.22310.0498 331.24 -4.0604 18.01 0.0361 1.018.7 00.0000 349.69 0.0000 19.75 1.0921 1.221.40.18230.0332 457.96 3.9012 21.16 0.0563 1.422.60.33650.1132 510.76 7.6049 22.36 0.0566 1.623.80.

6、47000.2209 566.44 11.1860 23.40 0.1597 合计140.3-2.27084.1078 2671.63 -12.8898 1.6458表2 免疫球蛋白与火箭高度的关系3.建立线性回归方程 回归方程为: =19.7451+7.7771lnX方差分析有统计学意义,P0.0000,F763.50,表明回归方程有贡献。确定系数为0.992,表明回归拟合原资料很好。(二) 指数函数拟合例2:表2为15名重伤病人的住院天数X与预后指数Y的数据,根据两者的关系拟合曲线。表2 重伤病人的住院天数X与预后指数Y编号123456789101112131415X25710141926

7、3134384552536065Y545045373525201618138118461. 绘制散点图,决定曲线类型2. 曲线直线化变换3. 建立线性回归方程 回归方程为: 4.037-0.038X方差分析有统计学意义,P0.0001,F276.38,表明回归方程有贡献。R2为0.9551,表明回归拟合原资料较好。转换为原方程的另一种形式:曲线直线化AnalyzeRegressionCurve Estimation 可选Power 、Logarithmic、Exponential、Quadratic、Cubic 等 非线性回归AnalyzeRegression Nonlinear 设置模型:

8、Model Expression 参数赋初值:Parameters 三、采用SPSS进行曲线拟合当仅分析两个变量之间的数量关系时,可以通过curve estimation进行估计,此过程即为进行曲线直线化的过程。(一) Curve EstimationLinearQuadraticCompoundGrowthLogarithmicCubicSExponentialInversePowerLogistic(二)非线性回归变量变化可以解决一部分曲线拟合的问题,直线回归采用的是最小二乘法,它保证的是变换后的残差平方和最小,如果变换回原始数据,不一定是最优方程;曲线关系极为复杂时,简单的变量变化往往不

9、能转换为直线方程;Curve Estimation仅能进行简单的曲线拟合,而且其原理也是曲线直线化。-0.03958645282527曲线直线化 非线性最小二乘法比较两个回归方程可见,对同一份样本采用不同估计方法得到的结果并不相同。主要因为曲线直线化以后的回归只对变换后的Y*(lnY)负责, 得到的线性方程可使Y*与其估计值 之间的残差平方和最小,并不保证原变量Y与其估计值 之间的残差平方和也是最小。对于例2,几个常见曲线拟合得到的决定系数R2如下(曲线直线化):线 性R2:0.8856 (y=46.4604 -0.7525x)幂 曲 线R2:0.8293 (y=159.9297x-0.719

10、1)对数曲线R2:0.9654 (y=72.2829 -15.9662ln(x)指数曲线R2:0.9551 (y=56.6651e-0.0380 x)二 项 式R2:0.9812 (y=55.8221-1.7103x+0.0148x2)对于例2,几个常见曲线拟合得到的决定系数R2如下(非线性回归迭代法):线 性R2:0.8856 (y=46.4604-0.7525x)幂 曲 线R2:0.8413 (y=88.7890 x-0.4662)对数曲线R2:0.9654 (y=72.2829-15.9662ln(x) )指数曲线R2:0.9875(y = 58.6066e-0.0396x)二 项 式R

11、2:0.9812(y=55.8221-1.7103x+0.0148x2)原变量Y与 (直线或曲线方程得到)间相关系数的绝对值相关指数R线 性R:X与Y间相关系数绝对值幂 曲 线R:lnX与lnY间相关系数绝对值对数曲线R:lnX与Y间相关系数绝对值指数曲线R:X与lnY间相关系数绝对值二 项 式R:(1SS残差/SS总)R的计算(曲线直线化)R的计算(非线性回归)原变量Y与 (直线或曲线方程得到)间相关系数的绝对值相关指数R线 性R:X与Y间相关系数绝对值幂 曲 线R:lnX与lnY间相关系数绝对值对数曲线R:lnX与Y间相关系数绝对值指数曲线R: X与lnY间相关系数绝对值二 项 式R:(1

12、SS残差/SS总)散点图辨析 如果条件允许最好采用非线性回归(Nonlinear Regression)拟合幂函数曲线与指数函数曲线注意绘制散点图,并结合专业知识解释1306.9580.108-6-1四、曲线回归的注意事项(一) 初始值设定一般来说,当拟合模型较为简单,数据也不多时,无论初始值如何,通过迭代都可以最终达到正确结果。但在拟合复杂模型时,如果初始值设定不合理,常常造成迭代不收敛或者得到模型的局部最优解,而不是全局最优解。多选几个初始值进行拟合,观察最终分析结果是否相同,若不同,则筛选出最有结果;从图形上取几个点,解出各参数的近似值,将其作为初始值代入;迭代时首先简化模型,拟合不太复

13、杂的雏形,然后逐渐添加内容,最终拟合目标函数。(二)模型的分段拟合许多情况下变量间的非线性关系不太好用一个统一的函数关系来定义,但如果分为几段,则非常容易表达。五、非线性回归软件介绍目前世界上在该领域有名的软件工具包很多,如:Origin Pro、Matlab、SAS、SPSS、DataFit、GraphPad、TableCurve2D、TableCurve3D等。进行非线性回归时,均需用户提供适当的参数初始值以便计算能够收敛并找到最优解。如果设定的参数初始值不当则计算难以收敛,其结果是无法求得正确结果。而在实际应用当中,对大多数用户来说,给出(猜出)恰当的初始值是件相当困难的事,特别是在参数

14、量较多的情况下,更无异于是场噩梦。(一) 采用SAS进行曲线拟合(二) 利用Origin进行曲线拟合1stOpt(First Optimization)1stOpt是世界领先的非线性曲线拟合,是七维高科有限公司独立开发的一套数学优化分析综合工具软件包。在非线性回归、曲线拟合、非线性复杂工程模型参数估算求解等领域,居世界领先地位。界面简单易用,采用通用全局优化算法求解,该算法之最大特点是克服了当今世界上在优化计算领域中使用迭代法必须给出合适初始值的难题,即用户勿需给出参数初始值,而由1stOpt随机给出,通过其独特的全局优化算法,最终找出最优解。1stOpt凭借其超强的寻优,容错能力,在大多数情况下(大于90%),从任一随机初始值开始,都能求得正确结果。LINGOLingo是Linear In

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论