曲线拟合-课件_第1页
曲线拟合-课件_第2页
曲线拟合-课件_第3页
曲线拟合-课件_第4页
曲线拟合-课件_第5页
已阅读5页,还剩101页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

曲线拟合

Curvefitting郑大公卫统计教研室平智广曲线拟合

Curvefitting郑大公卫统计教研室1 医学研究中X和Y的数量关系常常不是线性的,如毒物剂量与动物死亡率,人的生长曲线,药物动力学等,都不是线性的。如果用线性描述将丢失大量信息,甚至得出错误结论。 医学研究中X和Y的数量关系常常不是线性的,如毒物剂2一、非线性关系的类型与特点根据非线性关系的性质和特点可大致分为6类:1.指数形式关系 2.对数形式关系3.幂形式关系 4.双曲形式关系5.S型形式关系 6.多项式形式关系一、非线性关系的类型与特点根据非线性关系的性质和特点可大致分3两种形式:a>0,b>0a>0,b<0(一)指数关系曲线当a>0,b>0时,Y随x的↑而↑,曲线凹向上;当a>0,b<0时,Y随x的↑而↓,曲线也是凹向上。两种形式:a>0,b>0a>0,b<0(一)指数关系曲4b>0b<0方程为:(二)对数关系曲线当b>0时,Y随x的↑而↑,曲线凸向上;当b<0时,Y随x的↑而↓,曲线凹向上。根据对数函数的性质,x为大于0的正数。b>0b<0方程为:(二)对数关系曲线当b>0时,Y随5a>0,0<b<1a>0,b>1a>0,b<0方程为:(三)幂关系曲线当a>0,b>1时,Y随x的↑而↑,曲线凹向上;当a>0,0<b<1时,Y随x的↑而↑,曲线凸向上;当a>0,b<0时,Y随x的↑而↓,曲线凹向上,且以x轴和y轴为渐近线。a>0,0<b<1a>0,b>1a>0,b<0方程为:(三6(四)双曲关系曲线a>0,b>0a>0,b<0 当a>0,b>0时,Y随x的↑而↑,速率趋小,曲线凸向上,并向y=1/b渐进; 当a>0,b<0时,Y随x的↑而↓,速率趋大,曲线凹向上,并向y=-a/b渐近。(四)双曲关系曲线a>0,b>0a>0,b<0 当a>0,7(五)S型曲线S型曲线由于其曲线形状与动、植物的生长过程的基本特点类似,故又称生长曲线,曲线一开始时增长较慢,而在以后的某一范围内迅速增长,达到一定的限度后增长又缓慢下来,曲线呈拉长的”S”,故称S曲线最著名的曲线是Logistic生长曲线,它最早由比利时数学家P.F.Vehulst于1838年导出,但直至20世纪20年代才被生物学家及统计学家R.Pearl和L.J.Reed重新发现,并逐渐被人们所发现。目前它已广泛应用于多领域的模拟研究。(五)S型曲线S型曲线由于其曲线形状与动、植物的生长过程的8曲线拟合-课件9(6)多项式回归 当两个变数间的曲线关系很难确定时,可以适应多项式去逼近,称为多项式回归(polynomialregression)。 最简单的是二次多项式,其方程为:(6)多项式回归 当两个变数间的曲线关系很难确定时,可以适10它的图象是抛物线。当b2>0时,曲线凹向上,有一个极小值;b2<

0时,曲线凸向上,有一个极大值。它的图象是抛物线。11曲线直线化估计(Curveestimation)非线性/曲线回归(Nonlinear/curvilinearregression)解决办法曲线直线化估计(Curveestimation)解决办法12二、曲线直线化拟合曲线回归方程的步骤:根据变数X与Y之间的确切关系,选择适当的曲线类型。对选定的曲线类型,在线性化后按最小二乘法原理配置直线回归方程。将直线回归方程转换成相应的曲线回归方程,并对有关统计参数作出推断。比较决定系数选取“最佳”曲线方程二、曲线直线化拟合曲线回归方程的步骤:13(一)对数关系曲线的拟合例1:上海医科大学微生物学教研室以已知浓度X的免疫球蛋白A(IgA,μg/ml)作火箭电泳,测得火箭高度Y(mm)如表1所示。试拟合Y关于X的非线性回归方程。(一)对数关系曲线的拟合例1:上海医科大学微生物学教研室以14XY0.27.60.412.30.615.70.818.21.018.71.221.41.422.61.623.8合计140.3表1免疫球蛋白与火箭高度的关系XY0.27.60.412.30.615.70151.绘制散点图,决定曲线类型

2.曲线直线化变换1.绘制散点图,决定曲线类型

2.曲线直线化变换16XYX'=lnX(lnX')2Y2(lnX')Y

残差平方0.27.6-1.60942.590257.76-12.23147.230.13800.412.3-0.91630.8396151.29-11.270512.620.10170.615.7-0.51080.2609246.49-8.019615.770.00530.818.2-0.22310.0498331.24-4.060418.010.03611.018.700.0000349.690.000019.751.09211.221.40.18230.0332457.963.901221.160.05631.422.60.33650.1132510.767.604922.360.05661.623.80.47000.2209566.4411.186023.40

0.1597合计140.3-2.27084.1078

2671.63

-12.8898

1.6458表2免疫球蛋白与火箭高度的关系XYX'=lnX(lnX')2173.建立线性回归方程

回归方程为:=19.7451+7.7771lnX方差分析有统计学意义,P=0.0000,F=763.50,表明回归方程有贡献。确定系数为0.992,表明回归拟合原资料很好。3.建立线性回归方程回归方程为:=19.7451+7.18(二)指数函数拟合例2:表2为15名重伤病人的住院天数X与预后指数Y的数据,根据两者的关系拟合曲线。表2重伤病人的住院天数X与预后指数Y编号123456789101112131415X257101419263134384552536065Y54504537352520161813811846(二)指数函数拟合例2:表2为15名重伤病人的住院天数X与191.绘制散点图,决定曲线类型2.曲线直线化变换1.绘制散点图,决定曲线类型2.曲线直线化变换203.建立线性回归方程回归方程为:4.037-0.038X方差分析有统计学意义,P<0.0001,F=276.38,表明回归方程有贡献。R2为0.9551,表明回归拟合原资料较好。转换为原方程的另一种形式:3.建立线性回归方程回归方程为:4.021曲线直线化Analyze→Regression→CurveEstimation…可选Power、Logarithmic、Exponential、Quadratic、Cubic等非线性回归Analyze→Regression→Nonlinear… 设置模型:ModelExpression 参数赋初值:Parameters…三、采用SPSS进行曲线拟合曲线直线化三、采用SPSS进行曲线拟合22当仅分析两个变量之间的数量关系时,可以通过curveestimation进行估计,此过程即为进行曲线直线化的过程。(一)CurveEstimation当仅分析两个变量之间的数量关系时,可以通过curveest23LinearQuadraticCompoundGrowthLogarithmicCubicSExponentialInversePowerLogisticLinear24曲线拟合-课件25曲线拟合-课件26(二)非线性回归变量变化可以解决一部分曲线拟合的问题,直线回归采用的是最小二乘法,它保证的是变换后的残差平方和最小,如果变换回原始数据,不一定是最优方程;曲线关系极为复杂时,简单的变量变化往往不能转换为直线方程;CurveEstimation仅能进行简单的曲线拟合,而且其原理也是曲线直线化。(二)非线性回归变量变化可以解决一部分曲线拟合的问题,直线回27曲线拟合-课件28-0.03958645282527-0.0395864528252729曲线拟合-课件30曲线拟合-课件31曲线直线化非线性最小二乘法比较两个回归方程可见,对同一份样本采用不同估计方法得到的结果并不相同。主要因为曲线直线化以后的回归只对变换后的Y*(=lnY)负责,得到的线性方程可使Y*与其估计值之间的残差平方和最小,并不保证原变量Y与其估计值之间的残差平方和也是最小。曲线直线化非线性最小二乘法比较两个回32 对于例2,几个常见曲线拟合得到的决定系数R2如下(曲线直线化):线性R2:0.8856(y=46.4604-0.7525x)幂曲线R2:0.8293(y=159.9297x-0.7191)对数曲线R2:0.9654(y=72.2829-15.9662ln(x))指数曲线R2:0.9551(y=56.6651e-0.0380x)二项式R2:0.9812(y=55.8221-1.7103x+0.0148x2) 对于例2,几个常见曲线拟合得到的决定系数R2如下(曲线直线33 对于例2,几个常见曲线拟合得到的决定系数R2如下(非线性回归——迭代法):线性R2:0.8856(y=46.4604-0.7525x)幂曲线R2:0.8413(y=88.7890x-0.4662)对数曲线R2:0.9654(y=72.2829-15.9662ln(x))指数曲线R2:0.9875(y=58.6066e-0.0396x)二项式R2:0.9812(y=55.8221-1.7103x+0.0148x2) 对于例2,几个常见曲线拟合得到的决定系数R2如下(非线性回34 原变量Y与(直线或曲线方程得到)间相关系数的绝对值=相关指数R线性R:=X与Y间相关系数绝对值幂曲线R:=lnX与lnY间相关系数绝对值对数曲线R:=lnX与Y间相关系数绝对值指数曲线R:=X与lnY间相关系数绝对值二项式R:=√(1-SS残差/SS总)R的计算(曲线直线化) 原变量Y与(直线或曲线方程得到)间相关系数的绝对值=相35R的计算(非线性回归) 原变量Y与(直线或曲线方程得到)间相关系数的绝对值=相关指数R线性R:=X与Y间相关系数绝对值幂曲线R:≠lnX与lnY间相关系数绝对值对数曲线R:=lnX与Y间相关系数绝对值指数曲线R:≠

X与lnY间相关系数绝对值二项式R:=√(1-SS残差/SS总)R的计算(非线性回归) 原变量Y与(直线或曲线方程得到)36散点图辨析

散点图辨析37如果条件允许最好采用非线性回归(NonlinearRegression)拟合幂函数曲线与指数函数曲线注意绘制散点图,并结合专业知识解释如果条件允许最好采用非线性回归(NonlinearRegr38曲线拟合-课件39曲线拟合-课件4013<06.9580.108-6-113<06.9580.108-6-141曲线拟合-课件42曲线拟合-课件43曲线拟合-课件44四、曲线回归的注意事项(一)初始值设定一般来说,当拟合模型较为简单,数据也不多时,无论初始值如何,通过迭代都可以最终达到正确结果。但在拟合复杂模型时,如果初始值设定不合理,常常造成迭代不收敛或者得到模型的局部最优解,而不是全局最优解。多选几个初始值进行拟合,观察最终分析结果是否相同,若不同,则筛选出最有结果;从图形上取几个点,解出各参数的近似值,将其作为初始值代入;迭代时首先简化模型,拟合不太复杂的雏形,然后逐渐添加内容,最终拟合目标函数。四、曲线回归的注意事项(一)初始值设定45(二)模型的分段拟合许多情况下变量间的非线性关系不太好用一个统一的函数关系来定义,但如果分为几段,则非常容易表达。(二)模型的分段拟合许多情况下变量间的非线性关系不太好用一个46五、非线性回归软件介绍目前世界上在该领域有名的软件工具包很多,如:OriginPro、Matlab、SAS、SPSS、DataFit、GraphPad、TableCurve2D、TableCurve3D等。进行非线性回归时,均需用户提供适当的参数初始值以便计算能够收敛并找到最优解。如果设定的参数初始值不当则计算难以收敛,其结果是无法求得正确结果。而在实际应用当中,对大多数用户来说,给出(猜出)恰当的初始值是件相当困难的事,特别是在参数量较多的情况下,更无异于是场噩梦。五、非线性回归软件介绍目前世界上在该领域有名的软件工具包很多47(一)采用SAS进行曲线拟合(一)采用SAS进行曲线拟合48(二)利用Origin进行曲线拟合(二)利用Origin进行曲线拟合491stOpt(FirstOptimization)1stOpt是世界领先的非线性曲线拟合,是七维高科有限公司独立开发的一套数学优化分析综合工具软件包。在非线性回归、曲线拟合、非线性复杂工程模型参数估算求解等领域,居世界领先地位。界面简单易用,采用通用全局优化算法求解,该算法之最大特点是克服了当今世界上在优化计算领域中使用迭代法必须给出合适初始值的难题,即用户勿需给出参数初始值,而由1stOpt随机给出,通过其独特的全局优化算法,最终找出最优解。1stOpt凭借其超强的寻优,容错能力,在大多数情况下(大于90%),从任一随机初始值开始,都能求得正确结果。1stOpt(FirstOptimization)1stO50曲线拟合-课件51LINGOLingo是LinearInteractiveandGeneralOptimizer的缩写,即“交互式的线性和通用优化求解器”,由美国LINDO系统公司推出的,可以用于求解非线性规划,也可以用于一些线性和非线性方程组的求解等,功能十分强大,是求解优化模型的最佳选择。其特色在于内置建模语言,提供十几个内部函数,可以允许决策变量是整数(即整数规划,包括0-1整数规划),方便灵活,而且执行速度非常快。能方便与EXCEL,数据库等其他软件交换数据。LINGOLingo是LinearInteractive52Thankyou!Thankyou!53曲线拟合

Curvefitting郑大公卫统计教研室平智广曲线拟合

Curvefitting郑大公卫统计教研室54 医学研究中X和Y的数量关系常常不是线性的,如毒物剂量与动物死亡率,人的生长曲线,药物动力学等,都不是线性的。如果用线性描述将丢失大量信息,甚至得出错误结论。 医学研究中X和Y的数量关系常常不是线性的,如毒物剂55一、非线性关系的类型与特点根据非线性关系的性质和特点可大致分为6类:1.指数形式关系 2.对数形式关系3.幂形式关系 4.双曲形式关系5.S型形式关系 6.多项式形式关系一、非线性关系的类型与特点根据非线性关系的性质和特点可大致分56两种形式:a>0,b>0a>0,b<0(一)指数关系曲线当a>0,b>0时,Y随x的↑而↑,曲线凹向上;当a>0,b<0时,Y随x的↑而↓,曲线也是凹向上。两种形式:a>0,b>0a>0,b<0(一)指数关系曲57b>0b<0方程为:(二)对数关系曲线当b>0时,Y随x的↑而↑,曲线凸向上;当b<0时,Y随x的↑而↓,曲线凹向上。根据对数函数的性质,x为大于0的正数。b>0b<0方程为:(二)对数关系曲线当b>0时,Y随58a>0,0<b<1a>0,b>1a>0,b<0方程为:(三)幂关系曲线当a>0,b>1时,Y随x的↑而↑,曲线凹向上;当a>0,0<b<1时,Y随x的↑而↑,曲线凸向上;当a>0,b<0时,Y随x的↑而↓,曲线凹向上,且以x轴和y轴为渐近线。a>0,0<b<1a>0,b>1a>0,b<0方程为:(三59(四)双曲关系曲线a>0,b>0a>0,b<0 当a>0,b>0时,Y随x的↑而↑,速率趋小,曲线凸向上,并向y=1/b渐进; 当a>0,b<0时,Y随x的↑而↓,速率趋大,曲线凹向上,并向y=-a/b渐近。(四)双曲关系曲线a>0,b>0a>0,b<0 当a>0,60(五)S型曲线S型曲线由于其曲线形状与动、植物的生长过程的基本特点类似,故又称生长曲线,曲线一开始时增长较慢,而在以后的某一范围内迅速增长,达到一定的限度后增长又缓慢下来,曲线呈拉长的”S”,故称S曲线最著名的曲线是Logistic生长曲线,它最早由比利时数学家P.F.Vehulst于1838年导出,但直至20世纪20年代才被生物学家及统计学家R.Pearl和L.J.Reed重新发现,并逐渐被人们所发现。目前它已广泛应用于多领域的模拟研究。(五)S型曲线S型曲线由于其曲线形状与动、植物的生长过程的61曲线拟合-课件62(6)多项式回归 当两个变数间的曲线关系很难确定时,可以适应多项式去逼近,称为多项式回归(polynomialregression)。 最简单的是二次多项式,其方程为:(6)多项式回归 当两个变数间的曲线关系很难确定时,可以适63它的图象是抛物线。当b2>0时,曲线凹向上,有一个极小值;b2<

0时,曲线凸向上,有一个极大值。它的图象是抛物线。64曲线直线化估计(Curveestimation)非线性/曲线回归(Nonlinear/curvilinearregression)解决办法曲线直线化估计(Curveestimation)解决办法65二、曲线直线化拟合曲线回归方程的步骤:根据变数X与Y之间的确切关系,选择适当的曲线类型。对选定的曲线类型,在线性化后按最小二乘法原理配置直线回归方程。将直线回归方程转换成相应的曲线回归方程,并对有关统计参数作出推断。比较决定系数选取“最佳”曲线方程二、曲线直线化拟合曲线回归方程的步骤:66(一)对数关系曲线的拟合例1:上海医科大学微生物学教研室以已知浓度X的免疫球蛋白A(IgA,μg/ml)作火箭电泳,测得火箭高度Y(mm)如表1所示。试拟合Y关于X的非线性回归方程。(一)对数关系曲线的拟合例1:上海医科大学微生物学教研室以67XY0.27.60.412.30.615.70.818.21.018.71.221.41.422.61.623.8合计140.3表1免疫球蛋白与火箭高度的关系XY0.27.60.412.30.615.70681.绘制散点图,决定曲线类型

2.曲线直线化变换1.绘制散点图,决定曲线类型

2.曲线直线化变换69XYX'=lnX(lnX')2Y2(lnX')Y

残差平方0.27.6-1.60942.590257.76-12.23147.230.13800.412.3-0.91630.8396151.29-11.270512.620.10170.615.7-0.51080.2609246.49-8.019615.770.00530.818.2-0.22310.0498331.24-4.060418.010.03611.018.700.0000349.690.000019.751.09211.221.40.18230.0332457.963.901221.160.05631.422.60.33650.1132510.767.604922.360.05661.623.80.47000.2209566.4411.186023.40

0.1597合计140.3-2.27084.1078

2671.63

-12.8898

1.6458表2免疫球蛋白与火箭高度的关系XYX'=lnX(lnX')2703.建立线性回归方程

回归方程为:=19.7451+7.7771lnX方差分析有统计学意义,P=0.0000,F=763.50,表明回归方程有贡献。确定系数为0.992,表明回归拟合原资料很好。3.建立线性回归方程回归方程为:=19.7451+7.71(二)指数函数拟合例2:表2为15名重伤病人的住院天数X与预后指数Y的数据,根据两者的关系拟合曲线。表2重伤病人的住院天数X与预后指数Y编号123456789101112131415X257101419263134384552536065Y54504537352520161813811846(二)指数函数拟合例2:表2为15名重伤病人的住院天数X与721.绘制散点图,决定曲线类型2.曲线直线化变换1.绘制散点图,决定曲线类型2.曲线直线化变换733.建立线性回归方程回归方程为:4.037-0.038X方差分析有统计学意义,P<0.0001,F=276.38,表明回归方程有贡献。R2为0.9551,表明回归拟合原资料较好。转换为原方程的另一种形式:3.建立线性回归方程回归方程为:4.074曲线直线化Analyze→Regression→CurveEstimation…可选Power、Logarithmic、Exponential、Quadratic、Cubic等非线性回归Analyze→Regression→Nonlinear… 设置模型:ModelExpression 参数赋初值:Parameters…三、采用SPSS进行曲线拟合曲线直线化三、采用SPSS进行曲线拟合75当仅分析两个变量之间的数量关系时,可以通过curveestimation进行估计,此过程即为进行曲线直线化的过程。(一)CurveEstimation当仅分析两个变量之间的数量关系时,可以通过curveest76LinearQuadraticCompoundGrowthLogarithmicCubicSExponentialInversePowerLogisticLinear77曲线拟合-课件78曲线拟合-课件79(二)非线性回归变量变化可以解决一部分曲线拟合的问题,直线回归采用的是最小二乘法,它保证的是变换后的残差平方和最小,如果变换回原始数据,不一定是最优方程;曲线关系极为复杂时,简单的变量变化往往不能转换为直线方程;CurveEstimation仅能进行简单的曲线拟合,而且其原理也是曲线直线化。(二)非线性回归变量变化可以解决一部分曲线拟合的问题,直线回80曲线拟合-课件81-0.03958645282527-0.0395864528252782曲线拟合-课件83曲线拟合-课件84曲线直线化非线性最小二乘法比较两个回归方程可见,对同一份样本采用不同估计方法得到的结果并不相同。主要因为曲线直线化以后的回归只对变换后的Y*(=lnY)负责,得到的线性方程可使Y*与其估计值之间的残差平方和最小,并不保证原变量Y与其估计值之间的残差平方和也是最小。曲线直线化非线性最小二乘法比较两个回85 对于例2,几个常见曲线拟合得到的决定系数R2如下(曲线直线化):线性R2:0.8856(y=46.4604-0.7525x)幂曲线R2:0.8293(y=159.9297x-0.7191)对数曲线R2:0.9654(y=72.2829-15.9662ln(x))指数曲线R2:0.9551(y=56.6651e-0.0380x)二项式R2:0.9812(y=55.8221-1.7103x+0.0148x2) 对于例2,几个常见曲线拟合得到的决定系数R2如下(曲线直线86 对于例2,几个常见曲线拟合得到的决定系数R2如下(非线性回归——迭代法):线性R2:0.8856(y=46.4604-0.7525x)幂曲线R2:0.8413(y=88.7890x-0.4662)对数曲线R2:0.9654(y=72.2829-15.9662ln(x))指数曲线R2:0.9875(y=58.6066e-0.0396x)二项式R2:0.9812(y=55.8221-1.7103x+0.0148x2) 对于例2,几个常见曲线拟合得到的决定系数R2如下(非线性回87 原变量Y与(直线或曲线方程得到)间相关系数的绝对值=相关指数R线性R:=X与Y间相关系数绝对值幂曲线R:=lnX与lnY间相关系数绝对值对数曲线R:=lnX与Y间相关系数绝对值指数曲线R:=X与lnY间相关系数绝对值二项式R:=√(1-SS残差/SS总)R的计算(曲线直线化) 原变量Y与(直线或曲线方程得到)间相关系数的绝对值=相88R的计算(非线性回归) 原变量Y与(直线或曲线方程得到)间相关系数的绝对值=相关指数R线性R:=X与Y间相关系数绝对值幂曲线R:≠lnX与lnY间相关系数绝对值对数曲线R:=lnX与Y间相关系数绝对值指数曲线R:≠

X与lnY间相关系数绝对值二项式R:=√(1-SS残差/SS总)R的计算(非线性回归) 原变量Y与(直线或曲线方程得到)89散点图辨析

散点图辨析90如果条件允许最好采用非线性回归(NonlinearRegression)拟合幂函数曲线与指数函数曲线注意绘制散点图,并结合专业知识解释如果条件允许最好采用非线性回归(NonlinearRegr91曲线拟合-课件92曲线拟合-课件9313<06.9580.108-6-113<06.9580.108-6-194曲线拟合-课件95

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论