一元非线性回归与相关演示文稿_第1页
一元非线性回归与相关演示文稿_第2页
一元非线性回归与相关演示文稿_第3页
一元非线性回归与相关演示文稿_第4页
一元非线性回归与相关演示文稿_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一元非线性回归与相关演示文稿第一页,共六十二页。优选一元非线性回归与相关第二页,共六十二页。对幂函数直化的主要手段是两边取常用对数。(或自然对数), 取常用对数如下:1. 幂函数直化7.2.1 可化为直线的非线性回归图7.5 幂函数-1by = a x0b1b1 b=1y由对数性质得0 这种类型的回归方程一般只确定两个参数。7.29幂函数式为:(见图7.5)第三页,共六十二页。然后再转换 a, 即:lg a = a回归方程 -1令:可得幂函数的直化回归方程为 例7.7 已测得云杉平均胸径x(cm)与平均树高 y(m)的资料,试配合幂函数的回归方程 ;再试配合二次抛物线方程* 。7.30* 注:

2、 一元二次抛物线方程的配合过程见本章所述。所以可得曲线第四页,共六十二页。 x y lg(x) lg(y) 1 15 13.9 1.176 1.143 2 20 17.1 1.301 1.233 3 25 20.0 1.398 1.301 4 30 22.1 1.477 1.344 5 35 24.0 1.544 1.380 6 40 25.6 1.602 1.408 7 45 27.0 1.653 1.431 8 50 28.3 1.699 1.452 9 55 29.4 1.740 1.46810 60 30.2 1.778 1.48011 65 31.4 1.813 1.497表7.4

3、云杉平均胸径与平均树高数据图7.6 云杉胸径树高散点图7.3115 20 25 30 35 40 45 50 55 60 65 3028 26 24 22 20 18 1614 .xy 对表7.4 x,y 画出散点图初步判定为幂函数, 分别对 x, y 取常用对数得表7.4 第4, 5列第五页,共六十二页。 解:利用计算器统计功能按下面步骤计算得直化后的回归方程:7.32第六页,共六十二页。所以可得幂函数的回归方程 对曲线相关的研究只研究其相关指数。曲线相关指数可定义为对a进行反对数转换得7.33第七页,共六十二页。 计算例7.7相关指数(见表7.5)15 13.9 14.63 -0.73 0

4、.5320 17.1 17.12 -0.02 0.00 25 20.0 19.33 0.67 0.4530 22.1 21.36 0.74 0.5535 24.0 23.23 0.77 0.59 40 25.6 24.99 0.61 0.3745 27.0 26.65 0.35 0.1250 28.3 28.23 0.07 0.0055 29.4 29.73 -0.33 0.1160 30.2 31.18 -0.98 0.96 65 31.4 32.57 -1.17 1.37 xi yi yi (yi - yi) (yi - yi) 2 440 269 Q =5.06表7.5 剩余平方和Q的计

5、算过程 注: 对曲线回归的检验较复杂,主要是Q的值较难求。7.34第八页,共六十二页。(1) 曲线关系检验表7.7 曲线回归的方差分析表差异来源 平方和 自由度 均方 均方比 F0.01 回 归 314.307 1 314.307 559.27* 10.6 剩 余 5.06 9 0.562 总 和 319.367 10Lyy =319.367 , Q = 5.06 U = 319.367 - 5.06=314.3077.35 对回归关系的检验:第九页,共六十二页。 (2) 直化关系检验表7.6 直化后的回归方差分析表差异来源 平方和 自由度 均方 均方比 F0.01 回 归 0.12478 1

6、 0.12478 367 * 10.6 剩 余 0.00308 9 0.00034 总 和 0.12786 107.36注:两种检验效果是一样的,如果曲线回归不能直化那么就只能用 曲线方法检验了。第十页,共六十二页。2. 指数函数直化指数函数 , 两边取自然对数可得(注意: 这里 x 变量并未转换)令:b0图7.7 指数函数图示x y则直化方程为:7.37第十一页,共六十二页。 例7.8 在栽培试验中, 测得某夏季绿肥播种15天后,每5天 x为一期的生长量y(kg), 所得数据如下, 试对该资料进行回归与相关分析。根据散点图7.8选择指数函数模型 y = ae 来研究。bx图7.8 绿肥5天一

7、期生长量曲线两边取自然对数:直化方程:153045500100200400300.7.38第十二页,共六十二页。表7.8 绿肥5天一期生长量数据 x y y= lny x y1 15 58 4.060 60.902 20 67 4.205 84.103 25 79 4.369 109.23 4 30 140 4.941 148.235 35 200 5.298 185.436 40 320 5.768 230.727 45 480 6.173 277.78 210 1344 34.814 1096.367.39第十三页,共六十二页。回归方程的配合:直化后的回归方程:7.40第十四页,共六十二页

8、。取反对数得:转曲线回归方程:表7.9 剩余平方和Q的计算过程 xi yi yi (yi - yi) (yi- yi ) 15 58 47.43 10.57 111.72 20 67 68.77 -1.77 3.13 25 79 99.81 -20.81 433.06 30 140 144.58 -4.58 20.98 35 200 209.41 -9.41 88.55 40 320 303.32 16.68 278.22 45 480 439.35 40.65 1652.42210 1344 2588.08相关指数计算:27.41第十五页,共六十二页。3. 双曲线函数直化a 0,b0(c)(

9、b)yyxxbxa 0,b0b00b(a).y令: 可直化为下式7.42第十六页,共六十二页。相关指数的意义和直线回归决定系的意义是一样的。这里不能用原始数据求直线相关系数r, r 只能用于直线, 不能用于曲线。可得:回归方城配合:对相关指数的说明:7.43第十七页,共六十二页。 例7.9 研究“岱字”棉自播至齐苗(以80%出苗为准)的天数(x)与日平均土温(y)的关系, 得下表7.10, 试作回归分析。表7.10 “岱字”棉至齐苗 天数与土温的关系xy3330272421183.0034.005.008.0015.0yx4 8 12 16 40 30 20 10 0.图7.10 “岱字棉”至

10、齐苗 天数土温的关系图7.4432第十八页,共六十二页。表7.11 “岱字”棉至齐苗天数与 土温的关系数据变换xyx= 1/x3330272421183.0034.005.008.0015.00.33330.27270.25000.20000.12500.066610.99898.18106.75004.80002.62501.1988xy所选模型:23直化式如下7.45xy22 0.1111 0.0744 0.0625 0.0400 0.0156 0.0044 1089 900 725 576 441 324153 1.2436 34.5537 0.308 4059第十九页,共六十二页。直化

11、回归方程:曲线回归方程:相关指数:7.46注: 本例还可用 y=a+bx 转换, 其中 y= xy , 其结果相同。 第二十页,共六十二页。 在农业试验中经常遇到一些曲线回归配合问题, 现列出几种常用的可直化的函数模型*如:密度与有效穗数间的关系。如:毛细管水的上升高度与时间的关系。如:叶绿素与透光度间的关系。如:棉纤维长分布与次数间关系。如:大豆密度与青荚产量间关系。* 注:农业试验统计莫惠栋 编著 上海科技出版社 1984如:洋葱鳞茎的直径与重量间的关系。7.47第二十一页,共六十二页。4. S 形曲线直化 在生物界中, 反应生物的累积发生量(率)y与时间、浓度、药品用量 x 等关系时,

12、可以用 S 形曲线来刻画。如: 动植物的累积发病率、累积死亡率、累积发生进度、繁殖过程与时间、浓度与药品用量的关系等。图7.11 对称的S形曲线图7.12 不对称的S形曲线时间 浓度 用量累积率yx时间 浓度 用量x累积率y7.48第二十二页,共六十二页。 (1) 对称的S 形曲线: 一些作物的日生长量或发生量等往往为正态或近似正态分布(下图左), 其累积量(率) y%与时间 x 则呈对称的S 形曲线(下图右)。xy日发生量日生长量日期图7.13 正态分布曲线图7.14 对称 s 形曲线xy%日期累积率累积量7.49第二十三页,共六十二页。 可将资料中的累积率y%视为正态分布的分布函数(u)=

13、PUu, 若将y% 转化为正态分布的u值, 则u与时间 x 就成为直线关系了, 但是u变量的取值有时为正或为负计算起来很不方便, 可采用 P = u+5 来解决。则 P =a+bx 。P 称概率单位值(不要和概率符号P 相混淆), 在一些统计书中可查到百分率与概率单位换算表。7.50对称的S 形曲线直化过程:第二十四页,共六十二页。 例7.10 研究某地越冬代棉花红铃虫的化蛹进度 y%与时间 x 的关系, 试进行回归分析。 解: 首先将观察日期转换为以5月31日为0的数值(x), 化蛹进度 y%与 x 成 S 形曲线, 再将 y%查表转换为概率单位值P, 而P与x即为直线了。 5 10 15

14、20 25 30 35 40 45 50 y%502575100.图7.15 棉红铃虫s形曲线图x 5 10 15 20 25 30 35 40 45 50 y%502575100.x7.51第二十五页,共六十二页。表7.12 棉花红铃虫化蛹进度表 月/日 x 天 y% P 概率单位 P6/5 5 3.5 3.1881 3.1264 3.16/10 10 6.4 3.4780 3.5627 7.5 6/15 15 14.6 3.9463 3.9991 15.86/20 20 31.4 4.5155 4.4354 28.66/25 25 45.6 4.8895 4.8718 44.96/30 3

15、0 60.4 5.2637 5.3082 62.17/5 35 75.2 5.6808 5.7445 77.27/10 40 90.2 6.2930 6.1809 88.17/15 45 95.4 6.6849 6.6172 94.77/20 50 97.5 6.9600 7.5360 98.0 275 50.8998y%7.52第二十六页,共六十二页。得回归方程:7.53第二十七页,共六十二页。例如: 测报 7月2日时即 x=32, 代入回归方程得P =5.4719 , 查表得P对应的累积率为68.15%P概率单位值P=2.756 + 0.0848x 1020304050 x. .73456

16、日期图7.16 概率单位与日期直线关系图可计算直线回归的相关系数7.54第二十八页,共六十二页。 (2) 不对称的 S 形曲线: 生物生长量或发生量 y 与时间 x 的曲线并不都是正态(图7.17), 其累积率也呈现出不对称的 S 形曲线(图7.18), xyxy%发生量日期日期生长量图7.18 不对称S形曲线图7.17 偏态曲线累积率7.55第二十九页,共六十二页。 例7.11 用氯氰菊酯对菜粉蝶五龄幼虫进行触杀毒力测定(LD50), 累积死亡率y%与单位体重药量 x ( /L)之间的图形呈不对称的 S 形曲线(见下图7.19), 试对其直化后进行回归分析。g如果将累积率 y% 转换成 P,

17、 则P 和时间 x 的关系仍然是曲线, 达不到直化的目的, 前面的方法不能直接搬用, 但是只要将 x 取对数转换 (lg x), 则P与 lgx 就为直线了, P = a + blgx 。7.56第三十页,共六十二页。 解: 将累积更正死亡率查百分率与概率单位值转换表得概率单位值P, 再将单位体重药量 转换为lgx 建立直化回归方程 0.007999 19.8 0.01559 32.2 0.0376 57.8 0.0684 81.7 0.131 92.3 x(g/L) 死亡率y% 表7.13 菜粉蝶五龄幼虫毒杀力测定12345图7.19 氯氰菊酯触杀菜 粉蝶毒力测定图单位体重药量y%累积死亡率

18、.10000.040.120.08806040200.16x7.57第三十一页,共六十二页。 0.007999 -2.097 19.8 4.1512 0.01559 -1.807 32.2 4.5379 0.0376 -1.425 57.8 5.1968 0.0684 -1.165 81.7 5.9040 0.131 -0.883 92.3 6.4255 -7.377 26.2154 平均 -1.4754 5.2431 x( /L) x= lgx y% P 概率单位 g表7.14 菜粉蝶五龄幼虫毒杀力测定数据123457.58第三十二页,共六十二页。7.59第三十三页,共六十二页。即: lgx

19、概率单位值 P-0.8-1.6-2.0-2.4.76543-1.4图7.20 直线回归方程 直线回归方程7.60第三十四页,共六十二页。1 0.007999 -2.097 19.8 4.1512 4.050 17.1 7.292 0.01559 -1.807 32.2 4.5379 4.607 34.7 6.253 0.0376 -1.425 57.8 5.1968 5.339 63.3 30.34 0.0684 -1.165 81.7 5.9040 5.839 80.9 0.645 0.131 -0.883 92.3 6.4255 6.379 91.6 0.49 -7.377 26.215

20、44.92 平 均 -1.475 5.2431 x( /L) x=lgx y% Pg表7.15 菜粉蝶五龄幼虫毒杀力测定预测及相关指数计算表Py%(yi yi)2ii7.61第三十五页,共六十二页。预测 x = 0.04( /L)时, 菜粉蝶五龄幼虫死亡率?概率单位值 P = 8.0746 + 1.9191lg 0.04 = 5.392, 将概率单位值转换为百分率: 5.392 转换为百分率65.25% , (查附表) 相关指数:r = 0.98 g 27.62 5. Logistic 生长曲线(S 形曲线) 动植物的生长或繁殖, 假定在无限空间、无限营养来源等无约束条件下进行, 则其生长或繁

21、第三十六页,共六十二页。殖量与时间的关系开始时为指数函数: 这种关系通常只能在一开始的一段时间内成立, 但实际上由于环境条件的恶化、营养的不足、衰老的加快、繁殖的减慢、死亡的增多等约束条件伴随而来, 不能保持稳定, 它们将改变这这种关系而呈现出 Logistic 曲线形式。7.63第三十七页,共六十二页。 称上式为自然生长方程。其中: y是生长量, 繁殖量(或累积率), K 是时间无限时 y 的极限量(率), x 为演变时间。该曲线与前两种 s 形曲线有所不同, 它没有正态分布或近似正态分布假定, 所以具有更广泛的适应性。(1) Logistic 函数表达式或7.64第三十八页,共六十二页。

22、(2) Logistic 函数的性质1. 当x = 0 时可算得起始量2. 当 x =- ln(1/a)/b, y = K/2 时为拐点, 即变化率从逐增过度到逐减的分界点。3. 当 x 在0 , - ln(1/a)/b 区间时变化率逐增; 在 -ln(1/a)/b , 变化率逐减。见图7.22xy 时间累积量累积率 %Kk2x = - ln(1/a)/b0图7.22 Logistic曲线.7.65拐点第三十九页,共六十二页。未知参数的确定:如果 y 是累积率则极限值 则K=100。如果 y 是生长量或繁殖量, 其极限 值 K 可由按下式近似求得在实际应用时 (x1, y1), (x2, y2

23、), (x3, y3), 是数据中的三对观察值, x1, x2, x3 是等间距的量, 间距不应太小, 间距小了算出的K值误差较大。7.66第四十页,共六十二页。 (3) Logistic 生长曲线直化过程将函数 变形得等式两边同除以 y 并取自然对数得令:则有: 再求解直线回归系数:a,- b 7.67第四十一页,共六十二页。 再对 a取反自然对数得曲线回归系数 a , 可得方程式 。 注意: 如果对式直化则有 (对回归系数a 不再取反对数)。即: , 式的 a 是不同的,这里必须指出用同一资料所配合的 曲线方程 和 是等价的。注: Logistic 曲线方程是由比利时数学家t于1838 年

24、导出,但长期湮没,至20世纪20年代才又被统计学家R.Pearl 和重新发现。该方程在动植物的饲养、栽培、资源、 生态、环境保护等方面的模拟研究中已有较广泛的应用。7.68第四十二页,共六十二页。 例7.13 试以生长曲线描述例7.10越冬代棉红铃虫化蛹进度和时间的关系。利用 Logistic 函数的数学性质, 求出拐点并解释其实际意义。 解:因为 y 变量是化蛹进度为百分数(%), 所以当发生时间 x 无限时y 的极限值 K =100 分析计算过程:7.69第四十三页,共六十二页。表7.17 棉红铃虫化蛹进度和时间表x(天) y% 100 -yy ln( )100 -yy 5 3.5 27.

25、571 3.316810 6.4 14.625 2.682715 14.6 5.8493 1.766320 31.4 2.1847 0.781525 45.6 1.1930 0.176530 60.4 0.6556 -0.422235 75.2 0.3298 -1.109340 90.2 0.1068 -2.219645 95.4 0.0482 -3.032050 97.5 0.0256 -3.6636iiii7.70第四十四页,共六十二页。反对数求 a 可得:得曲线回归方程:或7.71第四十五页,共六十二页。当 x = 0 时化蛹进度 y% =1.58%, 当 x =-ln(1/62.088

26、64)/0.156395 = 26.4为拐点, 见图7.23。说明在6月27日时化蛹进度达 y% = 50%, 6月27日前化蛹进度是逐增的, 6月27日以后化蛹进度就逐渐减慢。 图7.23 棉红铃虫化蛹进度xy%化蛹进度日期102030405025507510050%100%6月27日. 07.72第四十六页,共六十二页。 例7.14 测定某种肉用鸡在良好饲养条件下的生长过程, 每两周测定一次, 得数据如下, 试以 Logistic方程描述之。(x 周次, y 重量kg)先求极限生长量K值:由资料可选等间距 x 对应的 y 值为 7.73解:由下式可求得K值第四十七页,共六十二页。表7.18

27、 肉用鸡周次体重(ykg)数据表2.827-yy ln( )2.827-yy 1 2 0.30 8.4233 2.1310 4.2620 2 4 0.86 2.2872 0.8273 3.3092 3 6 1.73 0.6341 -0.4556 -2.7336 4 8 2.20 0.2850 -1.2553 -10.0424 5 10 2.47 0.1445 -1.9345 -19.345 6 12 2.67 0.0588 -2.8336 -34.0032 7 14 2.80 0.0096 -4.6460 -65.0224 56 -8.1667 -123.597平均 8 -1.1667 周次x

28、 重量 yiiiii7.74第四十八页,共六十二页。配合回归方程:7.75第四十九页,共六十二页。 当: 周 (为拐点 ) 是生长过程的速率由快转慢的界点, 当 x5.76或周时速率逐增, x5.76时速率逐减。x拐点时, 可用指数函数描述, x拐点时, 则需用 Logistic 方程才能描述全过程。7.76第五十页,共六十二页。一元二次抛物线回归(一元二次多项式回归) 7.2.2 不可直化的一元非线性回归样本回归方程:1. 一元二次抛物线回归的配合数学模型:上式不能直接用取对数的方进行直化,只能用解方程的方法求解回归系数 a, b, c 。7.77第五十一页,共六十二页。图7.24 抛物线回

29、归方程与图形y =a+bx+cx2yx 在研究动植物发育速度与温度间的关系、肥料或饲料与产量或重量的关系有时可用抛物线回归来描述。如:苜蓿盲蝽卵不同温度与卵的发育速度间的关系就为抛物线。2. 二次抛物线方程系数的最小二乘估计: 令: 求函数 (因为Q是二次函数, 所以一定有极值且有极小7.78第五十二页,共六十二页。值), 对函数Q(a,b,c)分别求一阶偏导, 令其为0:即:7.79第五十三页,共六十二页。三元一次正规方程组对上面正规方程组求解 a, b, c (行列式解法)将方程两边各同除以2, 进行整理之, 可得下面7.80第五十四页,共六十二页。得:回归方程:7.81第五十五页,共六十二页。 例7.15 对苜蓿盲蝽卵进行研究, 发现不同温度x与卵的发育速度 y 呈二次曲线型, 见表7.19 图7.25 试对其进行回归分析。 解:盲蝽象卵的发育速度 y 是按照发育天数的倒数乘以100转换来的。图7.25 苜蓿盲蝽卵温度与发育速度关系图 发育速度y温度 x.16481215 20 25 30 35 40表7.19 苜蓿盲蝽卵温度与 发育速度关系 温 度 x 发育速度 y 15 3.85 20 7.58 25 9.43 30 11.35 35 14.16 37 12.14 40 10.357.82第五十六页,共六十二页。 7.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论