一元非线性回归与相关演示文稿_第1页
一元非线性回归与相关演示文稿_第2页
一元非线性回归与相关演示文稿_第3页
一元非线性回归与相关演示文稿_第4页
一元非线性回归与相关演示文稿_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一元非线性回归与相关演示文稿现在是1页\一共有62页\编辑于星期六优选一元非线性回归与相关现在是2页\一共有62页\编辑于星期六对幂函数直化的主要手段是两边取常用对数。(或自然对数),取常用对数如下:1.幂函数直化7.2.1可化为直线的非线性回归图7.5

幂函数-1by

=

a

x0<b<1b>1

b=1y由对数性质得0

这种类型的回归方程一般只确定两个参数。7.29幂函数式为:(见图7.5)现在是3页\一共有62页\编辑于星期六然后再转换a`,即:lga`

=a回归方程

-1令:可得幂函数的直化回归方程为

例7.7已测得云杉平均胸径x(cm)与平均树高y(m)的资料,试配合幂函数的回归方程;再试配合二次抛物线方程*。7.30*注:

一元二次抛物线方程的配合过程见本章所述。所以可得曲线现在是4页\一共有62页\编辑于星期六

x

y

lg(x)

lg(y)

11513.91.1761.14322017.11.3011.23332520.01.3981.30143022.11.4771.34453524.01.5441.38064025.61.6021.40874527.01.6531.43185028.31.6991.45295529.41.7401.468106030.21.7781.480116531.41.8131.497表7.4

云杉平均胸径与平均树高数据图7.6云杉胸径树高散点图7.311520253035404550556065

302826242220181614

...........xy

对表7.4x,y画出散点图初步判定为幂函数,分别对x,y取常用对数得表7.4第4,5列现在是5页\一共有62页\编辑于星期六

解:利用计算器统计功能按下面步骤计算得直化后的回归方程:7.32现在是6页\一共有62页\编辑于星期六所以可得幂函数的回归方程

对曲线相关的研究只研究其相关指数。曲线相关指数可定义为对a`进行反对数转换得7.33现在是7页\一共有62页\编辑于星期六

计算例7.7相关指数(见表7.5)1513.914.63-0.730.532017.117.12-0.020.002520.019.330.670.453022.121.360.740.553524.023.230.770.594025.624.990.610.374527.026.650.350.125028.328.230.07

0.005529.429.73-0.330.116030.231.18-0.980.966531.432.57-1.17

1.37

xi

yi

yi

(yi

-

yi)

(yi

-

yi)

2^

440269

Q

=5.06表7.5

剩余平方和Q的计算过程

注:

对曲线回归的检验较复杂,主要是Q的值较难求。^7.34现在是8页\一共有62页\编辑于星期六(1)曲线关系检验表7.7曲线回归的方差分析表差异来源平方和自由度均方均方比F0.01

回归314.3071314.307559.27**10.6

剩余5.0690.562

总和

319.36710Lyy=319.367,

Q=5.06U=319.367-

5.06=314.3077.35

对回归关系的检验:现在是9页\一共有62页\编辑于星期六

(2)直化关系检验表7.6直化后的回归方差分析表差异来源平方和自由度均方均方比F0.01

回归0.1247810.12478367**10.6

剩余

0.0030890.00034

总和

0.12786107.36注:两种检验效果是一样的,如果曲线回归不能直化那么就只能用曲线方法检验了。现在是10页\一共有62页\编辑于星期六2.指数函数直化

指数函数,两边取自然对数可得(注意:这里x

变量并未转换)令:b<0b>0图7.7

指数函数图示x

y则直化方程为:7.37现在是11页\一共有62页\编辑于星期六

例7.8

在栽培试验中,测得某夏季绿肥播种15天后,每5天

x为一期的生长量y(kg),所得数据如下,试对该资料进行回归与相关分析。根据散点图7.8选择指数函数模型y=ae

来研究。bx图7.8

绿肥5天一期生长量曲线两边取自然对数:直化方程:153045500100200400300.......7.38现在是12页\一共有62页\编辑于星期六表7.8

绿肥5天一期生长量数据

xyy`=lnyxy`115584.06060.90220674.20584.10325794.369109.234301404.941148.235352005.298185.436403205.768230.727454806.173277.78∑210134434.8141096.367.39现在是13页\一共有62页\编辑于星期六回归方程的配合:直化后的回归方程:7.40现在是14页\一共有62页\编辑于星期六取反对数得:转曲线回归方程:表7.9

剩余平方和Q的计算过程

xi

yi

yi

(yi

-

yi)

(yi-

yi)^

155847.4310.57111.72206768.77-1.773.13257999.81-20.81433.0630140144.58-4.5820.9835200209.41-9.4188.5540320303.32

16.68278.2245480439.35

40.651652.422101344

2588.08相关指数计算:27.41现在是15页\一共有62页\编辑于星期六3.双曲线函数直化a<0,b>0直化:上式可作如下变换双曲线函数如下式图7.9

双曲线函数a>0,b>0(c)(b)yyxxb∞∞x∞a>0,b<0b00b(a)..y令:可直化为下式7.42现在是16页\一共有62页\编辑于星期六相关指数的意义和直线回归决定系的意义是一样的。这里不能用原始数据求直线相关系数r,

r只能用于直线,不能用于曲线。可得:回归方城配合:对相关指数的说明:7.43现在是17页\一共有62页\编辑于星期六

例7.9

研究“岱字”棉自播至齐苗(以80%出苗为准)的天数(x)与日平均土温(y)的关系,得下表7.10,试作回归分析。表7.10“岱字”棉至齐苗天数与土温的关系xy3330272421183.0034.005.008.0015.0yx481216

40302010

0......图7.10“岱字棉”至齐苗天数土温的关系图7.4432现在是18页\一共有62页\编辑于星期六表7.11“岱字”棉至齐苗天数与土温的关系数据变换xyx`=1/x3330272421183.0034.005.008.0015.00.33330.27270.25000.20000.12500.066610.99898.18106.75004.80002.62501.1988x`y所选模型:23直化式如下7.45x`y220.11110.07440.06250.04000.01560.00441089900725576441324∑1531.2436

34.5537

0.3084059现在是19页\一共有62页\编辑于星期六直化回归方程:曲线回归方程:相关指数:7.46注:

本例还可用y`=a+bx转换,其中y`=

xy,其结果相同。

现在是20页\一共有62页\编辑于星期六

在农业试验中经常遇到一些曲线回归配合问题,现列出几种常用的可直化的函数模型*如:密度与有效穗数间的关系。如:毛细管水的上升高度与时间的关系。如:叶绿素与透光度间的关系。如:棉纤维长分布与次数间关系。如:大豆密度与青荚产量间关系。*注:《农业试验统计》莫惠栋编著上海科技出版社1984如:洋葱鳞茎的直径与重量间的关系。7.47现在是21页\一共有62页\编辑于星期六4.

S

形曲线直化

在生物界中,反应生物的累积发生量(率)y与时间、浓度、药品用量x等关系时,可以用S

形曲线来刻画。如:动植物的累积发病率、累积死亡率、累积发生进度、繁殖过程与时间、浓度与药品用量的关系等。图7.11

对称的S形曲线图7.12

不对称的S形曲线时间浓度用量累积率yx时间浓度用量x累积率y7.48现在是22页\一共有62页\编辑于星期六

(1)对称的S形曲线:一些作物的日生长量或发生量等往往为正态或近似正态分布(下图左),其累积量(率)y%与时间x则呈对称的S形曲线(下图右)。xy日发生量日生长量日期图7.13

正态分布曲线图7.14

对称

s

形曲线xy%日期累积率累积量7.49现在是23页\一共有62页\编辑于星期六

可将资料中的累积率y%视为正态分布的分布函数Φ(u)=P{U≤u},若将y%

转化为正态分布的u值,则u与时间x就成为直线关系了,但是u变量的取值有时为正或为负计算起来很不方便,可采用P=u+5来解决。则P=a+bx

。P

称概率单位值(不要和概率符号P相混淆),在一些统计书中可查到《百分率与概率单位换算表》。7.50对称的S形曲线直化过程:现在是24页\一共有62页\编辑于星期六

例7.10

研究某地越冬代棉花红铃虫的化蛹进度y%与时间x的关系,试进行回归分析。解:首先将观察日期转换为以5月31日为0的数值(x),化蛹进度y%与x成

S

形曲线,再将y%查表转换为概率单位值P,

而P与x即为直线了。

510

1520253035404550

y%502575100..........图7.15

棉红铃虫s形曲线图x5101520253035404550

y%502575100..........x7.51现在是25页\一共有62页\编辑于星期六表7.12

棉花红铃虫化蛹进度表

月/日

x

y%

P概率单位

P6/5

53.53.18813.12643.16/10106.43.47803.56277.56/151514.63.94633.999115.86/202031.44.51554.435428.66/252545.64.88954.871844.96/303060.45.26375.308262.17/53575.25.68085.744577.27/104090.26.29306.180988.17/154595.46.68496.617294.77/205097.56.96007.536098.0

275

50.8998^y%^7.52现在是26页\一共有62页\编辑于星期六得回归方程:7.53现在是27页\一共有62页\编辑于星期六例如:

测报7月2日时即x=32,代入回归方程得P=5.4719,查表得P对应的累积率为68.15%P概率单位值P=2.756+0.0848x

^1020304050x..........73456日期图7.16

概率单位与日期直线关系图可计算直线回归的相关系数7.54现在是28页\一共有62页\编辑于星期六

(2)不对称的

S

形曲线:生物生长量或发生量y与时间x的曲线并不都是正态(图7.17),其累积率也呈现出不对称的

S形曲线(图7.18),xyxy%发生量日期日期生长量图7.18

不对称S形曲线图7.17

偏态曲线累积率7.55现在是29页\一共有62页\编辑于星期六

例7.11用氯氰菊酯对菜粉蝶五龄幼虫进行触杀毒力测定(LD50),累积死亡率y%与单位体重药量x(μ/L)之间的图形呈不对称的S形曲线(见下图7.19),试对其直化后进行回归分析。g如果将累积率y%转换成P,则P和时间x的关系仍然是曲线,达不到直化的目的,前面的方法不能直接搬用,但是只要将x取对数转换(lgx),则P与lgx

就为直线了,P=a+blgx

。7.56现在是30页\一共有62页\编辑于星期六

解:将累积更正死亡率查百分率与概率单位值转换表得概率单位值P,再将单位体重药量

转换为lgx

建立直化回归方程

0.00799919.80.0155932.20.037657.80.068481.70.13192.3

x(μg/L)死亡率y%

表7.13菜粉蝶五龄幼虫毒杀力测定12345图7.19

氯氰菊酯触杀菜

粉蝶毒力测定图单位体重药量y%累积死亡率.....10000.040.120.08806040200.16x7.57现在是31页\一共有62页\编辑于星期六

0.007999

-2.09719.84.15120.01559-1.80732.24.53790.0376-1.42557.85.1968

0.0684-1.16581.75.9040

0.131-0.88392.36.4255

-7.377

26.2154

平均

-1.4754

5.2431

x(μ/L)

x`=

lgxy%

P

概率单位

g表7.14

菜粉蝶五龄幼虫毒杀力测定数据123457.58现在是32页\一共有62页\编辑于星期六7.59现在是33页\一共有62页\编辑于星期六即:

lgx概率单位值

P-0.8-1.6-2.0-2.4.....76543-1.4图7.20

直线回归方程

直线回归方程7.60现在是34页\一共有62页\编辑于星期六1

0.007999-2.09719.8

4.15124.05017.1

7.2920.01559

-1.80732.2

4.53794.607

34.7

6.2530.0376

-1.42557.85.1968

5.33963.330.340.0684

-1.16581.75.90405.83980.90.6450.131

-0.883

92.3

6.42556.379

91.60.49

-7.377

26.215

44.92

平均

-1.475

5.2431

x(μ/L)

x`=lgx

y%Pg表7.15

菜粉蝶五龄幼虫毒杀力测定预测及相关指数计算表^^P^y%(yi

–yi)2ii7.61现在是35页\一共有62页\编辑于星期六预测

x=0.04(μ

/L)时,菜粉蝶五龄幼虫死亡率?概率单位值P=8.0746+1.9191×lg0.04=5.392,

将概率单位值转换为百分率:

5.392

转换为百分率≈65.25%,

(查附表)相关指数:r=0.98

g

27.62

5.Logistic

生长曲线(S形曲线)

动植物的生长或繁殖,假定在无限空间、无限营养来源等无约束条件下进行,则其生长或繁现在是36页\一共有62页\编辑于星期六殖量与时间的关系开始时为指数函数:这种关系通常只能在一开始的一段时间内成立,但实际上由于环境条件的恶化、营养的不足、衰老的加快、繁殖的减慢、死亡的增多等约束条件伴随而来,β不能保持稳定,它们将改变这这种关系而呈现出Logistic曲线形式。7.63现在是37页\一共有62页\编辑于星期六

称上式为自然生长方程。其中:y是生长量,繁殖量(或累积率),K是时间无限时y的极限量(率),x为演变时间。该曲线与前两种

s

形曲线有所不同,它没有正态分布或近似正态分布假定,所以具有更广泛的适应性。(1)Logistic

函数表达式或①②7.64现在是38页\一共有62页\编辑于星期六

(2)Logistic

函数的性质1.

当x=0

时可算得起始量2.

当x=-

ln(1/a)/b,y=K/2时为拐点,即变化率从逐增过度到逐减的分界点。3.

当x在[0,-

ln(1/a)/b]区间时变化率逐增;在[-ln(1/a)/b

,∞]变化率逐减。见图7.22xy∞时间累积量累积率

%Kk2x=-

ln(1/a)/b0图7.22

Logistic曲线.7.65拐点现在是39页\一共有62页\编辑于星期六未知参数的确定:①如果

y

是累积率则极限值则K=100。②如果y是生长量或繁殖量,其极限值K可由按下式近似求得在实际应用时(x1,y1),(x2,y2),(x3,y3),是数据中的三对观察值,

x1,x2,x3

是等间距的量,间距不应太小,间距小了算出的K值误差较大。7.66现在是40页\一共有62页\编辑于星期六(3)Logistic

生长曲线直化过程将函数①变形得等式两边同除以y并取自然对数得令:则有:再求解直线回归系数:a`,-

b

7.67现在是41页\一共有62页\编辑于星期六

再对a`取反自然对数得曲线回归系数a,可得方程式

①。

注意:如果对②式直化则有(对回归系数a不再取反对数)。即:

①,②式的

a是不同的,这里必须指出用同一资料所配合的曲线方程①和②是等价的。注:Logistic

曲线方程是由比利时数学家t于1838年导出,但长期湮没,至20世纪20年代才又被统计学家R.Pearl和重新发现。该方程在动植物的饲养、栽培、资源、生态、环境保护等方面的模拟研究中已有较广泛的应用。7.68现在是42页\一共有62页\编辑于星期六

例7.13

试以生长曲线描述例7.10越冬代棉红铃虫化蛹进度和时间的关系。利用Logistic函数的数学性质,求出拐点并解释其实际意义。

解:因为y

变量是化蛹进度为百分数(%),所以当发生时间x无限时y的极限值

K=100

分析计算过程:7.69现在是43页\一共有62页\编辑于星期六表7.17

棉红铃虫化蛹进度和时间表x(天)y%

100

-yy

ln(

)100

-yy

53.527.5713.3168106.414.6252.68271514.65.84931.76632031.42.18470.78152545.61.19300.17653060.40.6556-0.42223575.20.3298-1.10934090.20.1068-2.21964595.40.0482-3.03205097.50.0256-3.6636iiii7.70现在是44页\一共有62页\编辑于星期六反对数求a可得:得曲线回归方程:或①②7.71现在是45页\一共有62页\编辑于星期六当x=0

时化蛹进度y%=1.58%,

当x=-ln(1/62.08864)/0.156395=26.4为拐点,见图7.23。说明在6月27日时化蛹进度达y%=50%,

6月27日前化蛹进度是逐增的,6月27日以后化蛹进度就逐渐减慢。^

^图7.23

棉红铃虫化蛹进度xy%化蛹进度日期102030405025507510050%100%6月27日.07.72现在是46页\一共有62页\编辑于星期六

例7.14

测定某种肉用鸡在良好饲养条件下的生长过程,每两周测定一次,得数据如下,试以Logistic方程描述之。(x周次,y重量kg)先求极限生长量K值:由资料可选等间距x对应的y值为7.73解:由下式可求得K值现在是47页\一共有62页\编辑于星期六表7.18

肉用鸡周次体重(ykg)数据表2.827-yy

ln(

)2.827-yy

1

2

0.308.42332.13104.2620240.862.28720.82733.3092

361.730.6341-0.4556-2.7336

482.200.2850-1.2553-10.0424

5102.470.1445-1.9345-19.345

6122.670.0588-2.8336-34.0032

7142.800.0096-4.6460-65.0224

56-8.1667-123.597平均8-1.1667

周次x

重量

yiiiii7.74现在是48页\一共有62页\编辑于星期六配合回归方程:7.75现在是49页\一共有62页\编辑于星期六当:

周(为拐点)

是生长过程的速率由快转慢的界点,当x<5.76或周时速率逐增,x>5.76时速率逐减。x<拐点时,可用指数函数描述,x>拐点时,则需用Logistic方程才能描述全过程。7.76现在是50页\一共有62页\编辑于星期六一元二次抛物线回归(一元二次多项式回归)7.2.2不可直化的一元非线性回归样本回归方程:1.一元二次抛物线回归的配合数学模型:上式不能直接用取对数的方进行直化,只能用解方程的方法求解回归系数a,b,c。7.77现在是51页\一共有62页\编辑于星期六图7.24

抛物线回归方程与图形y=a+bx+cx2yx

在研究动植物发育速度与温度间的关系、肥料或饲料与产量或重量的关系有时可用抛物线回归来描述。如:苜蓿盲蝽卵不同温度与卵的发育速度间的关系就为抛物线。2.二次抛物线方程系数的最小二乘估计:

令:

求函数

(因为Q是二次函数,所以一定有极值且有极小7.78现在是52页\一共有62页\编辑于星期六值),对函数Q(a,b,c)分别求一阶偏导,令其为0:即:7.79现在是53页\一共有62页\编辑于星期六三元一次正规方程组③①②对上面正规方程组求解a,b,c(行列式解法)………………将方程两边各同除以2,进行整理之,可得下面7.80现在是54页\一共有62页\编辑于星期六得:回归方程:7.81现在是55页\一共有62页\编辑于星期六

例7.15

对苜蓿盲蝽卵进行研究,发现不同温度x与卵的发育速度

y

呈二次曲线型,见表7.19图7.25试对其进行回归分析。

解:盲蝽象卵的发育速度y是按照发育天数的倒数乘以100转换来的。图7.25

苜蓿盲蝽卵温度与发育速度关系图发育速度y温度x.......164812152025303540表7.19苜蓿盲蝽卵温度与发育速度关系

温度x

发育速度

y

15

3.85207.58259.433011.35

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论