基于偏最小二乘回归作物腾发量预测模型探究_第1页
基于偏最小二乘回归作物腾发量预测模型探究_第2页
基于偏最小二乘回归作物腾发量预测模型探究_第3页
基于偏最小二乘回归作物腾发量预测模型探究_第4页
基于偏最小二乘回归作物腾发量预测模型探究_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于偏最小二乘回归作物腾发量预测模型探究摘要:为了建立较为精确的作物腾发量预测模型, 降低常规利用彭曼公式计算繁琐及参数估计的难度,应用偏 最小二乘回归算法来建立作物腾发量预测模型,采用多维气 象数据(太阳辐射、空气温度、相对湿度和平均风速)与作 物腾发量的相关性来确定模型方程。结果表明,该模型能很 好地解决作物腾发量与多个影响因素之间的不确定性和非 线性关系,预测精度较高,完全能够满足灌溉的精度要求。关键词:偏最小二乘回归;作物腾发量;彭曼公式;预 测模型中图分类号:s161. 4文献标识码:a文章编号:0439-8114 (2013) 22-5596-03我国是一个水资源不丰富的国家,进入

2、21世纪,工农业生产用水矛盾更加突出,水资源紧缺的状况日益严峻,在 各个用水部门中,灌溉用水最多,约占全国总用水量的80%, 这就迫使农业灌溉排水领域要不断更新观念,其中研究和推 广高效的节水灌溉理论与技术,是我国发展节水农业、设施 农业,实现高产、高效、优质农业的重要途径,对缓解我国 日益突出的水资源供需矛盾具有十分重要的战略意义1,2o作物腾发量包括植株蒸腾与棵间蒸发,是农业用水的主 要组成部分,是农田水分消耗的主要途径。作物腾发量的研 究与估算,一直是灌溉排水领域中重要的研究课题之一3, 4。实测方法是获取作物腾发量最可靠的途径,但实测资料 的地区分布和时间序列十分有限。计算作物腾发量有

3、助于作 物腾发量在空间上的插补和时间序列上的延长5。但是常 规彭曼公式计算法需要大量的气候、作物等数据,而且要对 大量数据进行估算,计算非常繁琐。因此随着其他学科的发 展,出现许多作物腾发量预测方法及预测模型,本试验是对 特定作物和土壤条件下,通过偏最小二乘回归算法利用天气 环境参数来预测作物腾发量(et) 6-8。1多重共线性分析1. 1试验条件本试验数据来自于项目试验基地,天气环境数据通过小 型自动采集气象站采集,作物腾发量通过高精度蒸渗仪来测 量。2012年5-6月选取典型气候测量50组试验数据,利用 得到的试验数据来建立作物腾发量预测模型。试验田长18. 0 m,宽6.2 m, 土质为

4、沙质土壤,试验所用的作物为玉米,这 一阶段玉米处于拔节、抽雄发育期。在测量过程中太阳辐射 (rs)取1 d的累计值,相对湿度(rh)、空气温度(ta) 和平均风速(ws)取1 d的平均值。试验数据如表1所示。1. 2多重共线性诊断在多元回归建模中,变量多重相关的现象经常出现,而 偏最小二乘回归方法可以有效解决普通最小二乘法在多重 共线性存在的多元回归模型中估计参数失效的问题,因此在 建模前有必要诊断数据的多重相关性。自变量间的皮尔逊相 关系数矩阵如表2所示。从表2可知,作物腾发量与太阳辐 射、相对湿度的相关性较大,分别为0.953和-0. 705,其次 线性相关性较强的是太阳辐射和相对湿度,相

5、关系数为 -0. 712,相对湿度与空气温度间的相关性略强,为0.442, 从相关系数矩阵中可以初步判断除了因变量和自变量间有 线性相关性之外,自变量间也可能存在共线性问题。特征根和条件指数是诊断多重共线性的方法,如果相当 多维度的特征根等于0,则可能有比较严重的共线性,条件 指数由st ewar t等提出,当某些维度的该指标数值大于30 时,则可能存在共线性。表3的自变量多重共线性诊断显示 数据间存在一定的多重共线性。2模型原理及其构建2. 1偏最小二乘回归建模思路首先,对数据进行标准化处理,消除量纲影响。然后, 分别在自变量组与因变量组中提取出t和u,满足条件:t 和u最大程度携带各自数据

6、的变异信息;t与u的相关度 达最大。当第一个成分被提取后,偏最小二乘回归分别实施 自变量对t的回归和因变量对t的回归。如果回归方程已经 达到满意的精度,则算法终止;否则,将利用自变量被t解 释后的残余信息以及因变量被t解释后的残余信息进行第二 轮的成分提取。如此往复,直到能达到一个较满意的精度为 止。判断是否继续提取成分的方法是检验交叉有效性q2h, 满足条件q2hw0. 097 5时,停止计算。2.2作物腾发量的偏最小二乘回归模型根据以上建模过程,结合作物腾发量与相关因素的关 系,建立如下标准化模型:在表4中,符号rdx表示成分th对x的解释能力,符 号rdy表示成分th对y的解释能力。符号

7、q2表示交叉有效 性,临界值0. 097 5,前3个成分的交叉有效性均大于临界 值,系统默认提取3个有效成分th, h=l, 2, 3o第一个成 分对x的解释能力为0. 429 0,第二个成分对x的解释能力 为0. 378 0,第三个成分对x的解释能力为0. 140 0o 3个成 分对x的信息利用率为0. 946 0,基本提取了所有信息。第 一个成分对y的解释能力为0.871 0,解释能力较强,3个 有效成分能够解释0. 939 0的因变量中的变异,而且累计交 叉有效性q2 (cum) =0. 923 0,也接近于1,可以说模型非 常完美。3. 2回归方程系数分析图1是变量投影重要性指标(vi

8、p)图,用来描述x在 解释y的重要程度,它的平均值为1,大于1表示变量非常 重要。从图1可以看出,反映作物腾发量最显著的指标是太 阳辐射和相对湿度,太阳辐射的vip值是均值的1.5倍,相 对湿度的vip值也超过了 1,为1. 16o标准化回归系数直方图如图2所示。3.3拟合效果分析图3为观测值与预测值的对比图,图3显示样本点均匀 分布在斜率为1的直线附近,判定系数为0. 938 7,均方误 差根为0. 33,相对误差的均值为0. 10,拟合效果较好。4模型预测为了验证所建模型的有效性,选取一组非建模样本试验 数据,用建立的模型预测作物的腾发量,通过与试验数据对 比来进一步分析所建模型的合理性(

9、表5)。5结论本研究采用多元回归建模方法建立了较为精确的作物 腾发量预测模型,降低了常规利用彭曼公式计算繁琐及参数 估计的难度,通过诊断数据的多重相关性来避免变量多重相 关的现象,有效解决了普通最小二乘法在多重共线性存在的 多元回归模型中估计参数失效的问题。用多维气象数据(太 阳辐射、空气温度、相对湿度和平均风速)与作物腾发量的 相关性来确定模型方程,结果表明,该模型能很好地解决作 物腾发量与多个影响因素之间的不确定性和非线性关系,预 测精度较高,完全能够满足灌溉的精度要求。参考文献:1 罗金耀节水灌溉理论与技术m.武汉:武汉大学 出版社,2003.2 付强,王立坤,王兆菌.井灌水稻需水量预测的人 工神经网络模型研究j.灌溉排水,2002 (1): 29-32.3 张兵,袁寿其,成立,等.基于l-m优化算法的 bp神经网络的作物需水量预测模型j.农业工程学报, 2004, 20 (6): 73-76.4 魏占民,陈亚新,史海滨,等.bp神经网络的春小 麦作物-水模型的初步研究j.灌溉排水,2002, 21 (2): 12-16.5 康绍忠,熊运章,刘晓明用彭曼-蒙特斯模式估算 作物蒸腾量的研究j西北农林科技大学学报(自然科学 版),1991 (1): 13-19.6 周金龙,董新光内陆干旱区潜在蒸发量的计算j. 灌溉排

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论