电工杯数学建模全国二等奖论文_第1页
电工杯数学建模全国二等奖论文_第2页
电工杯数学建模全国二等奖论文_第3页
电工杯数学建模全国二等奖论文_第4页
电工杯数学建模全国二等奖论文_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

风电功率预测问题风电功率预测问题答卷编号:论文题目:风电功率预测问题姓名专业、班级有效联系电话参赛队员1吴育文信息与计算科学70901赛队员2廖军荣数学与应用数学70903赛队员3贺长波机械工程及自动化509160115232325058指导教师:姜玉山参赛学校:东北大学秦皇岛分校报名序号:807证书邮寄地址:(学校统一组织的请填写负责人)河北省秦皇岛市经济技术开发区泰山路143号东北大学秦皇岛分校信息与计算科学系答卷编号:阅卷专家1阅卷专家2阅卷专家3论文等级风电功率预测问题摘要本文分别运用数据迭代、GM(1,1)灰色理论、ARMA和BP神经网络模型对该风电场2006年5月31日至6月6日各个时点的风电功率PA,PB,PC,PD,P4,P58进行预测,通过对预测误差的综合分析发现BP神经网络的精确度最高;研究第一问所得误差数据发现:机组数的增加会影响模型预测的精度,且众多风电机的汇聚会使得总体的预测误差减小.将ARMA模型与BP神经网络相结合可以有效高精度,但由于ARMA模型自身所存在的误差以及外界条件的影响,故风电功率预测精度不可能无限提高.对问题一,分别建立数据迭代模型、BP神经网络模型、GM(1,1)模型和ARMA模型,对5月31日至6月6日各个时点进行风电功率预测.迭代模型的误差范围是14.5%—22.7%,GM(1,1)的预测误差集中在45%左右,ARMA模型的预测误差范围约为16.3%—25%,BP神经网络的预测误差范围约为5.7%—20.4%,故BP神经网络模型预测效果最好.对问题二,通过计算问题一中四个模型的相对误差,并比较各组风电功率,四组总的风电功率值和58台机组的风电功率值得出随着机组数的增加会影响模型的预测精度这一结论.并通过相应的电工方面的知识对这一结论就行合理性解释.对问题三,我们对问题中的BP神经网络模型进行优化处理得到基于ARMA的神经网络模型,并且重新对问题一的要求进行求解,得到了更加精确的预测结果.通过MATLAB进行仿真画出相应的实际曲线和预测曲线的对比图,直观的反映了模型的正确性.并通过分析得出由于ARMA自身存在的误差以及机组发电功率受外部条件的风速,异常性气候等因素的影响造成不能无限提高风电功率的预测精度这一结论.关键词:风电功率预测ARMAGM(1,1)BP神经网络ARMA神经网络

目录TOC\o"1-4"\f\h\z\u风电功率预测问题 1摘要 11问题重述 42问题分析 42.1问题一的分析 42.2问题二的分析 52.3问题三的分析 53模型假设 54符号说明 55问题一模型的建立与求解 65.1模型一:基于数据迭代的风电功率预测模型 65.1.1数据分析 65.1.2模型建立 65.1.3模型求解 75.2模型二:基于灰色理论的风电功率预测模型 105.2.1灰色模型预测风电功率的基本原理与模型建立 105.2.2模型二求解 115.2.3模型二评价 145.3模型三:基于时间序列(ARMA)的风电功率预测模型 155.3.1平稳性检验 155.3.2ARMA模型的建立 155.3.3ARMA模型的求解 215.4模型四:基于BP神经网络的风电功率预测模型 285.4.1BP网络结构 285.4.2BP神经网络学习算法 285.4.3神经网络输入、输出变量的选取 305.4.4BP神经的隐层数及隐层节点数 305.4.5BP神经网络的训练 315.4.6模型四求解 325.5预测模型的对比分析 386问题二模型的建立与求解 396.1平均相对误差的计算 396.2平均相对误差的进一步分析 407问题三模型的建立与求解 407.1模型五:基于ARMA的改进神经网络模型 407.1.1模型建立 407.1.2模型求解 417.2阻碍精度进一步改善的原因分析 437.3精度值提高的极限 438模型评价 438.1GM(1,1)灰色预测模型优缺点 438.2ARMA时间序列预测模型优缺点 448.3BP神经网络模型优缺点 449模型的改进方向 44参考文献 44附录 45

1问题重述随着科学技术的发展,风力发电技术得到了快速发展,风力发电对电网的影响也越来越明显.现今风力发电主要利用的是近地风能.近地风具有波动性、间歇性、低能量密度等特点,因而电功率也是波动的,大规模风电场接入电网运行时会对电网的功率平衡和频率调节带来不利影响.为能优先安排调度计划,保证电网平衡和运行安全,需要建立模型解决以下问题,以达到对风电功率的准确预测.问题一:参照附件二的数据,利用某风电场58台风电机组中给定的四台风电机组研究未来四小时内的16个时点(每十五分钟一个时点)的风电功率数值,构建至少三种模型(必须包含时间序列分析类方法)解决风电功率的实时预测并作误差分析.最终找到最优模型.要求1)检验预测结果是否满足附件一的精度要求;2)预测量应包括:a.PA,PB,PC,PD;b.P4;c.P58。3)预测时间范围:a.5月31日0时0分至5月31日23时45分;b.5月31日0时0分至6月6日23时45分.问题二:分析集中开发风电时风电机组功率汇聚对预测误差的影响,比较单台风电机组功率的相对预测误差与多机总功率的预测相对误差,分析规律,并对风电机组汇聚的影响做出预期;问题三:在问题一的基础上构建更高预测精度的实时预测方法,分析影响预测精度的因素.2问题分析2.1问题一的分析问题要求运用至少三种预测方法对5月31日至6月6日的各个观测点进行实时预测.由于风速系统是一个灰色系统,而风电功率与风速正相关,故可以认为风电功率系统也是一个灰色系统.我们并不完全清楚影响风电功率的作用机制,所以可以对其进行灰色预测.灰色模型是利用离散随机数经过生成变为随机性被显著削弱而且较有规律的生成数,建立起的微分方程形式的模型,这样便于对其变化过程进行研究和描述,并在对数据的短期预测上具有明显的优势。本题利用灰色模型滚动预测风电功率,在短期预测上可以达到较高的精度.电功率是典型的时间序列,故可以考虑ARMA模型进行预测.ARMA的基本思想是将预测模型随时间推移而形成的数据序列视为一个随机序列,并用一定的数学模型来近似描述这个序列.模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值.ARMA模型在风电功率预测过程中既考虑了风速、风电功率在时间序列上的依存性,又考虑了随机波动的干扰性,对于风电功率的大体趋势的预测准确率较高,可作为本题的预测模型之一.另外,BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程.从理论来讲,这种算法是利用数据的潜在规律性,通过算法让计算机自主学习从而揭示规律,对处理输入输出关系复杂的非线性系统有着很高的优越性.而风电功率系统与时间的变化关系十分复杂,且很难找出具体的数学关系式来描述,故本题采用BP神经网络来预测也有其优越性.2.2问题二的分析由第一问算出的各模型的预测值和实际值进行比较算出相对误差,并比较多台风电功率的预测值和单组风电功率预测值相对误差的大小.对比较结果进行合理性的解释.2.3问题三的分析在问题一建立的模型的基础上进行优化处理,考虑基于时间序列的BP神经网模型,并求出相应的预测值.与问题一的结果进行比较.3模型假设(1)问题中给出的数据比较科学、合理、精确,能较好的风电功率的实际值;(2)所选取的样本数据具有普遍性,能较好的用来预测;(3)短期内不存在大的自然灾害,例如地震、海啸及台风等;(4)预测期间风电机组分布无重大调整.4符号说明为简化对问题的分析和对数字的处理,下文如下符号代表变量:表4-1部分变量符号说明符号描述yt风电功率的时间序列BP神经网络误差矩阵原始风电功率累加的新序列发展系数灰色作用量自回归参数移动平均参数滞后算子原始序列方差残差序列方差后验差比5问题一模型的建立与求解5.1模型一:基于数据迭代的风电功率预测模型5.1.1数据分析通过观察附件2所给的电动机组输出功率数据,我们发现风电功率随时间呈类周期性变化并且每一时点的风电功率与该时点邻域内各时点处的风电功率具有相关关系.为了具体验证这一发现,我们运用MATLAB7.0软件对附件2所给28天各时点风电功率数据进行进一步绘图研究,通过相邻日风电功率曲线图的对比分析,我们发现确实存在这一关系,如图5-1.图5-1相邻两天A组发电机功率对比图5.1.2模型建立定义5.1设是任一正数,则开区间称为点a的邻域,记为.设风电功率在t时刻的值为y(t),且在处的功率值为 由数据分析可知,某一时点的风电功率值与处的风电功率值相关,其中.这里,我们不妨假定该相关关系是简单的线性关系,即 考虑到各时刻的风电功率值对时刻的功率值作用效果不同,并结合实际,我们对作出赋值,并得到赋值公式则时刻风电功率的预测值为 (5.1)5.1.3模型求解通过运用MATLAB软件进行求解,我们得到5月31日风电机A、B、C、D,四台风电机总和与58台风电机总和的的预测结果如下:图5-2模型一的PA测量值和预测值比较图5-3模型一的PB测量值和预测值比较图5-4模型一的PC测量值和预测值比较图5-5模型一的PD测量值和预测值比较图5-6模型一的P4测量值和预测值比较图5-7模型一的P58测量值和预测值比较5.2模型二:基于灰色理论的风电功率预测模型[1]5.2.1灰色模型预测风电功率的基本原理与模型建立灰色模型预测风电功率的基本原理在于两个方面:(1)风电功率在短时间内难以发生剧烈变化,这使风速的短期预测具有可行性;(2)灰色理论不同于其他预测理论和方法的区别在于:在样本数据很少、信息量极少的情况下也可以有效预测.本文用传统灰色模型GM(1,1),预测超短期风速,具体方法:时序风电功率为: (5.2)对数列按照传统GM(1,1)模型的算法进行一次累加生成数列V(1)=[V(1)(1),V(1)(2),…,V(1)(n)],即 (5.3)构造GM(1,1)模型的一阶微分方程: (5.4)式(1.3)中,模型系数a和b可以用最小二乘法求得,即 (5.5)其中: (5.6) (5.7)预测生成序列按式(5.8)计算. (5.8)预测的结果序列按式(5.9)还原. (5.9)本文预测步骤为:(1)根据历史时序风电功率数据生成数列V(0).(2)对数列进行一次累加生成数列V(1).(3)构造GM(1,1)模型的一阶微分方程,然后按照公式(5.5)~公式(5.7)的方法计算模型的参数向量矩阵A.(4)根据式(5.8)计算预测生成序列.(5)除去预测生成序列中的最老数据,并将预测值保留在原时序风电功率数列中,继续按照以上步骤生成新数列,直至预测到规定步数为止.(6)取后续新时刻的时序风电功率数据,并将此数据保留在历史时序风电功率数据列V(0)中,除去V(0)中的最老数据,继续按照以上步骤生成新数列,直至预测到规定时刻为止.5.2.2模型二求解利用Matlab编程求解GM(1,1)模型。将所得的预测值进行描点并与实际值进行比对,可得到如下图像:下表给出了由GM(1,1)计算出的从2006年5月31日至6月6日,每台机组风电功率、总风电功率及总机组功率预测值的误差值:表5-1各个机组及其总功率预测值的误差值(GM模型)误差(%)ABCD四台机组总机组2006.5.3123.9389825.2276825.1956922.8010722.9872118.943062006.6.0130.3688431.4861331.9772229.4769228.6937623.499652006.6.0247.3474646.4836946.3699444.2420344.256538.825582006.6.0354.7966655.8388154.9266251.7445152.5545746.007492006.6.0465.1696167.7245963.5365559.6496362.4444955.298232006.6.0567.7936370.0637866.8457961.9587165.0628857.481532006.6.0680.8018183.5665979.4906976.8085478.1130470.922025.2.3模型二评价设原始序列及按GM(1,1)建模法所求出的残差序列的方差分别为和,则 其中,.计算后验差比为 计算最小误差概率的公式为 表5-2后验差检验判别参照表C模型精度<0.35优<0.50合格<0.65勉强合格>0.65不合格将GM(1,1)模型所解得的数据代入灰色模型评价的公式中,可解得每组数据对应的C值表5-3灰色模型评价结果PAPBPCPDP4P58C0.340.400.370.420.340.30模型精度优秀合格合格合格优秀优秀综上所述,运用GM(1,1)模型对PA,PB,PC,PD,P4,P58的预测结果精度介于优秀和合格之间,具有比较强的可信度.5.3模型三:基于时间序列(ARMA)的风电功率预测模型[2-3]5.3.1平稳性检验在建立ARMA模型之前,首要的任务就是检验风电功率序列是否平稳,如果不平稳,就要对序列进行差分,差分后成为平稳序列,则称其为d阶单整序列,其中d为差分的次数.在实际应用中,一般一阶单整序列即可满足要求,如果d比较大,则有可能破坏序列本身所含有的信息,使得预测的精度降低.通过Eviews软件对A、B、C、D各组风电机风电功率,及四组总的电功率值和58台电机组的电功率时间序列进行ADF检验,得到5月30日96点数据样本的平稳性检验结果,A、B、C、D、四台风电机及四组总的电功率值、58台风电机检验结果如下表所示:表5-4A、B、C、D风电机96点风功率的ADF检验At-StatisticProb.*Bt-StatisticProb.*Ct-StatisticProb.*Dt-Statistic

Prob.*AugmentedDickey-Fullerteststatistic-5.3015110.0000-3.7280930.0051-6.3138640.0000-3.5609010.0084Testcriticalvalues:1%level-3.500669-3.501445-3.500669-3.5006695%level-2.892200-2.892536-2.892200-2.89220010%level-2.583192-2.583371-2.583192-2.583192表5-54台和58台风电机96点风功率的ADF检验4台t-Statistic

Prob.*58台t-Statistic

Prob.*AugmentedDickey-Fullerteststatistic-3.560901

0.0084-2.973195

0.0411Testcriticalvalues:1%level-3.500669-3.5006695%level-2.892200-2.89220010%level-2.583192-2.583192由表5-4与5-5可以看出,风电功率时间序列ADF检验统计量甚至小于1%的显著水平的临界值,我们在95%置信的水平下可以很有把握拒绝原假设,即本序列不存在单位根,是平稳时间序列.这个风电功率时间序列样本满足建立ARMA模型的前提条件.5.3.2ARMA模型的建立根据博克斯一詹金斯(BJ)方法论,建立ARMA(p,q)模型,有三个步骤:模型识别,模型的参数估计和模型的检验.步骤1模型的识别模型的识别就是找出适当的p和q值,通过自相关函数值和偏相关函数值能够帮助我们解决这个问题.B、C、D、四台风电机及58台风电机自相关和偏相关函数值表见附录,A风电机自相关和偏相关函数值如下表所示:表5-5A、B、C、D台风电机96点风功率自相关和自偏相关函数值表续表5-54太台风电机及58台风电机96点风功率自相关和自偏相关函数值表图5-8A风电机96点风电功率数据的自相关和偏相关函数P阶自回归过程的自相关是拖尾的,而它的偏相关函数在滞后P步之后是截尾的.与此相应,q阶滑动平均过程的自相关函数在滞后q步之后是截尾的,而它的偏相关函数是拖尾的.ARMA模型的自相关和偏相关函数都是拖尾的.由图5-8可以看出,其自相关和偏自相关函数都没有截尾现象,因此应选用ARMA模型.对于96点风电功率数据,自相关滞后l、2、3阶,偏相关滞后l、2阶的函数值比较大.因而在建立模型时,A组的AR项应选自AR(1)、AR(2)、AR(3),MA项应选自MA(1)、MA(2).由ADF检验可知B组风电功率时间序列样本也满足ADMA模型的前提条件.根据表5-5的自相关和偏相关函数值可知AR项应选为AR(1)、AR(2)、AR(3)、AR(4),MA项应选自MA(1)、MA(2).同理由C组风电功率时间序列样本的ARMA模型中AR项应选为AR(1),MA项应选自MA(1).D组风电功率时间序列样本的ARMA模型中AR项应选为AR(1)、AR(2),MA项应选自MA(1).A、B、C、D四组总的电功率时间序列样本的ARMA模型中AR项应选为AR(1)、AR(2)、AR(3)、AR(4),MA项应选自MA(1).58组总的电功率时间序列样本的ARMA模型中AR项应选为AR(1)、AR(2)、AR(3)、AR(4),MA项应选自MA(1).步骤2模型的参数估计及预测方程的建立初步选定ARMA(p,q)的p和q以后呢,可以根据p和q的不同组合计算出计算模型检验的一些参数,如拟合优度R2,AIC准则(赤池信息准则),以及预测方程的系数表5-7A组风电机96点风功率预测方程系数由表5-6可知拟合优度为0.318246,AIC值为12.71219,综合考虑各项因素并考虑到模型满足可逆性和稳定性条件,最终选择ARMA模型为ARMA(3,2).由Eiews软件算出模型中各项的系数如表5-6所示.最终确定A组电机96点风电功率的预测方程为:表5-8B组风电机96点风功率预测方程系数由表5-7可知拟合优度为0.351180,AIC值为12.69596,综合考虑各项因素并考虑到模型满足可逆性和稳定性条件,最终选择ARMA模型为ARMA(4,3).由Eiews软件算出模型中各项的系数如表5-7所示.最终确定B组电机96点风电功率的预测方程为表5-9C台风电机96点风功率预测方程系数由表5-8可知拟合优度为0.168059,AIC值为12.9603,综合考虑各项因素并考虑到模型满足可逆性和稳定性条件,最终选择ARMA模型为ARMA(1,1).由Eiews软件算出模型中各项的系数如表5-8所示.最终确定C组电机96点风电功率的预测方程为:表5-10D台风电机96点风功率预测方程系数由表5-9可知拟合优度为0.367146,AIC值为12.55986,综合考虑各项因素并考虑到模型满足可逆性和稳定性条件,最终选择ARMA模型为ARMA(2,1).由Eiews软件算出模型中各项的系数如表5-9所示.最终确定D组电机96点风电功率的预测方程为:表5-11四组风电机总功率96点风功率预测方程系数由表5-10可知拟合优度为0.561957,AIC值为14.64764,综合考虑各项因素并考虑到模型满足可逆性和稳定性条件,最终选择ARMA模型为ARMA(4,1).由Eiews软件算出模型中各项的系数如表5-10所示.最终确定四组电机96点风电功率的预测方程为:表5-1258组风电机总功率96点风功率预测方程系数由表5-11可知拟合优度为0.670443,AIC值为19.32988,综合考虑各项因素并考虑到模型满足可逆性和稳定性条件,最终选择ARMA模型为ARMA(4,1).由Eiews软件算出模型中各项的系数如表5-11所示.最终确定58组电机96点风电功率的预测方程为:5.3.3ARMA模型的求解根据上述建立的预测方程,我们选取30号的风电功率数据对31号的各时点进行预测并得到预测值和真实值的比较,我们通过MATLAB做出如下的图形直观的比较了预测值和真实值.图5-9A台风电机算法预测曲线图5-10B台风电机算法预测曲线图SEQ表格\*ARABIC5-11C台风电机算法预测曲线图5-12 D风电机算法预测曲线图5-13 4台风电机算法预测曲线图5-14 58台风电机算法预测曲线5.4模型四:基于BP神经网络的风电功率预测模型[2][4]5.4.1BP网络结构BP网络的基本结构如图5-1所示,其输入层节点数为n,输入变量为xi(p)(i=1,2,…,n);隐层节点数为l,输入层节点数与隐层结点间的连接权值为wji(i=1,2,…,n;j=1,2,…,l),隐层结点的阀值为θj(j=1,2,…,l),隐节点输出为yj(p);输出层节点数为m,隐层节点与输出层节点间的连接权值为vkj(j=1,2,…,l;k=1,2,…,m),输出层结点的阀值为φk(k=1,2,…,m),输出层结点输出为Ok(p).每一个神经元用一个节点表示,网络由输入层、隐层和输出层节点组成.隐层可以是图5-1所表示的一层,也可以是多层,前层到后层的节点通过权联结。隐节点一般采用Sigmoid型函数,输入和输出节点可以采用Sigmoid型函数或者线性函数。由于采用的是BP神经网络,所以常称为BP神经网络.图5-15BP神经网络结构图5.4.2BP神经网络学习算法神经网络的学习也称为训练,指的是通过神经网络所在环境的刺激作用调整神经网络的参数(权值和阈值),使神经网络以一种新的方式对外部环境作出反应的一个过程.神经网络的学习方法有两大类:有教师学习和无教师学习.在有教师学习方法中,神经网络的输出与期望的输出(即教师值)相比较,然后根据两者之间的误差函数(又称为目标函数)来调整网络的权值,最终使误差函数达到最小值.对于无教师学习,当输入的样本模式进入神经网络后,网络按照预先设定的规则自动调整权值,使网络最终具有预测、模式分类等功能.针对不同的网络用途,人们提出了多种神经网络的学习规则,基本的有以下四种Hebb学习规则、d学习规则、概率式学习规则和竞争式学习规则.BP学习算法是d学习规则的推广和发展,d学习规则的实质是利用梯度最速下降算法,使权值沿误差函数的负梯度方向改变.对Ⅳ个样本的训练集,定义神经网络的误差为: (5.10) (5.11)其中,p为样本序号,和分别为第p个样本的期望输出和实际输出,为第p个样本的误差.权值wij修正的目标是使E最小.权值wij的修正量△wij由梯度下降法可得: (5.12)其中,η为学习率,又: (5.13)令:则有: (5.14)这就是d学习规则.在BP网络学习过程中,输出层单元与隐含层单元的误差d的计算方法不同.当j为输出节点时: (5.15)当j不是输出节点时: (5.16)式中m为j的前一层所有神经元.d的计算是从输出层逐层向后计算的.权值修正公式归纳为: (5.17)在实际的应用中,为改善学习过程的收敛性,通常在权值修正中加上动量项,即: (5.18)BP网络的学习过程包括前向传播和误差后向传播.前向传播完成的是:当给定网络的输入时,它由输入层单元传到隐含层单元,经隐含层单元逐层处理后再送到输出层单元,由输出层单元处理后产生一个输出.误差后向传播是:如果实际输出响应与期望输出有误差,不满足要求,就将误差值沿连接通路逐层向后传送并修正各层连接权值.BP模型的训练步骤如下:步骤1对所有权值赋初值;步骤2给出训练样本;步骤3由输入、权值计算输出值。当E小于给定值时训练结束,否则转第四步;步骤4根据输出计算值与实际值的偏差,从输出层反向逐层调整权值,直至输入层.上述BP算法所对应的程序框图如图5-16所示.可以看出,即模型把一组输入输出样本的函数问题转变为一个非线性优化问题,并使用了优化技术中最普通的梯度下降法.如果把神经网络看成是输入到输出的映射,则这个映射是一个高度非线性映射.图5-16学习算法框图5.4.3神经网络输入、输出变量的选取BP神经网络输入层输入变量的确定还没有很好的选择标准,以原始风电功率的最上一时点16个历史值作为网络的输入,以下一预测点的风电功率值作为目标输出组成样本对,选取多组样本对组成训练样本集来训练网络.5.4.4BP神经的隐层数及隐层节点数对神经网络而言,连接输入与输出单元的隐层像一个“黑箱”,但真正的网络模型就是靠这个“黑箱”来决定的.一般而言,将输入层和输出层直接相连的两层模型往往只在输入模式和输出模式很类似的情况下可行,一旦输入模式和输出模式相当不同时,就需要设计隐层,形成输入信号的中间转换.处理信号的能力也随隐层层数的增加而增加。如果有足够的隐层,输入模式也总能转换为期望的输出模式.对风电功率而言,由于曲线随机性很强,比较难拟合,当选用以上所述的输入和输出变量时,需要设计隐层.目前,对隐层的选择无固定的解析式、理论根据或定理,由Kolgmogrov定理可知:对于在闭空间内的任何一个连续函数,都可以用单隐层的BP网络逼近.因而一个三层BP网络就可以完成任意的n维到m维的映射.因而,本文选择建立1个隐含层的神经网络.隐含层的神经元数目选择是一个十分复杂的问题,往往需要根据设计者的经验和多次试验来确定.隐含层的神经元数目与问题要求、输入/输出单元的数目都有着直接的联系.隐含层神经元的数目太多会导致学习时间过长、误差不一定最佳,也会导致容错性差、不能识别以前没有的样本.因而隐层节点数是存在一个最佳值的.找到最优的隐层节点数对网络的结构很重要.以下公式可作为选择最佳隐单元数时的参考公式. (5.19) (5.20) (5.21)其中:K:样本数;n1:隐层节点数;n:输入层节点数.m:输出神经元数.a:1.10之间的常数.当BP神经网络用作数据压缩情况时,隐层节点数与输入层节点数的比常常为其数据压缩比,可参考式(5-20).本文研究的BP神经网络用于预测,是运用函数拟合的功能,选用式(5-21)要好些.具体多少个隐层节点数需要在预测过程中不断调试才能找到最合适的结果.5.4.5BP神经网络的训练为了网络有较好的学习性能,对输入样本应进行归一化,为避免神经元的饱和现象,在网络的输入层,利用式(5.22)将原始风电功率数据换算到[0,1];输出时,利用式(5.23)换算出功率值. (5.22) (5.23)其中:L':经过归一化后的功率值L:实际功率值Lmax:最大功率值Lmin:最小功率值对BP网络输出数据进行处理后,需要设定神经网络的训练参数.神经网络模型的网络隐层神经元传递函数都采用S型双曲正切函数tansig,输出层神经元传递函数都采用S型对数函数logsig.由于传统BP算法存在一些内在缺陷,例如易陷入局部极小,学习收敛速度慢等,所以本文采用结合了自适应改变学习速率和附加动量法的网络训练方法,该方法的权值调整式为: (5.24)其中,w为权值向量;为误差函数的梯度;为权值修正量:mc为动量因子;η为学习率,并且可以根据误差的变化而自适应调整,以使权系数调整向误差减小的方向变化.试验表明,该算法有利于网络的训练速度和稳定性的提高.网络主要参数的确定:动量因子mc取为0.95,最大训练次数取10000,训练目标误差取10—5.通过反复调试,最终确定隐含层的神经元数目为8.网络模型选择三层网络结构,按照上面方法设计网络结构为16—8一l6.5.4.6模型四求解利用已经训练好的神经网络,对5月31日至6月6日的风电功率进行预测.不断取上一时段16个个预测数据进行分析,完成数据预测.预测曲线如图5-17所示(具体预测数据见附录).图5-17A台风电机算法预测曲线图5-18B台风电机算法预测曲线图5-19C台风电机算法预测曲线图5-20D台风电机算法预测曲线图SEQ表格\*ARABIC5-214台风电机算法预测曲线图5-2258台风电机算法预测曲线根据准确率的定义: (5.25)其中,r1为预测计划曲线准确率;PMk为k时段的实际平均功率;PPk为k时段的预测平均功率;N为日考核总时段数(取96点-免考核点数);Cap为风电场开机容量.计算得到各台风电机的预测准确率如下表:表5-13部分变量符号说明PAPBPCPDP4P58准确率(100%)92.742494.264994.252179.642481.433593.54655.5预测模型的对比分析本文分别采用了基于数据迭代的风电功率预测模型、基于灰色理论的风电功率预测模型ARMA模型、BP神经网络模型对风电功率数据样本进行了预测.它们的预测效果评价如下表所示.表5-1496点风电功率的预测效果对比模型PA准确率PB准确率PC准确率PD准确率P4准确率P58准确率数据迭代82.112482.634977.325180.242179.453985.5345灰色理论47.347446.483646.369944.242044.256138.8255ARAM79.457275.573282.215181.644383.712277.3346BP神经网络92.742494.264994.252179.642481.433593.5465分析上表的预测效果评价指标,我们可以得到以下几点认识:运用上述四种风电功率模型进行风电功率预测都能得到较好的预测效果,预测曲线都能够较好的反映风电功率的变化趋势.ARMA模型是风电功率预测的最常用方法,这是因为ARMA模型利用历史风电功率数据建立预测方程,根据风速的连续规律性,通过统计分析,进一步预测未来时刻风速的发展趋势,方法较为简单,并且预测效果也较为稳定,适用于工程应用,但是缺点在于ARMA模型不能考虑外界影响因素影响,使得预测精度的提高受到限制.基于数据迭代的风电功率模型受到参数的影响较大.当参数的选择不恰当时会时建立的模型不能很好的预测未来时刻的风电功率值.即该模型是纯数学模型,仅仅根据之间的直观关系得出的关系式,因此在实际应用中不能被推广.基于灰色理论的风电功率预测模型是一种仅仅研究少量的数据,信息量极少且不确定性问题的方法.灰色模型能对数据量较少的样本建模,可以用来作为快速跟踪发电功率的方法.可能由于灰色理论用的数据量较少的缘故,在本文中建立的模型预测的精度相比BP神经网络方法有一定的差距.BP神经网络模型是风电功率预测方法中有代表性的一种,由于线性预测模型不足以挖掘风电功率数据中的所有信息.而神经网络模型具有自学习、自组织和自适应性,可以充分逼近任意复杂的非线性关系。所以神经网络应用于风电功率预测能达到较好的预测效果.6问题二模型的建立与求解6.1平均相对误差的计算根据公式 (6.1)可以计算出问题一中四个模型的相对误差,如下表所示表6-1问题一中四个模型的相对误差模型一数据PAPBPCPDP4P58平均相对误差54.2154.6757.2358.2263.7452.45模型二数据PAPBPCPDP4P58平均相对误差46.5447.2348.3551.5454.7444.45模型三数据PAPBPCPDP4P58平均相对误差22.8525.4523.1326.1229.5418.52模型四数据PAPBPCPDP4P58平均相对误差15.8716.3117.5318.1018.7412.98进一步可以绘制出误差分析图

图6-1误差分析图6.2平均相对误差的进一步分析从作出的功率误差与时间的曲线图中可以看出,四台机组的功率P4的预测误差比单台的机组预测值的误差大,而58台机组的总功率的预测值的误差很小,从上述的P4的误差分析可知各风电机组的汇聚会改变风电功率波动的属性,从而可能影响预测的误差.从电工学的角度进行分析,三相对称的电枢绕组充当功率绕组,成为感应电势或者感应电流的载体.由于电枢绕组与主磁场之间的相对切割运动,电枢绕组中将会感应出大小和方向按周期性变化的三相对称交变电势.从基本电磁情况来看,一台直流电机原则上既可工作为电动机运行,也可以作为发电机运行,只是约束的条件不同而已.在直流电机的两电刷端上,加上直流电压,将电能输入电枢,机械能从电机轴上输出,拖动生产机械,将电能转换成机械能而成为电动机,如用原动机拖动直流电机的电枢,而电刷上不加直流电压,则电刷端可以引出直流电动势作为直流电源,可输出电能,电机将机械能转换成电能而成为发电机.同一台电机,电刷端可以无影响工作.但是多台工作时,电刷端无法充分工作,因此多台风电机组汇聚会加大与预测值之间的差距.而58组的功率的预测误差最为精确说明,当风电机组足够多的时候,这种机组汇聚不仅不会改变风电功率的波动性,反而可能会提高风电功率的平稳性.7问题三模型的建立与求解7.1模型五:基于ARMA的改进神经网络模型[2]7.1.1模型建立问题一中,通过建立ARMA时间序列模型以及神经网络模型,我们得到了较好的预测结果.虽然BP神经网络我们得到了较好的预测结果,但是以历史电功率值作为网络的输入,预测下一预测点的风电功率值收敛速度缓慢,而且常常因为训练方式的不同而出现预期效果不能常常近如人意的现象.为了解决这一问题,本文将采用基于时间序列分析的神经网络预测法,即对风电功率时间序列进行建模,根据ARMA预测方程式,确定那些对预测影响最大的历史数据和残差量,从而提高预测精度和保持预测精度的稳定性.对5月30日共96个风电功率的时间序列,建立ARMA模型如下(从上到下分别是A、B、C、D风电机,4台风电机总和以及58台风电机总和的ARMA预测方程):在上述的各预测方程中,时刻的风电功率值是,时刻的风电功率值是,时刻的风电功率值是,时刻的风电功率值是以及ARMA模型的残差滞后量是和对t时刻的风电功率值有着很大的影响.因而神经网络的输入变量选为、、、、和.对于短期的风电功率预测,采用上述训练样本存在一个明显的缺陷:网络在学习过程中对输入样本的各时刻风电功率同等对待,并没有确切体现它们的时序关系,使得训练得到的网络往往不能准确地揭示风电功率的变化机理,导致预测精度不佳.因此,在训练样本输入集引入遗忘因子K(0≤K≤1),以体现对前期风电功率的遗忘.在本模型中遗忘因子取为0.95.即神经网络输入,0.95,0.952,0.953、和,则对于PA输入层包括5个神经元,对于PB输入层包括6个神经元,对于PC输入层包括2神经元,对于PD输入层包括3个神经元,对于P4输入层包括5个神经元,对于P58输入层包括5个神经元.输入变量选择为,即神经网络的输出层有一个神经单元.7.1.2模型求解利用已训练好的网络,分别对时间段A号风力发电机功率、时间段58台风力发电机总功率、时间段B号风力发电机功率进行仿真,时间段58台风力发电机总功率进行仿真结果如下:,预测曲线及绝对误差图像如图7-1所示.图7-15月31日A发电机功率预测与误差曲线图7-25月31日58台发电机功率预测与误差曲线图7-35月31日至6月6日A发电机功率预测曲线图7-45月31日至6月6日A发电机功率误差曲线图7-55月31日至6月6日58台发电机功率预测曲线图7-65月31日至6月6日58台发电机功率误差曲线通过上图,我们发现模型对于峰值有着很理想的预测精度,模型整体的预测精度得到了很大的提高.并且,模型对于发电机发电功率随时间的变化趋势预测非常准确,时间延迟现象得到了很大的改善.7.2阻碍精度进一步改善的原因分析BP神经网络输入层输入变量的确定还没有很好的标准,而以原始风功率的最近几个历史值作为网络的输入,以下一预测点的风电功率值作为目标输出组成样本对,选取多组样本对组成训练样本集来训练网络,不仅收敛缓慢,而且由于人工网络的调试不当,使得结果偏差交大.然而,在先运用ARMA模型求出精确的预测方程后,就可以确定那些对预测影响最大的历史数据和残差量,更便于收敛,因此收敛速度更快,精度也提高了.7.3精度值提高的极限由于时间序列ARMA模型本身变具有一定的误差,因此无论如何运用神经网络算法进行训练,始终存在极限误差,因此该方法对精度的提高是有限的.8模型评价8.1GM(1,1)灰色预测模型优缺点优点:灰色预测具有要求样本数据少、原理简单、运算方便、短期预测精度高、可检验等优点,因此得到了广泛的应用,并取得了令人满意的效果.缺点:GM(1,1)模型的应用存在一定的局限性,当原始数据基本按指数规律发展,而且速度不是很快时运用这个模型来分析和预测将会得到最佳的预测数据. 8.2ARMA时间序列预测模型优缺点优点:ARMA时序方法建立在严密的数学理论基础之上,具有结构简单、预测速度快、方便操作等特点,相对于其他时序分析预测方法更适合实际应用.缺点:对于volatility问题不能很好解决,在预测中volatility会影响到MAPE,MSPE,使得数据失真.8.3BP神经网络模型优缺点优点:针对问题一中BP神经网络模型,BP神经网络能通过学习带正确答案的实例集自动提取“合理的”求解规则,且具有容错和容差能力以及一定的推广能力.缺点:BP神经网络学习时间过长,甚至可能达不到学习的目的,且难以解决应用问题的实例规模和网络规模之间的矛盾.9模型的改进方向当运用神经网络对风电功率进行预测,在组织训练样本时,有两种策略:一种是训样本全部由过去的功率历史数据组成;另一种是训练样本由过去的功率历史数据和影响功率变化因素的历史记录组成,考虑了影响功率变化的因素.由于风电功率的变化波动性很大,且与风速有很大的相关性,仅仅利用功率本身数据进行预测,使得预测效果受到一定限制,因此本文还可以在风电功率预测神经网络模型中加入风速因素,构建计及风速的神经网络预测模型以达到提高预测精度的目的.此外,BP神经网络在训练速度、预期结果稳定性和预期精度上仍有提升空间,例如,为解决BP网络预测稳定性,可以考虑采用遗传算法或卡尔曼滤波方法对权值和阀值进行估计,从而得到更稳定输出的神经网络预测模型.参考文献李俊芳,张步涵,谢光龙等.基于灰色模型的风速-风电功率预测研究[J].电力系统保护与控制,2010,38(19):151-159.时庆华.基于卡尔曼滤波和神经网络的短期风功率预测[D].南京:东南大学,2010.张大维,刘博,刘琪等.Eviews数据统计与分析教程[M].第1版.北京:清华大学出版社,2010:2-3.卓金武,魏永生,秦健等.MATLAB在数学建模中的应用[M].北京:北京航空航天大学出版社,2011:99-125.附录程序源代码之一——ARMA时间序列模型时间序列画图clc,cleara=xlsread('PA','B2:CS30');A=a(1,:);%fori=1:7%A(1,1+96*(i-1):96*i)=a(i,1:96);%end%y=zeros(1,9)fori=1:93%y(i)=386.1877+0.054824*A(1,i+2)+0.715173*A(i+1)-0.125901*A(1,i)-345;%y(1,i)=405.3700+0.685831*A(1,i+3)-0.593849*A(i+2)+0.310887*A(1,i+1)+0.078618*A(1,i)-275;%y(1,i)=414.9629+0.149555*A(1,i);%y(1,i)=361.4005-0.113855*A(1,i+1)+0.342301*A(i)-335;%y(1,i)=19691.22+0.102582*A(1,i+3)+0.659955*A(i+2)-0.120416*A(1,i+1)-0.086151*A(1,i)-17600;y(1,i)=1542.901+0.630659*A(1,i+3)+0.050221*A(i+2)+0.070622*A(1,i+1)-0.081116*A(1,i)-1170;end%x=1:96;figureplot(a(1,4:96),'LineWidth',2);holdonplot(y,'r-.','LineWidth',2);holdoff时间序列算法clc,clearA=xlsread('P58.xls','B2:CS29');a=A(1,:);a=nonzeros(a')';r11=autocorr(a);r12=parcorr(a);da=diff(a);r21=autocorr(da);r22=parcorr(da);n=length(da);fori=0:3forj=0:3spec=garchset('R',i,'M',j,'Display','off')[coeffX,errorsX,LLFX]=garchfit(spec,da);num=garchcount(coeffX);[aic,sic]=aicbic(LLFX,num,n);fprintf('R=%d,M=%d,AIC=%f,BIC=%f\n',i,j,aic,sic);endendspec2=garchset('R',3,'M',2,'Display','off');[coeffX,errorsX,LLFX]=garchfit(spec2,da)[sigmaForecast,w_Forecast]=garchpred(coeffX,da,6);x_pred=a(end)+cumsum(w_Forecast)程序源代码之二——BP网络模型BP网络画图clc,clearA=xlsread('P58.x

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论