版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、(封面格式) 报名序号:1249论文题目:某地区电力负荷数据分析与预测姓 名班级有效联系电话参赛队员1陈富安全工赛队员2谢海燕统计赛队员3王浩统计导教师:唐玲参赛学校:安徽建筑大学南区证书邮寄地址、邮编、收件人:地址: 安徽合肥市经开区紫云路292号安徽建筑大学南区 邮政编码:230061收件人姓名: 陈富 联系电话: 131155146667 报名序号:1249论文题目:某地区电力负荷数据分析与预测阅卷专家1阅卷专家2阅卷专家3论文等级某地区电力负荷数据分析与预测摘 要针对两个地区历史数据分析及未来数据相关预测,本
2、文用统计学相关理论为基础对两个地区历史数据进行探索分析,深入并直观的描述了数据的分布情况;同时利用时间序列乘积季节模型和LMBP神经网络模型分别对未来数据进行预测并进行相关误差分析,分别得到不同预测方法下的预测结果。对于问题一,本文对两个地区2014年1月1日2014年12月31日的负荷数据进行挖掘分析,选取描述数据集中趋势的均值和中位数统计量、描述数据分布离散程度的方差和离散系数统计量以及描述数据分布偏态与峰度的偏度系数和峰度系数统计量来描述各地区全年的日最高负荷、日最低负荷、日峰谷差、日负荷率指标的分布情况;绘制出了两地区2014年全年负荷持续曲线;结合上述结果,分析出地区2负荷变化数据波
3、动较平缓,初步预判地区2的负荷可以获得更准确的预测结果。对于问题二,本文根据2012年1月1日至2014年12月31日的数据,用偏最小二乘法,分别对日最高负荷、日最低负荷、日平均负荷与各气象因素关系进行回归分析,得出6个多元线性回归模型,同时得到各个回归模型的离差平方和,以离差平方和的大小来反映回归误差的大小;使用简单相关系数检验法,通过各个气象因素相互之间的相关系数矩阵,得出最高温度、最低温度、平均温度这三个因素相关系数较高,存在多重共线性;再经过变量的显著性检验,得出若要用气象因素来提高负荷预测精度,优先推荐平均温度、降雨量、湿度这三个气象因素的结论。对于问题三,考虑到历史电力负荷数据具有
4、明显的周期性,建立时间序列乘积季节模型,对两个地区2015年1月11日至17日共7天的电力负荷进行预测,得出负荷预测结果见附件。由于模型中各个参数均通过了参数的显著性检验,残差序列通过了残差检验为白噪声序列,体现了模型对原序列的信息提取十分充分,所以在不知道实际负荷数据的情况下,有充分理由判断预测结果的准确度是较高的。对于问题四,考虑最日高温度等5个天气因素,利用包含5个输入层,7个隐含层和一个输出层的LMBP神经网络预测模型在5个天气因素影响下,再次对两个地区2015年1月11日至17日共7天的电力负荷进行预测,得出负荷预测结果见附件。对于问题五,综合上述结果参数,并同时引用股票分析中的黄金
5、分割线对两个地区负荷数据规律优劣进行评价。得出地区2的数据规律性优于地区1的结论。关键词:描述性统计,偏最小二乘回归,时间序列乘积季节模型,LMBP1 问题的提出一、背景知识短期负荷预测是电力系统运行与分析的基础,对机组组合、经济调度、安全校核等具有重要意义。提高负荷预测精度,是保障电力系统优化决策科学性的重要手段。现代电力系统中,构成电力负荷的用电器种类繁多,空调等受气象条件影响的负荷占比持续增高,气象因素(温度、湿度、降雨量等)对电力系统负荷的影响愈显突出。考虑气象因素成为调度中心进一步改进负荷预测精度的主要手段之一。二、相关试验数据已知地区1、地区2从2009年1月1日至2015年1月1
6、0 日的电力负荷数据(每15min 一个采样点,每日96点,量纲为MW)以及2012年1月1至2015年1月17 日的气象因素数据(日最高温度、日最低温度、日平均温度、日相对湿度以及日降雨量),详见附件1-数据.xlsx。三、要解决的问题1.请分析两个地区2014年1月1日-2014年12月31日的负荷数据,统计各地区全年的日最高负荷、日最低负荷、日峰谷差、日负荷率指标的分布情况,并绘制两地区2014年全年的负荷持续曲线;结合上述结果,分析两地区负荷变化的主要差异;初步预判哪个地区的负荷可以获得更准确的预测结果,说明你的理由。2.根据2012年1月1日至2014年12月31日的数据,分别对日最
7、高负荷、日最低负荷、日平均负荷与各气象因素的关系进行回归分析,分析回归误差;如果要用气象因素来提高负荷预测精度,在诸气象因素中,你优先推荐哪个(或哪几个)?简要说明理由。3.请根据已知负荷数据,构建预测方法,对两个地区 2015年1月11日至17日共7天的电力负荷进行预测(间隔 15min),给出负荷预测结果(提交两个地区96*7负荷预测结果数据,具体要求见附录1);在不知道实际负荷数据的条件下,你对预测结果的准确度有何推断,请说明理由。4.如果已获得2015年1月11日至17日的气象因素数据,你能否构建计及气象因素的负荷预测方法,对两个地区2015年1月11 日至17日共7天的电力负荷再次进
8、行预测(间隔 15min),给出预测结果(提交两个地区 96*7负荷预测结果数据,具体要求见附录1);与原有的预测结果相比,你认为计及气象因素影响的负荷预测结果精度得到改善了吗?有何证据?请说明理由。5.综合上述计算结果,你如何评价两地区负荷规律性的优劣?你还有什么证据可以佐证两地区负荷整体规律性优劣的判断?2 问题的分析1) 对于问题一,本文使用统计学方法,并利用MATLAB对所给数据进行处理,分别绘制出日最高负荷、日最低负荷、日峰谷差、日负荷率四个指标分别随时间变化的曲线图,并且分别得出数据的集中趋势、数据分布离散程度和数据的分布偏态与峰度3个大方面来描述统计分布情况。2) 对于问题二,本
9、文对日最高负荷、日最低负荷、日平均负荷与各气象因素的关系进行偏最小二乘多元回归分析,在EVIEWS软件中分别得出两个地区6个线性回归方程,并同时对线性回归方程误差进行了分析。3) 对于问题三,要求由已知负荷数据对两个地区2015年1月11日至17日共7天的电力负荷进行预测。相对于已知数据来说,预测属于短期预测。故本文利用时间序列季节乘积模型对这7天数据进行预测。4) 对于问题四,要求利用2015年1月11日至17日的气象因素数据构建计及气象因素的负荷预测方法,同样的对两个地区2015年1月11日至17日共7天的电力负荷再次进行预测。本文在MATLAB中利用LMBP算法进行7天电力负荷再次预测。
10、5) 对于问题五,要求综合上述计算结果,比较两地区负荷数据的优劣。本文通过选取上述计算结果日峰谷差方差等几项具有代表性的参数来对两地区数据规律性进行综合评价,并结合股票中黄金分割线思想来进一步佐证评价结果。3模型假设1)假设所有数据来源真实可靠;2)假设电负荷量只受题目所给五项气象因素影响3) 在建立乘积季节模型,序列周期选取时,假设一年都是365天;4名词解释与符号说明一、名词解释1) 日最高负荷:典型日中记录的负荷中,数值最大的一个;2) 日最低负荷:典型日中记录的负荷中,数值最小的一个;3) 日峰谷差:日最高负荷与最低负荷之差;4) 日负荷率:日平均负荷与日最大负荷的比值;5) 年持续负
11、荷曲线:按一年中系统负荷的数值大小及其持续小时数顺序绘制的曲线;6) 离散系数:一组数据标准差与其均值的比,也称为标准差系数,是测度数据离散程度的相对指标;7) 偏度系数:是描述分布偏离对称性程度的一个特征数。当分布左右对称时,偏度系数为0。当偏度系数大于0时,即重尾在右侧时,该分布为右偏。当偏度系数小于0时,即重尾在左侧时,该分布左偏。8) 峰度系数:峰度是用来反映频数分布曲线顶端尖峭或扁平程度的指标。有时两组数据的算术平均数、标准差和偏态系数都相同,但他们分布曲线顶端的高耸程度却不同。二、符号说明序号符号含义1X、Y解释变量、被解释变量2、解释变量的第一主成分3表示解释变量矩阵X中第j个变
12、量的第i个样本值4表示被解释变量矩阵Y中第i个样本值5表示标准化后的数值, 6表示标准化后的数值7E0、F0标准化矩阵8表示y关于的回归系数9表示原变量的与之间的相关系数10表示误差对权值微分的雅克比矩阵5 模型的建立与求解一、 问题一的分析与求解根据上文中对日最高负荷、日最低负荷、日峰谷差以及日负荷率的相关描述,再由附件中所提供的两个地区2014年1月1日-2014年12月31日的负荷数据,利用MATLAB软件绘制出了两个地区全年的日最高负荷、日最低负荷、日峰谷差、日负荷率四个指标分别随时间变化的折线图,如图1(相关程序见附录一)。图 1 两个地区各指标对比图根据统计学1中常用来描述数据特征
13、,再结合本题所给数据特点,本文选取了数据的集中趋势(均值、中位数)、数据分布离散程度(方差、离散系数)和数据的分布偏态与峰度(偏度系数、峰度系数)三个大方面中六个参数对两个地区2014年1月1日-2014年12月31日的全年的日最高负荷、日最低负荷、日峰谷差、日负荷率四个指标数据进行进一步描述。利用SPSS软件求出数据的六个参数,如表1所示。表 1 两个地区相关数据分布表集中趋势分布离散程度分布偏态与峰度均值中位数方差离散系数偏度系数峰度系数日最高地区19222.6529324.6584304937.5330.225-0.9991.328负荷地区29786.9159141.2124132055
14、.4470.208-0.2160.089日最低负荷地区15140.6495007.4851515519.7720.239-0.5800.478地区25330.6494662.3052022676.6880.2670.193-0.692日峰谷差地区14081.7284317.1731259224.6920.275-0.8610.490地区24456.2674478.908730535.0850.192-0.6500.512日负荷率地区10.7900.7772190.0010.0401.0391.328地区20.8000.7947040.0010.0400.6940.089根据上文中对全年的负荷持
15、续性曲线的相关,再由附件中所提供的两个地区2014年1月1日-2014年12月31日的负荷数据,利用MATLAB软件绘制出了两个地区全年的负荷持续性曲线图(相关程序见附录一),如图2所示。图 2 全年持续性曲线由图1可知:在全年的日最高负荷、日最低负荷、日峰谷差、日负荷率四个指标中地区2数值高于地区1的数值,说明地区2的总体用电量大于地区1的用电量。由表1可知:地区2统计平均数大于地区1,同样证明地区2总体用电量较大,再对比方差等其他参数,地区2的数据波动范围相对较小,数据的分布较为集中,且较为对称。由图2同样可知,地区2的用电量在几乎全年各时刻均高于地区1的用电量。在大量数据的前提下做预测分
16、析,数据变化范围越小,预测结果越准确。由上述分析可知,地区2的数据更加平稳,波动范围小,所以在后续负荷预测中,地区2相对于地区1可以获得更为准确的结果。二、问题二的分析与求解5.2.1 偏最小二乘法回归分析原理偏最小二乘回归分析2是多元线性回归分析、典型相关分析及主成分分析有机结合。在主成分分析基础理论中,从被解释量X和解释变量Y中提取的第1主成分和应尽量多地携带原始数据的变异信息,时所提取的成分方差达到最大,则有 (1)式中、表示和的方差。在典型相关分析中,为保证解释量与被解释量之间的相关性,在典型成分和的提取过程中,应使典型成分之间的相关性关系最大,则有 (2)式中表示和的相关系数。这样,
17、在X和Y中提取的成分和不仅能够最大程度上地携带X和Y的基本信息,而且保值了和具有比较强大的解释能力。提取第1个主成分后,实施X和Y对的回归分析,如果精度满足要求,则不再计算;否则,提取残余信息继续进行回归分析,直到满足要求为止。如果最终对X共提取m个成分,则Y对X回归分析即可以转化为Y对的一组多元回归分析,而自变量X主成分均可由X线性表示,所以最后可还原成Y对X的回归方程。5.2.2 具体建模求解根据解释量个数不同,偏最小二乘回归分析可分为单变量偏最小二乘回归分析和多变量偏最小二乘回归分析。根据题目要求,本文分别对日最高负荷、日最低负荷和日平均负荷三个被解释变量进行多变量偏最小二乘回归分析。1
18、)设已知被解释变量日最高负荷y和5个解释变量(最高温度)、(最低温度)、(平均温度)、(相对湿度)和(降雨量),样本数为n(n=1096),形成解释变量矩阵和被解释矩阵。将X与Y进行标准化处理,得到标准化后的解释变量矩阵E0和被解释变量矩阵F0。做标准化处理是为了公式表达的方便和减少预算误差。 (3)i=1,2,L,k;j=1,2,3,4,5式中:表示解释变量矩阵X中第j个变量的第i个样本值;表示解释变量X中第j个变量个均值,表示的标准差, 表示被解释变量矩阵Y中第i个样本值, 表示被解释变量y的均值, 表示被解释变量y的标准差,表示标准化后的数值,表示标准化后的数值。2)从E0中提取第1主成
19、分,其中w1为E0的第1主轴,即,E0和F0均是标准化矩阵,则有 (4) (5) 式中:E0i(i=1,2,L,k)表示E0的第i列,(i=1,2,L,k)表示与y的相关系数。在简化算法中只需求出E0对的回归系数即可,无需实施F0对的回归。 (6) (7)式中:表示E0对的回归系数,E1表示回归方程残差矩阵 (8)3)重复建模步骤2),以E1取代E0,以F1取代F0,用同样的方法得到;由于不再是标准化矩阵,所以有 (9) (10) (11) (12)式中表示与y的协方差。依次类推,从第4)步开始,可用交叉有效性来确定偏最小二乘回归分析中成分提取个数,并停止迭代。在得到成分( m stairs(
20、t,f1,g) ;hold onstairs(t,f2,r);%做出全年负荷持续性阶梯曲线附录二: 地区一日最高负荷回归结果 地区二日最高负荷回归结果 地区一日最低负荷回归结果 地区二日最低负荷回归结果 地区一日平均负荷回归结果 地区一日平均负荷回归结果附录三: 地区一负荷差分后序列相关图 地区二负荷差分后序列相关图附录四:clc;close all;clear all;x =xlsread(4.1.xlsx);p=x; y = xlsread(4.2.xlsx);y=y(:,97);t=y; % 利用mapminmax函数对数据进行归一化pn,input_str = mapminmax(p) ;tn,output_str = mapminmax(t) ;% 建立BP神经网络,相对旧一点的MATLAB版本,新版本 newff 函数使用更简洁一些% 但是本质和性能没有区别net=newff(pn,tn,5 7 1,purelin,logsig,purelin);% 10轮回显示一次结果net.trainParam.show=10;% 学习速度为0.05net.trainParam.lr=0.05
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 数字课件教学课件
- 儿童课件教学课件
- 2024小区房屋出租合同范本(简单)
- 2024年城市绿化项目分包协议
- 2024标准交易居间合同样本
- 2024年二手房一次性买卖合同(含付款方式)
- 2024个人购房合同书
- 护理课件背景教学课件
- 2024年小学家长委员会组织协议
- 做文明礼仪的好学生发言稿(7篇)
- NY/T 309-1996全国耕地类型区、耕地地力等级划分
- GB/T 7973-2003纸、纸板和纸浆漫反射因数的测定(漫射/垂直法)
- GB/T 5976-2006钢丝绳夹
- 坐标纸(网格型坐标纸-直接打印即可)
- GB/T 39633-2020协作机器人用一体式伺服电动机系统通用规范
- FZ/T 01002-2010印染企业综合能耗计算办法及基本定额
- 药品储备评估表
- 国家自然科学基金申请经验汇总课件
- 青春期女孩自尊自爱课件
- 2023年西藏开发投资集团有限公司招聘笔试题库及答案解析
- 小学语文人教三年级上册观察桔子孙娟课件
评论
0/150
提交评论