2024元强化学习驱动的高比例分布式光伏智能配电网自适应调压技术报告-天津大学(葛磊蛟)_第1页
2024元强化学习驱动的高比例分布式光伏智能配电网自适应调压技术报告-天津大学(葛磊蛟)_第2页
2024元强化学习驱动的高比例分布式光伏智能配电网自适应调压技术报告-天津大学(葛磊蛟)_第3页
2024元强化学习驱动的高比例分布式光伏智能配电网自适应调压技术报告-天津大学(葛磊蛟)_第4页
2024元强化学习驱动的高比例分布式光伏智能配电网自适应调压技术报告-天津大学(葛磊蛟)_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1.元强化学习学习多个任务的经验,提高在新任务上的学习效率。元学习的核心思想是RL)的一种新兴方法。它旨在通过学习如何学习,提高智能体在新任务₁stepstep4:聚合阶段一、元强化学习二、传统智能配电网调压技术三、基于强化学习的自适应电压控制风/光/氢等多类型风/光/氢等多类型2.传统智能配电网调压技术2.传统智能配电网调压技术2233较大等2.传统智能配电网调压技术2.传统智能配电网调压技术根据电网状态对分布式光伏并网功率进行控制是调节配网电压的重要手段,结合不同的通信控制方式,电压控制策略可以分为以下三种分布式控制分布式控制2.传统智能配电网调压技术时间/s配电系统资源群1资源利用效率低资源利用效率低效率二、传统智能配电网调压技术三、基于强化学习的自适应电压控制天津大学3.天津大学3.1现有电压控制方法的不足可再生能源和负荷羁個立简化羁個立交互配电网模型交互配电网模型控制动作输出输出误差大分布式柴油机3.基于强化学习的电压自适应控制天津大学3.23.2强化学习的优势无模型的实时在线控制:强化学习具有递归神经网络等其他神经网络结构具有记忆性和非线性拟合拟合能力。在控制阶段不需要考虑配电网模型就环境智能体Wa₁-环境a₂-环境奖励奖励控制动作a。变成智能体的输入;智能体接下来输转移到s₂。这个过程中智能体会得到经验储存起来。然后智能体根据这些经验更新神经网络参数得到控制经验天津大学3.33.3基于强化学习的电压自适应控制数据控制数据控制P,=P⁵S+P"+P⁷-pod嘴=+(%27+2)里化学习数据输入交互√使用电压值建立奖励函数求奖励值3.4基于强化学习的电压自适应控制案例分析n时间连续动作空间天津大学NetworkMLPNewok13.基于强化学习的电压自适应控制强化学习训练过程的收敛曲线奖励值收敛曲线奖励值收敛曲线所提算法有最优收敛效果!—PA-DDPG3.基于强化学习的电压自适应控制化学习输入Vi∈N,Vt∈T输出控制数据输入输出控制数据输入控制策略数据输入一、元强化学习二、传统智能配电网调压技术天津大学天津大学4.1深度强化学习存在的问题ChainofTransition图1环境状态转移示意图√非稳态性源于打破了制约大多数单代理强化学习算法的一图2多智能体强化学习√学习程度不均匀源于为合作关系的各个智天津大学天津大学4.2提升方案——元强化学习反映其自身的行为贡献,而不是简单地使用联合奖励。评论家网络中应用Withprobablityp天津大学图133总线网络图4.3元强化学习驱动的自适应电压控制-案例分析图133总线网络图4.3元强化学习驱动的自适应电压控制-案例分析天津大学天津大学4.3元强化学习驱动的自适应电压控制-案例分析图1141总线网络图图1141总线网络图电压失控比电压失控比可u00天津大学天津大学4.34.3元强化学习驱动的自适应电压控制-案例分析aθ,o,r电压平均值电压平均值a

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论