《多无人机路径规划中的通信模型与电量损耗分析(论文)19000字》_第1页
《多无人机路径规划中的通信模型与电量损耗分析(论文)19000字》_第2页
《多无人机路径规划中的通信模型与电量损耗分析(论文)19000字》_第3页
《多无人机路径规划中的通信模型与电量损耗分析(论文)19000字》_第4页
《多无人机路径规划中的通信模型与电量损耗分析(论文)19000字》_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章绪论I多无人机路径规划中的通信模型与电量损耗分析目录TOC\o"1-2"\h\u13569摘要 1244831绪论 297891.1研究背景与意义 284151.2国内外现状 381521.3研究内容及创新点 419881.4论文组织结构 5197542问题描述及模型建立 5169992.1无人机的工作场景 570562.2无人机通信模型 625382.3无人机电量模型 792272.4时间模型 9281652.5问题建模 10120843传统离线算法解决多参量随机序列问题 1055743.1多参数的随机多序列问题 1034273.2遗传算法解决多参量随机序列问题 11264973.3蚁群算法解决多参量随机序列问题 1434513.4粒子群算法解决多参量随机序列问题 18227853.5模拟退火算法解决多随机序列问题 22283533.6算法性能分析 25293044基于GAT网络的强化学习算法解决序列问题 26201254.1强化学习介绍 2686454.2图注意力网络GAT介绍 26228424.3算法设计 28104974.4实验仿真分析 29318455算法性能对比 3226865.1单无人机工作性能比较 3256545.2多无人机协同工作性能比较 3396176结束语 349351参考文献 354834附录 38摘要时代发展和科技进步带动了人工智能实体的发展,无人机就是其中之一。无人机由无线电遥控装置完全或间歇地操作。无人机具有其独特的优势:部署灵活、可搭载MECserver,其可以很好的应对农业物联网场景下,信息采集节点多、节点处理能力有限的问题。但由于无人机的负载能力有限,其供电系统体积较小,因此其飞行时间有限。需要保证在有效的时间内,无人机能够智能自主的完成飞行任务。因此无人机路径规划问题研究至关重要。当今物联网技术高速发展,为了更好地采集空间传感器内存放地信息、协助地面基站做边缘计算,需要对信息载体无人机做路径规划,考虑其在悬停、运算、飞行等多个场景下的通信情况和电量情况。为了进一步加快任务进程,考虑采用多无人机协同工作模式,以减少单个无人机的任务负担。当前已经存在很多成熟的无人机路径规划算法,但多将问题场景视为简单的TSP问题,以飞行距离为优化目标,无法考虑无人机电量、信道等影响因素,也难以对多无人机协同工作系统进行研究。近几年随着强化学习的兴起,非离线模式的DQN网络逐步出现在解决路径规划问题的舞台,其具有很好的灵活性,但其考虑通信、电量模型后的规划效果较差。这些算法不能满足无人机的路径规划对于真实场景的需要本,因此文将着重对于无人机路径规划问题进行研究,考虑无人机自身电池容量有限、数据传输和采集过程受通信信道影响以及多无人机协同工作可以加快任务完成的问题。本文将针对上述问题,更准确的还原真实场景,建立无人机电量损耗模型、无人机通信模型以及多无人机协同工作的辅助边缘计算系统,计算仿真以多无人机任务总时间最短为优化目标,得到最优路径。具体地,提出一种与图注意力网络GAT结合的强化学习算法,其相比于DQN强化学习同样具备较高灵活性且有较高准确率,并对传统蚁群算法、遗传算法、粒子群算法、模拟退火简单解决TSP问题模型进行改进。本文将对5类算法进行性能比较,为多无人机协同辅助边缘计算系统提供可行性建议。 关键词:多无人机协同路径规划,GAT强化学习,辅助边缘计算,遗传算法,蚁群算法,粒子群算法,模拟退火算法1绪论1.1研究背景与意义传感技术的发展使得人力得到解放,例如在最常见的新型智能农业模型中,传感器可以更加及时准确的记录环境中的温度、湿度、作物情况等信息。人工定时回收传感器数据或者建立传感信息通道物联等方式收集各个传感器的数据都具有不够灵活、成本高和资源浪费等问题(陈奇源,张慧芳,2022)。采用可通信无人机进行数据收集可以很好地避免上述问题。无人机因其具有体积小、行动灵活和可进行辅助边缘计算等特点,逐步应用于各类需数据采集后进行边缘计算的现实场景。在采用无人机解决数据传输和边缘计算的场景中,存在无人机电量有限、通信受环境影响等一系列瓶颈问题,因此合理对无人机进行路径规划十分重要。在现实场景中,需要完成大量任务的无人机需要每隔一定时间段返回地面基站获取电能,飞其行到各个传感器进行数据采集同时需要将数据传输到地面基站,通过感知发送协议与地面基站进行传感互通,通过这些数据可见之后辅助地面基站进行一部分边缘计算。当面临处理区域范围庞大、传感器数目众多等问题时,单个无人机很难在短时间内完成任务,可以增派无人机以实现协同工作,提高效率(成欣怡,付羽翔,2023)。当前成熟的无人机路径规划算法多为基于图论背景的离线算法,某程度能看出例如蚁群算法、遗传算法、模拟退火等。传统离线算法难以考虑无人机在飞行、数据传输、边缘计算等多个过程中因电池供电不足导致无人机需要回到地面基站进行充电的问题;当前的研究趋势及其结论,与既有的成熟理论模型保持了高度一致。在研究过程中,本文严格遵循科学研究的规范流程与严谨求实的态度。从研究设计的起点开始,本文就充分借鉴了经典理论模型的构建逻辑,确保研究框架的坚实与合理。在数据搜集阶段,本文采用了多种经过理论验证的有效手段,并对收集到的数据进行了恰当的统计分析。在结果分析环节,本文紧密围绕既有的成熟理论进行。将研究成果与理论模型进行比对分析,既探讨相同点,也分析不同点。对于相同部分,本文进一步说明了研究如何为理论增添了新的验证与丰富。无法模拟无人机在真实场景下数据传输过程中单位数据流传输成功或失败两种状态。这在某种程度上暗示了近几年随着强化学习不断升温,基于DQN网络的强化学习算法可以在更为灵活、动态的解决无人机路径规划问题,但其结果不够稳定,准确率不高(邓明煜、郑泽涛、梁佳俊,2021)。基于上述背景,本文将建立更加具有现实意义的无人机应用场景,并对传统离线算法进行改进,使其可以满足本文提出的场景,同时提出一种基于GAT网络与强化学习相结合的离线算法,使其具有一定的灵活性,并可以高效准确的解决本文探究的问题。1.2国内外现状1.2.1无人机路径规划算法的研究现状无人机路径规划问题是确立目标函数和约束条件不断得到最优解的凸函数优化问题。解决无人机路径规划问题经典模型为传统TSP模型,其主要算法有:粒子群算法、蚁群算法、遗传算法、Dijkstra和模拟退火算法等。其约束条件大都是基于平面或空间内节点序列距离最短(周逸和,付奇琪,张博文,2021)。这在一定程度上诠释了其具有简单性、改进空间大等优势,同时算法模式固定,只需要对无人机工作的二维或三维空间建立笛卡尔系,用距离参数表示解的优劣,就可以很好的解决问题。国内外针对于离线算法的创新性很多,Chen和Zhang[1]提出了利用改进的人工场势结合A*算法、粒子群算法、Voronoi图解决路径规划问题,有较好的实验意义,这在一定程度上预示但文章未能考虑无人机电量与通信状况。Li和Xu[2]等的研究采用了A*,D*等算法,文章从无人机的不同部件的旋转特性入手,对路径规划算法进行了创新,并解决了系统鲁棒性问题(成昊羽,赵欣怡,2020)。其提出基于关联度的优先级启发式生成准则,确定无人机集群的规划顺序(邓芝和,张弘扬,2020)。通过基于碰撞检测算法,建立蜂群耦合度矩阵来确定无人机蜂群之间的耦合关系,用A*算法的优化问题解决了传统路径规划的一系列问题,这在一定程度上暗示了但难以添加其他因素作为约束条件。He和Zhao[3]的调研结论表明:传统离线算法解决路径规划问题的性能接近,单源路径问题下Dijkstra算法具有时间性能上的较大优势(魏博文,付俊天,2019)。这在一定情况下反映了近些年很多人提出RTT算法,其基于多目标路径规划可以更快的约束收敛逼近最优值。Wu,Guo和Li[4]的研究结果展示了基于两棵树的RRT-connect算法,解决了传统RRT不能用于无人机路径规划和其中概率p的选择问题,使算法更为简单,并且提高算法运行速度(赵昕怡,徐静雅,2019)。为了确保研究结果的精确性,本研究全面审视了研究过程中可能出现的各种偏差,并在研究构思、数据收集、分析技法等多个层面实施了严密的监控措施。在研究构思阶段,本文精心打造了科学的研究框架,以确保研究议题的明确性和研究假设的合理性。在数据收集阶段,本文采用了多元化的数据来源,以实现数据的相互补充和验证,同时运用规范化流程来减少数据采集的主观误差。在分析技法上,本文融合了定量与定性分析,以全面、客观地解读数据,并运用统计软件进行数据处理,以降低分析过程中的技术性偏差以评估研究结果对关键假设变动的稳定性。1.2.2强化学习应用于路径规划的研究现状关于强化学习解决路径规划问题,目前结合DQN网络,对智能体无人机做动态路径规划。Sharma,Andersen,Granmo与Goodwin[5]将DQN进行了改进,加入了RL代理的部分,更好的进行了多目标路径规划。Liu,Li,Guan,Wang[6]的文章比较详细的描述了强化学习的算法过程,通过这点我们不难发现对于如何应用于机器人路径规划问题提供了操作指南。Qie,Shi[7]等人的研究提出了可以基于多智能体深度目标分配和路径规划(STAPP)的人工智能方法,结合了当前比较先进多智能体强化学习算法(MADDPG)来解决动态环境中的多智能体问题,从这些统计中看出实验证明方法高效(邓泽洋,吴彤彤,2021)。Wu,Shin,Kim[8]等人提出了一种有效的深度强化学习的惰性训练方法,将神经网络与Q-learning相结合用于深度Q-network的避障和路径规划应用解决实际问题。该方法在训练步骤中消除了不必要的重复,从而减少训练时间,可以在不损失精度的情况下显著减少总执行时间,其Agent被困在一个未知的环境中,可以通过自己的学习寻找到目的地的不发生碰撞的最短路径(黄泽昂,何君萱,2019)。1.3研究内容及创新点本文将以农业领域中多植保无人机辅助边缘计算系统的工作模式为背景,对中间信息载体植保无人机做路径规划,考虑其在飞行、悬停、充电等多个任务过程下的通信状态和电量使用情况(吕佳茜,邱茹怡,2020)。具体研究场景如下:在自由空间内随机分布多个位置固定的传感器,传感器可以将采集的信息与无人机进行数据传输,无人机与地面基站GBS都可以做并行边缘计算,无人机数据收集的过程中保持与基站GBS的数据传输,这明显地揭示了意图数据传输结束后无人机与基站进行感知通信,分担GBS的运算压力而进行悬停边缘计算。无人机从基站GBS出发,途径所有传感器收集信息回到基站GBS。无人机电量不足时,需要及时返回基站进行充电。针对一次任务,可以增派多个无人机从而减少任务时间与电量损耗。相比于已有的研究,本文以总任务时间为优化目标,解决多无人机协同工作的任务分配与路径规划问题,更好的还原现实场景解决问题(陈佳慧,吴昊羽,2022)。通过上述分析,前文的理论分析得到了进一步的深化与拓展,尤其是对关键概念的理解,在理论上进行了更为详尽的阐述与延伸。这种深化不仅包含对概念本质的深入剖析,还涉及对其外延的广泛考察。通过文献回顾与实证数据的分析,本文明确了这些关键概念在理论体系中的核心地位及相互关联。此外,这种拓展也为本文提供了新的研究视角与方向,有助于推动该领域理论的持续进步。本研究同样强调理论与现实的结合,通过解决实际问题验证了理论的可行性与实用性,为相关领域实践提供了坚实的理论支撑。本文将对传统粒子群、蚁群、遗传、模拟退火算法解决TSP问题背景进行改良,将以飞行距离最短为约束条件的TSP问题,转变为多变量随机序列总时间性能最优问题,针对算法性能选择不同的变量维度,并进行实验仿真和实验结果分析。本文提出了一种新的基于GAT网络的强化学习,这在一定程度上描绘了相比于经典无人机路径规划算法,该算法可以模拟真实通信场景和无人机的电量使用情况,同时该算法满足多无人机协同工作的需求,缩短任务时间(陈倩倩,马德华,2020);GAT网络因其独有的注意力机制,对解决多随机变量的序列问题具有良好特性,相比于近几年热度较高的DQN网络,同样具有很好的灵活性,而且其在准确率、优化结果表现更优;本文在笛卡尔系中建立传感器和基站GBS位置模型,通过这些数据可见将三维空间问题简化为平面路径规划,使问题更具有简便性(成雪彤,付东明,2020)。1.4论文组织结构为了智能、高效解决多无人机协同路径规划问题,并对无人机的电量损耗情况进行分析研究:本文将首先进行问题分析,通过模型设计和参量假设,为算法提供真实合理的现实场景,分别建立无人机任务过程中的通信模型、电量模型、时间模型,并提出本文需要解决的约束问题,确定优化目标。其次本文将分别对蚁群算法、遗传算法、粒子群、模拟退火算法进行简单的介绍,并对其解决传统TSP问题进行算法改进,某程度能看出通过仿真测试其解决不同维度的随机参数序列问题的性能设计最优可行算法。并针对同一场景进行多无人机路径规划实验仿真,并进行性能比较。

其次提出新的基于GAT网络的强化学习算法。对分层强化学习和GAT网络进行介绍,并详细介绍GAT网络独有的图注意力机制,根据网络特性设计算法,生成详细的算法流程,并实现仿真和性能分析。最后将改进后的蚁群、遗传、粒子群、模拟退火算法和基于GAT网络的强化学习算法进行性能比较,分析其解决单无人机场景与多无人机场景下呈现不同的特性,得出相关结论,为无人机路径规划提高具有实际意义的建议。第二章问题描述及模型2问题描述及模型建立2.1无人机的工作场景本文采用的无人机工作场景为农业领域多植保无人机辅助边缘计算系统进行数据采集和边缘计算的过程。如图1所示,空间内随机分布多个传感器SN,SN内存放无人机需要进行传输和计算的数据。在地面固定一个基站GBS作为无人机的充电基站,GBS可以对无人机进行充电(苏志时,陈梦菲,2022)。当无人机在SN进行数据并与GBS进行数据传输,该过程结束后无人机会与GBS传感通信,通信成功后,GBS会对大部分数据进行边缘计算,剩余数据部分可以分配到无人机内进行辅助边缘计算。多个协同工作的无人机需要进行任务分配,这在某种程度上暗示了选定个体的工作范围即需要负责的SN集合。无人机需要从GBS出发途径该个体需要负责的所有的SN进行数据采集传输、传感和边缘计算工作,数据采集传输、传感和边缘计算的过程无人机保持悬停(高鸿铭,付嘉铭,2019)。为增强研究结果的可信度和可靠性,本文首要工作是广泛搜集并分析国内外相关领域的文献资料,系统梳理了当前研究的最新进展和理论基础。基于此,结合研究主旨,本文精心设计了一套科学合理的研究方案,包括数据搜集途径、样本选择标准以及分析框架。为保证数据的准确无误和全面覆盖,本文采用了多种数据来源进行交叉验证,真实反映了研究对象的情况。在数据分析过程中,本文运用了前沿的统计工具和方法对数据进行严谨处理,确保研究结论的科学性和客观性。同时,本文还对研究过程中可能出现的误差进行了敏感性分析,进一步提升了研究结果的稳健性。数据采集传输过程无人机需要从传感器获取数据,同时将数据传输到基站,每传输周期传输单位段数据流,采集并传输到基站,这在一定程度上诠释了其具有成功和失败两种情况,当数据流传输失败后会对该数据流进行选择重传(林俊义,付盈倩,2020)。无人机需要计算电量使用情况,当无人机电量不能支持其飞到下一个传感器完成数据采集传输、传感和边缘计算工作并飞回基站时,需要通过回到GBS进行充电,充电过程中悬停(付卓忠,吕佳俊,2022)。当无人机个体完成其任务后,需要飞回GBS。假设无人机以恒定速度V0=4m/s进行运动,保持高度H0=5m不变。图SEQ图\*ARABIC1多无人机辅助边缘计算系统2.2无人机通信模型2.2.1无人机传感无人机在采集数据的过程与边缘计算过程均需要与地面基站进行通信,其遵循感知发送协议,这在一定程度上预示即基站为无人机分配子信道后,无人机与基站进行数据传输和通信交流。为评估无人机的感知质量,因此采用概率感知模型,其中成功的感知概率是无人机与地面基站之间距离的指数函数,可以表示为(熊泽光,唐小曼,2023): (1)其中λ是评价传感性能的参数,li表示无人机i到任务i的距离。2.2.2无人机传输考虑到无人机在与传感器和基站的通信模型为空地链路模型,在无人机传输过充中,无人机通过正交子信道将感知数据传输给基站,以避免相互干扰。因此将无人机发射功率表示为Pu,可以将无人机i的基站接收信噪比表示为(徐铭熙,陈佩珊,2023):(2)其中PLa,i表示空对地路径损耗,N0表示基站接收器处的噪声功率,Hi表示小尺度衰落系数。具体而言,路径损失PLa,i和小尺度衰落在存在视线分量(LoS情况)和不存在视线分量(NLoS情况)两种情况下不同。在这一部分的创作中,本文参考了何其飞教授关于该主题的研究成果,特别是在思维逻辑和技术运用层面。本文遵循了他对研究问题逐步深入剖析的方法,通过明确研究目标与假设,构建了一个完善的研究框架。在数据收集与分析过程中,本文结合了定量与定性的研究方法,力求做到客观公正,以确保研究结论的科学性和可靠性。虽然何其飞教授的研究对本文有所启发,但本文也在研究设计中加入了自己的创新,比如采用了多样化的数据收集方法,并在数据分析阶段深入分析了变量间的复杂关系,旨在使研究既有理论价值,又能指导实际操作。这在一定程度上暗示了无人机i到地面基站信道包含视距分量的概率可表示为(陈奇颖,陈若熙,2022):(3)其中,,当信道包含视距分量时,从无人机i到基站的路径损耗可表示为(邵怡忠,张阳阳,2018):(4)其中fc是载波频率,di是基站和无人机i之间的距离(陈志时,成淑怡,2022)。在视距情况下,小尺度衰落Hi服从Rice分布,尺度参数Ω=1,这在一定情况下反映了形状参数K[dB]=4.217log10(Hi)+5.787。另一方面,当信道不含视距分量时,从无人机i到地面基站的路径损耗可表示为:(5)小尺度衰落hi服从瑞利分布,均值和单位方差均为零。为了实现成功的传输,地面基站处的SNR需要高于解码阈值γth。因此,每个无人机都可以通过计算基站信噪比大于γ⅛的概率来评估其成功传输的概率。无人机i的成功传输概率PrTx,i可计算为(张明天,孙昊羽,2021):(6)其中,,是Ω=1的莱斯分布的累计分布函数(CDF),是单位方差的瑞利分布的CDF。这里,Q1(x)表示阶数为1的马坎Q函数(魏心怡,张凯琪,2021)。通过这点我们不难发现对于无人机飞行至传感器上空进行数据传输的过程,我们视为其基于感知发送协议,从这些统计中看出将数据传输过程划分为n个周期,整体的数据量D划分为n个数据量为di的层次,满足(朱家光,陈菲菲,2022):(7)无人机每周期采集并向基站进行数据传输,不考虑未分配子信道的情况整个过程需要考虑两种情况(邵文琪,徐昊翔,2021):传输成功:传输成功后将进行下一个数据量di的传输。传输失败:将重新传输数据量di的数据。2.3无人机电量模型在飞行过程中无人机需要时刻满足电量大于等于0,这明显地揭示了意图因此无人机在任意传感器起飞到规划路径的下一个传感器都需要满足其电量可以支持无人机飞行损耗、到下一个传感器可以完成数据采集传输、通信传感和边缘计算过程后,电量可支持飞回基站,否则将从该传感器直接返回地面基站进行充电,后选择下一个传感器进行任务(成文泽,赵欣妍,2021)。本文对结论进行了二次审查,旨在理论上证实研究假设的正当性和逻辑上的统一性。经过系统性的文献考察与对比研究,本研究肯定了所采用模型的科学性及其实施可能性。在此之上,采取多样化的实证方法进一步评估结论的有效性,以增强其稳定性和精确度。经与现有研究对比发现,本文结论具有广泛的适用性和独特性。它不仅巩固了部分既有看法,还提出新见解,为理论探索提供新的视角和支撑,并讨论了其实用价值和对未来研究的启示。2.3.1飞行过程电量模型本文采用对于文献[9]中提到的飞行电量模型进行简化,公式如下:(8)该模型中q为轨迹函数,c1、c2为受风力等因素影响的银子,a为加速度,t为时间,v为速度。在本文模型中,不考虑速度变化和高度变化,因此根据空气动理论进行简化为(高永涛、陈俊琦、付瑾瑜,2023):(9)2.3.2悬停过程的电量损耗这在一定程度上描绘了无人机悬停电量损耗可表述为待机电量,即无人机开机后悬停过程所需的基础电量,这里根据调研文献[10]可以表达为两部分组成,即数据感知传输过程的电量损耗与辅边缘计算过程的电量损耗。其中感知传输过程中的电量损耗为(陈昊天,周紫薇,赵文华,2022):(10)Po为悬停功率,Pa为传输功率,b为数据量。辅助边缘计算过程中的电量损耗为:(11)Po为悬停功率,Px为运算功率,x为感知失败次数,tw为感知时间(曹奇远,赵交,2023)。2.3.3充电过程电量模型无人机返回地面基站进行充电的电量随时间的增加过程为理想状态,假设充电电压和功率为恒定电压功率,通过这些数据可见电量随时间进行均匀增加。得到如下公式:(12)2.3.4全过程无人机主电池电量模型设计无人机i主电池电量随时间的变化函数,该函数为以不同的无人机工作过程分段,假设上一个阶段无人机的剩余电量为Ex,则有如下模型(陈嘉欣,许志光,2017):(13)2.4时间模型2.4.1无人机的路径时间本文中假设无人机的路径速度恒定不变,某程度能看出因此设飞行速度为V0,因此得单个无人机的路径时间为:(14)其中Dij表示无人机从传感器i到传感器j的路径长度(郭文涛,赵雨欣,2023)。上述内容的创新焦点在于视角的更新,首先体现于对研究对象的全新理解。传统研究大多聚焦于对象的典型特征与普遍关系,而本文则独辟蹊径,深入发掘那些被忽视的边缘特征及潜在纽带。在研究方法的选择上,呈现出新颖的视角,超越了传统研究方法的限制,创新性地结合了多学科的研究途径。同时,在理论运用层面,本文大胆尝试从不同理论体系中汲取灵感,构建了一个综合性的理论解析框架。这不仅揭示了以往研究的理论盲点,还为相关领域的理论发展带来了新的活力,拓宽了理论探索的边界,为后续研究提供了更为广阔的思维空间。2.4.2无人机的充电时间假设无人机主电池的电池容量为E,无人机充电的过程视为恒压稳定过程,得到无人机的单次充电时间为(孙昊羽,周婉如,2022):(15)其中U(t)表示充电电压,I(t)表示充电电流,P(t)表示充电功率。2.4.3无人机数据传输时间无人机飞行至传感器上空进行数据传输的过程,这在某种程度上暗示了我们视为其基于感知发送协议,将数据传输过程划分为n个周期,整体的数据量D划分为n个数据量为d的层次,每周期采集并向基站进行数据传输,不考虑未分配子信道的情况整个过程,考虑上文提到传输成功与失败两种情况,得到数据收集与传输的时间为(陶嘉琪,蒋心怡,2021):(16)其中tp表示传输单位数据量d的时间,ef表示传输效率为,PrTx表示传输成功概率。2.4.4无人机传感时间根据无人机传感模型,这在一定程度上诠释了当无人机进行数据收集与传输后需要与基站进行边缘计算前的准备通信,该过程存在成功与失败两种状态,若感知成功则开始边缘计算过程,失败则需要重新感知。因此表示边缘计算过程所用的时间为(胡志天,成雅静,2021):(17)这在一定程度上预示其中tw表示单次传感时间,Prs,i表示传感成功概率。此成果与本文原先预设的研究结果相一致,这在一定程度上证明了本文研究策划的科学性和理论体系的合理性。通过深度解析研究对象并进行多层面验证,本文不仅验证了初步设想的可靠性,还丰富了该领域的理论深度。这一研究结论为相关领域的实践提供了有益的指导。通过对关键议题的深入探究,本文揭示了现象背后的深层次机理,这些洞见有助于优化资源分配、提升决策效能,并推动行业的可持续进步。此外,这一研究结果的取得也进一步凸显了理论结合实践的重要性。本文在理论上有所创新,同时也注重研究成果的实际应用价值。。2.4.5全过程单无人机任务时间模型设计无人机i完成任务所需的时间不定参数,得到如下模型(林志远,黄雅静,2019):(18)其中num1表示无人机i的充电次数,num2表示无人机i负责的传感器个数。2.5问题建模本场景研究的问题为多无人机在最短时间内遍历全部传感器进行数据传输与边缘计算,这在一定程度上暗示了且保持整个过程中无人机电量≥0(冯泽和,程心怡,2020)。因此将时间最短作为优化目标,其中包括了无人机飞行、悬停数据传输、辅助边缘计算、无人机飞行、无人机充电等过程。设计n个无人机完成任务所需的时间集合为Tx,则有。因此假设无人机的工作策略为u,则本文探究的问题表述为受限约束问题(郭泽光,付婉君,2020):(19)(20)第三章传统离线算法解决多参量随机序列问题3传统离线算法解决多参量随机序列问题3.1多参数的随机多序列问题本场景研究的问题为多无人机在最短时间内遍历全部传感器进行数据采集传输、通信传感、边缘计算三个过程。不考虑无人机在三维空间内存在阻碍飞行轨迹障碍物的情况,这在一定情况下反映了认为无人机在基站与传感器之间、基站与基站之间飞行沿直线方向。在笛卡尔系内建立传感器节点坐标并进行编号,则无人机行进路径可以表示为传感器编号序列,通过这点我们不难发现因此对每个无人机建立过程量时间t、飞行电量e,可以将背景问题解决为,以e为辅助变量、t为优化目标的序列最优问题(陈婉莹,赵君和,2020)。传统遗传、蚁群、粒子群算法解决TSP问题,以距离为优化目标,寻找以访问传感器顺序为元素的最优一维序列。从这些统计中看出但在多无人机协同工作背景下,无人机数目、每个无人机负责的传感器集合、每个集合传感器访问次序都是随机量。在此基础上考虑算法性能对遗传算法、蚁群算法、粒子群算法进行改进(马天羽,朱雅倩,2021)。本文在研究方法上有所突破,创新性地将前人关于此主题的研究成果融入其中,使得研究深度得以显著提升。通过对以往文献的细致梳理与综合,文章发现了该领域尚未被充分挖掘的关键点及潜在的研究趋势。在对已有理论的深入剖析基础上,文章提出了独特的研究视角与理论框架。在具体研究中,文章采用了前沿的研究手段与技术,对该主题进行了全面且深入的探索,从更微观的层面揭示了事物的本质规律与相互关联,同时结合其他相关领域的理论与实践,为该主题下的挑战提供了更为广泛和多元的解决方案。3.2遗传算法解决多参量随机序列问题3.2.1遗传算法简介遗传算法的基本思想为达尔文生物进化论中“物竞天择,适者生存”的理论,算法模拟选择、交叉、变异过程,这明显地揭示了意图其中选择过程保留父代个体,交叉过程由两个父代个体遵循交叉原则得到新个体,变异过程由一个父代个体遵循变异原则产生新个体。遗传算法的算法的算法流程如图所示(马天羽,朱雅琪,2022):图SEQ图\*ARABIC2遗传算法流程图3.2.2算法设计遗传算法解决传统TSP问题中,染色体为城市编号序列(即传感器编号序列),其适应度函数设计为(靳成功,霍雅珍,2021):(21)其中xi表示i号传感器,Distance函数表示两点间距离。该适应度函数,这在一定程度上描绘了不能考虑到实际过程中无人机的通信情况和电量损耗情况。因此在一维序列的情况下,设计适应度函数(华志远,殷嘉琪,2022):(22)其中分母为单无人机完成任务的总时间。在笛卡尔坐标系内设置1个地面基站和20个传感器进行仿真实验,实验参数如下表所示:表SEQ表\*ARABIC1遗传算法解决单无人机路径规划问题参数表变量名称变量值交叉概率pc0.9变异概率pm0.2初始种群数n200最大进化代数T10000基站坐标见附录传感器坐标见附录传感器数据量见附录无人机参数见附录场景通信参数见附录算法迭代效果与生成路径如下(殷文昊,项丽倩,2020):图SEQ图\*ARABIC3遗传算法单无人机路径规划迭代效果图图SEQ图\*ARABIC4遗传算法单无人机路径规划图实验结果表明对于20个传感器的无人机任务所构成的一维序列,遗传算法不稳定收敛,因此解决多变量随机问题,某程度能看出可以采用K-means聚类算法,针对不同不同数目的无人机进行传感器聚类,后分解为多个数目较小的一维序列问题(盛嘉和,孔婉茜,2023)。本研究彰显了跨学科交融的核心理念,汲取多领域智慧,以拓宽研究视野并深化认知层次。通过跨学科方法,本文能够更全面地理解研究对象的复杂性与多样性,发现单一学科难以揭示的新规律。同时,研究注重理论与实践的紧密结合,致力于将理论智慧应用于实际问题解决,验证其实用价值。在数据获取与分析过程中,研究综合多渠道信息,结合量化与质性研究方法,确保研究结论的科学性与准确性,为相关领域的政策制定与实践操作提供坚实的理论支撑与决策依据。3.2.3改进遗传算法实验仿真根据上述理论,对改进后的结合K-means聚类的遗传算法解决一维序列问题进行实验仿真,最终最优解为3无人机协同工作,具体参数如下:表SEQ表\*ARABIC2遗传算法多无人机路径规划参数表变量名称变量值交叉概率pc0.9变异概率pm0.2初始种群数n200最大进化代数T200基站坐标见附录传感器坐标见附录传感器数据量见附录无人机参数见附录场景通信参数见附录仿真实验数据如下(邵志天,樊慧君,2021):表SEQ表\*ARABIC3遗传算法多无人机路径规划实验结果变量名称变量值无人机数目n3总时间T(s)1471.8总耗电量E(W·s)33313.02无人机1时间t1(s)372.13无人机1总耗电量e1(W·s)8994.29无人机2时间t2(s)448.98无人机2总耗电量e2(W·s)9815.13无人机3时间t3(s)650.69无人机3总耗电量e3(W·s)14503.60图SEQ图\*ARABIC5遗传算法多无人机路径规划聚类图图SEQ图\*ARABIC6遗传算法多无人机路径规划图实验结果分析,这在某种程度上暗示了遗传算法解决多无人机协同工作问题可以较为合理的进行任务分配,使每个无人机可以保证电量充足条件下完成任务,从而在总时间上进行目标优化。实验结果基本符合预期(濮志天,樊慧洁,2018)。3.3蚁群算法解决多参量随机序列问题3.3.1蚁群算法简介蚁群算法采用仿生学原理,这在一定程度上预示通过对蚂蚁觅食寻求最优路径的过程进行核心步骤模拟,逐步确立最优解。其基本原理为每轮循环派出大量蚂蚁进行路线探索,蚂蚁在行进过程中根据已有信息素行进,这在一定程度上暗示了同时会为走过的路径修改禁忌表,并为行进路线留下信息素为其他蚂蚁的行进提供帮助,因此算法本身收敛速度快,但易陷于局部最优解。其算法流程图如下(濮泽和,孔静雅,2022):图SEQ图\*ARABIC7蚁群算法流程图3.3.2算法设计传统蚁群算法解决TSP问题中,信息素更新可以表示为:(23)其中t表示当时时刻,n表示成熟数目,ρ为0-1之间的常数,(1-ρ)表示信息素的挥发速率,表示一次迭代后,所有蚂蚁在i到j路径留下的信息素浓度总量。其可以表示为(暴志天,华梦洁,2023):(24)其中表示第k只蚂蚁在路径i到j上面留下的信息素。如果第k只蚂蚁经过路径i到j,则有:(25)这在一定情况下反映了其中Q为常数,Lk表示已经走过的总长度。该算法处理对象为城市坐标,以距离作为信息素更新标准,为更好的解决三维变量序列问题,以随机序列为对象,以序列时间为信息素更新标准修改为(霍文昊,孔慧兰,2022):(26)其中m表示随机序列的分组个数(即无人机数量),分母表示无人机任务总时间。根据M.Dorigo等人研究,对蚁群算法引入启发项,得到蚂蚁选择路径i到j的概率为:(27)其中α和β为调节因子,allowed表示为走过的路径,k表示当前蚂蚁。3.3.3改进蚁群算法实验仿真通过这点我们不难发现由于蚁群算法具有很好收敛性,因此这里不需要对传感器进行聚类,直接进行三维度随机变量序列的实验仿真,具体参数如下:表SEQ表\*ARABIC4蚁群算法多无人机路径规划参数表变量名称变量值蚂蚁数目n200调节因子α1调节因子β2最大迭代次数T500常数Q1常数ρ0.9基站坐标见附录传感器坐标见附录传感器数据量见附录无人机参数见附录场景通信参数见附录实验仿真实验数据如下:表SEQ表\*ARABIC5蚁群算法多无人机路径规划实验结果参数名称参数值无人机数目n2总时间T(s)1469.00总耗电量E(W·s)33140.71无人机1时间t1(s)538.12无人机1总耗电量e1(W·s)11381.80无人机2时间t2(s)930.87无人机2总耗电量e2(W·s)19758.91图SEQ图\*ARABIC8蚁群算法多无人机路径规划图图SEQ图\*ARABIC9蚁群算法多无人机路径规划迭代效果从上述实验结果发现,蚁群算法具有很好的收敛性,在迭代次数约60次左右就可以获得最优解或局部最优解。从实验结果看,蚁群算法解决多无人机协同工作问题可以使无人机尽可能安排无人机不经历充电过程,从而在总时间上进行优化目标的节省。实验结果符合预期。3.4粒子群算法解决多参量随机序列问题3.4.1粒子群算法介绍粒子群算法通过模拟鸟类迁移过程寻找最优解,其过程个体表现为无质量粒子,且只具有速度、位置两个属性,从这些统计中看出每个粒子在所在空间域内独立寻求个体极值,并将个体极值与整个种群分享,所得到的群体极值为最优解。为增强研究结果的可信度和可靠性,本文首要工作是广泛搜集并分析国内外相关领域的文献资料,系统梳理了当前研究的最新进展和理论基础。基于此,结合研究主旨,本文精心设计了一套科学合理的研究方案,包括数据搜集途径、样本选择标准以及分析框架。为保证数据的准确无误和全面覆盖,本文采用了多种数据来源进行交叉验证,真实反映了研究对象的情况。在数据分析过程中,本文运用了前沿的统计工具和方法对数据进行严谨处理,确保研究结论的科学性和客观性。同时,本文还对研究过程中可能出现的误差进行了敏感性分析,进一步提升了研究结果的稳健性。在粒子群算法中,单个粒子速度受到其他粒子的影响,其位置受当前速度影响,具体可以表示为如下公式(邓明煜、郑泽涛、梁佳俊,2021):(28)(29)这明显地揭示了意图其中vi表示粒子i的速度,xi表示粒子i当前位置,rand()为(0,1)内的随机实数,c1、c2为学习因子,pbest为个体极值,gbest为群体极值。其算法流程图如下(周逸和,付奇琪,张博文,2021):图SEQ图\*ARABIC10粒子群算法原理图3.4.2算法设计粒子群算法解决传统TSP问题中,这在一定程度上描绘了其粒子位置为城市一维编号序列(即传感器编号序列),其适应度函数设计为:(21)其中xi表示i号传感器,Distance函数表示两点间距离。该适应度函数,这在某种程度上暗示了不能考虑到实际过程中无人机的通信情况和电量损耗情况。因此在一维序列的情况下,设计适应度函数(成昊羽,赵欣怡,2020):(22)其中分母为单无人机完成任务的总时间。这在一定程度上预示在笛卡尔坐标系内设置1个地面基站和20个传感器进行仿真实验,实验参数如下表所示(邓芝和,张弘扬,2020):表SEQ表\*ARABIC6粒子算法解决单无人机路径规划问题参数表参数名称参数值粒子个数100个体最优保留概率u10.6全局最优保留概率u20.8最大进化代数T10000基站坐标见附录传感器坐标见附录传感器数据量见附录无人机参数见附录场景通信参数见附录实验结果如图:图SEQ图\*ARABIC11粒子群算法单无人机路径规划迭代效果图SEQ图\*ARABIC12粒子群算法单无人机路径规划图实验结果表明对于20个传感器的无人机任务构成的一维序列,粒子算法收敛过慢,这在一定程度上暗示了因此解决多变量随机问题,可以跟改进的遗传算法类比,同样采用K-means聚类算法,针对不同不同数目的无人机进行传感器聚类,后分解为多个数目较小的一维序列问题(魏博文,付俊天,2019)。3.2.3改进粒子算法实验仿真根据算法分析,对改进后的粒子群算法结合K-means聚类算法解决一维序列问题进行实验仿真,最终最优解为3无人机协同工作,具体参数如下:表SEQ表\*ARABIC7粒子群算法多无人机路径规划参数表参数名称参数值粒子个数100个体最优保留概率u10.6全局最优保留概率u20.8最大进化代数T200基站坐标见附录传感器坐标见附录传感器数据量见附录无人机参数见附录场景通信参数见附录仿真实验数据如下:表SEQ表\*ARABIC8粒子群算法多无人机路径规划实验结果参数名称参数值无人机数目n3总时间T(s)1486.39总耗电量E(W·s)34340.25无人机1时间t1(s)587.47无人机1总耗电量e1(W·s)12418.08无人机2时间t2(s)477.95无人机2总耗电量e2(W·s)11269.39无人机3时间t3(s)419.97无人机3总耗电量e3(W·s)10652.78图SEQ图\*ARABIC13粒子群算法多无人机路径规划聚类图图SEQ图\*ARABIC14粒子群算法多无人机路径规划图从实验结果分析,改进后的粒子群算法解决多无人机协同工作问题所得路径优化目标良好,实验结果与实际场景预期基本吻合,因此认为其算法性能良好。3.5模拟退火算法解决多随机序列问题3.5.1模拟退火算法简介模拟退火算法是一种对热力学定律进行改进的算法。通常情况下,模拟退火算法常与爬山算法进行比较。通过这点我们不难发现爬山算法在解决凸函数优化问题中遵循贪婪原则,使算法向优化目标移动,但容易陷入局部最优解,模拟退火算法则结合概率条件,使最优解选择概率随时间降低,因此相比于爬山算法较难陷入局部最优解。其算法流程如图(赵昕怡,徐静雅,2019):图SEQ图\*ARABIC15模拟退火算法流程图3.5.2算法设计模拟退火算法可以很好的解决TSP问题,但传统模拟退火算法只能优化目标为最短距离,从这些统计中看出因此需要对目标函数进行重塑,引入任务时间作为目标函数。在笛卡尔坐标系内设置1个地面基站和20个传感器进行仿真实验,实验参数如下表所示:表SEQ表\*ARABIC9模拟退火算法解决单无人机路径规划问题参数表参数名称参数值初始温度20000最终温度0.0001最大迭代次数10000基站坐标见附录传感器坐标见附录传感器数据量见附录无人机参数见附录场景通信参数见附录实验结果如下:图SEQ图\*ARABIC16模拟退火算法单无人机路径规划迭代效果图SEQ图\*ARABIC17模拟退火算法单无人机路径规划图从实验结果分析,模拟退火算法具有很好地收敛性能,但由于模拟退火算法需要不断对序列进行扰动,这明显地揭示了意图因此难以完成多随机变量序列问题。因此我们依然采用聚类方法,对传感器信息进行聚类,生成多个一维度地序列,实现多随机变量分配无人机任务,从而缩短任务时间(邓泽洋,吴彤彤,2021)。此成果与本文原先预设的研究结果相一致,这在一定程度上证明了本文研究策划的科学性和理论体系的合理性。通过深度解析研究对象并进行多层面验证,本文不仅验证了初步设想的可靠性,还丰富了该领域的理论深度。这一研究结论为相关领域的实践提供了有益的指导。通过对关键议题的深入探究,本文揭示了现象背后的深层次机理,这些洞见有助于优化资源分配、提升决策效能,并推动行业的可持续进步。此外,这一研究结果的取得也进一步凸显了理论结合实践的重要性。本文在理论上有所创新,同时也注重研究成果的实际应用价值。3.5.3改进模拟退火算法仿真实验根据算法分析,对改进后的粒子群算法结合K-means聚类算法提升序列维度进行实验仿真,最终最优解为3无人机协同工作,具体参数如下:表SEQ表\*ARABIC10模拟退火算法解决多无人机路径规划问题参数表参数名称参数值初始温度20000最终温度0.0001最大迭代次数10000基站坐标见附录传感器坐标见附录传感器数据量见附录无人机参数见附录场景通信参数见附录实验结果如下:表SEQ表\*ARABIC11模拟退火算法多无人机路径规划实验结果参数名称参数值无人机数目n3总时间T(s)1700.68总耗电量E(W·s)34370.25无人机1时间t1(s)480.62无人机1总耗电量e1(W·s)9588.08无人机2时间t2(s)519.19无人机2总耗电量e2(W·s)10259.39无人机3时间t3(s)700.87无人机3总耗电量e3(W·s)14522.78图SEQ图\*ARABIC18模拟退火算法多无人机路径规划聚类图图SEQ图\*ARABIC19模拟退火算法多无人机路径规划图根据实验结果分析,结合K-means聚类的模拟算法解决多无人机协同工作问题可以完成无人机尽可能不进行充电而增派无人机的目标,这在一定程度上描绘了但实验结果存在较大误差,因此任务其容易陷入局部最优解。3.6算法性能分析通过对四类传统经典算法进行改进,使其能够很好的适应本文所提出的多无人机协同工作的辅助边缘计算系统。但其算法性能参差不齐,从数据上看,改进的蚁群算法与模拟退火算法解决单无人机问题都具有很好的收敛特性,但改进的模拟退火算法多无人机协同工作模式呈现出较差结果。通过这些数据可见而在解决多无人机问题时,改进后的粒子群算法、模拟退火算法、遗传算法都需要借助K-means聚类分析进行路径规划,其结果受聚类结果影响较大,某程度能看出通常得到解为该问题下的局部最优解。改进后的蚁群算法,在解决多维序列问题仍具有较好的收敛特性,缺失最优对比,无法确定其是否陷入局部最优解。上述四类算法都面临同一个问题为目标优化过程需要传感器位置、传感器当前待解决数据量、基站位置确定。因此算法时效性差,面对复杂问题求解时间长,因此在解决现实问题时具有时效误差。其中改进后蚁群算法解决问题的时间最优,平均计算时间为29.53s。

第四章基于GAT网络的强化学习算法解决序列问题4基于GAT网络的强化学习算法解决序列问题4.1强化学习介绍强化学习又称增强学习、评价学习等,为机器学习的重要算法之一。目前广泛应用于智能体解路径规划、机器博弈等多个领域其原理为智能体在环境、激励等的影响下,不断改变自身状态,这在某种程度上暗示了达到目标并寻求最优解的过程。算法首先确定智能体以及智能体所在环境,通过设计奖励函数使智能体在环境中不断试错,并确立其策略的正确性,以趋近最优解。其Agent、Environment、Reward、State、Action的关系如图20所示(黄泽昂,何君萱,2019):图SEQ图\*ARABIC20强化学习算法流程图中智能体Agent通过不断执行动作Action与环境进行交互。按照一定的概率或者规则,进行状态更新,这在一定程度上诠释了同时得到激励作为反馈。图中t表示智能体在环境中尝试的时间。4.2图注意力网络GAT介绍 图注意力网络GAT为2018年的提出的图网络模型,为了解决图卷积网络GCN的假设图只能为无向图(吕佳茜,邱茹怡,2020);其不能处理动态图;其不能为图中邻居分配不同权值的缺陷而产生。其注意力机制可以很好解决特征提取问题。4.2.1注意力机制图注意力机制依然具有仿生学意义,当人类个体在观察某个事物的时候,在短时间内难以观测所有信息,这在一定程度上暗示了因此其会选择一部分信息进行记录和分析。图注意力机制类似于此。其核心在于对于既定信息进行权重分配,分配到高权重的信息部分,需要被系统进行深度加工。其数学表达形式如图21所示:图SEQ图\*ARABIC21注意力机制的数学表达形式其中Query表示先验信息和既定条件,AttentionValue表示是Query信息通过注意力机制从需处理的信息源Source中得到的信息。这在一定情况下反映了每一对Key-Value表示信息源Source中含有的不同类别信息。因此有如下公式(陈佳慧,吴昊羽,2022):(23)其中similarity(x,y)函数表示x与y之间的相关程度。4.2.2图注意力网络GAT结构分析通过这点我们不难发现对于单头图注意层而言,假设进入GAT网络的图Graph具有n个节点,第i个节点的特征向量为Hi,节点维度f,则节点特征向量可以用H表示:(24)GAT网络的图注意层对特征向量H通过W矩阵进行线性变换可以得到新的特征向量H`,其维度变为f`,则有:(25)得到新的特征向量后,从这些统计中看出图注意力网络GAT的具体Attention机制为,如果节点i、j为相邻节点,则需要将其特征向量拼接后与拼接矩阵同维度向量α进行内积运算,具体操作如下(陈倩倩,马德华,2020):(26)其中||表示拼接操作。其网络单头图注意层如图所示:图SEQ图\*ARABIC22GAT单头图注意层attention机制示意图经过Attention机制后节点i的特征向量如下:(27)GAT网络也可以采用多头图注意层,如果存在k组注意力机制,且当前不处于最后一层,需要把k个Attention生成向量进行拼接,其结构如下:(27)这明显地揭示了意图如果当前处于最后一层,则k个Attention不进行输出的拼接,而直接对其求平均,结构如下(成雪彤,付东明,2020):(28)4.3算法设计传统强化学习算法解决无人机路径规划问题,多通过DQN网络进行,使无人机在飞行域内做非离线计算运动。其具有很好的动态特性,可以根据变化的传感器数据来看进行路径规划。某程度能看出但其算法的准确率不高,且容易在飞行过程中出现负电量情况。因此本文将提出利于GAT网络进行强化学习的离线算法,解决序列问题。通过制造大量不同顺序的序列和值域内变化的数据量样本,训练过程扩大数据规模弥补离线算法的不灵活性(苏志时,陈梦菲,2022)。这在某种程度上暗示了做到固定基站与传感器位置,传感器数据量随机的大样本数据集。面对可以临时给出的传感器数据量进行最优路径规划。保留算法动态性的同时,提高算法准确性。算法得到路径规划方式针对不同的传感器数据量集合都具有较好结果(高鸿铭,付嘉铭,2019)。具体的本算法采用GAT网络与Reinforce方法结合的方法预测无人机的路径,其中GAT作为主要算法对输入的节点信息进行处理并输出预测的路径,Reinforce方法作为强化学习中的actor-critic方法的一种,这在一定情况下反映了是用来替代一般深度学习的反向传播机制。算法构建了一个无人机路径的环境,无人机与环境的交互在这个环境里体现,智能体就是无人机,奖励函数用-loss替代(林俊义,付盈倩,2020)。算法GAT网络注意力层采用多头注意力机制,k=8,网络结构如图所示:图SEQ图\*ARABIC23GAT多头图注意层attention机制示意图4.4实验仿真分析通过构建大样本数据集对20个传感器和给定数据量进行仿真实验,通过这点我们不难发现实验参数如下:表SEQ表\*ARABIC12强化学习解决多无人机问题参数表参数名称参数值每批次样本数batch_size16每epoch样本数epoch_size12800每次评估样本数val_size1280输入嵌入数据维度embedding_dim128隐藏层个数hiddendim128epoch个数100encoder/critic网络的网络层数3剪枝参数tanh_clipping10actor-network的学习率lr_model0.00001critic-network的学习率lr_critic0.00001基站坐标见附录传感器坐标见附录传感器数据量见附录无人机参数见附录场景通信参数见附录实验结果如下:表SEQ表\*ARABIC13GAT强化学习多无人机路径规划实验结果参数名称参数值无人机数目n3总时间T(s)1444.49总耗电量E(W·s)30896.48无人机1时间t1(s)442.52无人机1总耗电量e1(W·s)9286.25无人机2时间t2(s)526.62无人机2总耗电量e2(W·s)11409.39无人机3时间t3(s)475.35无人机3总耗电量e3(W·s)10200.84图SEQ图\*ARABIC24GAT强化学习多无人机协同路径规划图图SEQ图\*ARABIC25GA强化学习多无人机协同路径规划迭代效果从实验结果来看,GAT网络结合强化学习算法处理多无人机辅助边缘计算系统具有良好效果。图25中训练过程因其多随机传感器数据量样本进行训练,其损失函数具有一定的波动性,但随迭代次数增加而不断稳定,测试集表现的loss属性具有良好的特性(付卓忠,吕佳俊,2022)。第五章算法性能对比5算法性能对比5.1单无人机工作性能比较由于GAT强化学习可以灵活应对变化的传感器存储数据量,因此对改进后的蚁群、粒子群、遗传、模拟退火算法分别做相同20个传感器优化和测试过程传感器数据量相同和相同20个传感器优化和测试过程传感器存储数据量不同的模拟实验。对GAT强化学习算法做跟随实验,从这些统计中看出其中对模拟退火算法进行10000次扩增迭代,对GAT强化学习算法做10000次提前终止(熊泽光,唐小曼,2023)。如图26显示,在优化过程与测试过程传感器存储数据量相同的情况下,蚁群算法可以做到快速收敛,并得到较优结果;遗传算法呈现强烈波动性,甚至难以收敛;粒子群算法收敛速度缓慢(徐铭熙,陈佩珊,2023);这明显地揭示了意图模拟退火算法较快收敛并得到最优解,GAT强化网络需要进行大量训练,因此其10000次迭代效果不优,但收敛趋势明显。蚁群算法收敛速度极快,但容易陷入局部最优解,模拟退火算法在解决单无人机问题上存在巨大优势,可以快速收敛并得到最优解。图SEQ图\*ARABIC26优化与测试传感器数据量相同性能比较图当优化与测试过程传感器数据量不同时,强化学习依然可以保持较高性能,改进的遗传算法会显示强烈波动性并不收敛,改进的粒子群算法结果与最优解有较大偏离,改进后的蚁群算法与模拟退火算法则会陷入局部最优解(陈奇颖,陈若熙,2022)。图SEQ图\*ARABIC27优化与测试传感器数据量不同性能比较图因此在解决单无人机问题时,对于条件已经情况,改进模拟退火算法具有良好特性,其可以较快得到最优解(邵怡忠,张阳阳,2018)。这在一定程度上描绘了但在解决数据量发生变化的问题时改进后的蚁群算法、遗传算法、模拟退火算法、粒子群算法测试结果较差,不具有灵活性和得到最优解的能力,基于GAT网络的强化学习算法,性能不受影响,其表现收敛趋势。5.2多无人机协同工作性能比较在解决多无人机协同工作问题时,因受K-means聚类结果的影响,改进后的模拟退火算法、遗传算法和粒子群算法无法进行大量数据模拟,且其本身受聚类因素影响大,当聚类结果任务分配不合理时,这在某种程度上暗示了优化目标会产生数据量激增。改进后的蚁群算法和GAT强化学习算法在解决问题的时间性上最终结果都趋于稳定性,如图9与图25对比,蚁群算法在优化加测试求解问题的总体时间复杂度性能上优于GAT强化学习算法,这在一定程度上预示但其算法会容易陷入局部最优解(陈志时,成淑怡,2022)。GAT强化学习算法因对大量随机样本进行训练,其可以处理不断变化的传感器数据量,而蚁群算法则不具备此灵活性。其GAT强化学习算法训练后在不改变传感器位置和基站位置的情况下,测试过程的时间复杂度远小于蚁群算法。因此可认为基于GAT网络的强化学习算法在解决本文背景问题具有最优性能。第六章结束语6结束语无人机因其独有的特点,目前很好的应用于农业传感数据采集的场景,因此对其进行路径规划十分有意义。当前对无人机进行路径规划的算法,没有很好的对无人机电量模型、通信模型和飞行时间模型进行建模,也不能满足多无人机协同工作的需求,多采用以飞行直线距离为优化目标的以蚁群算法、遗传算法、粒子群算法、模拟退火算法为核心的离线问题处理。也存在考虑到无人机通信、电量背景,但场景设计过于简单,这在一定情况下反映了且准确率不高的强化学习结合DQN网络的非离线算法。本文针对上述背景,进行了多无人机协同辅助边缘计算系统的路径规划研究。本文针对无人机通信过程,提出了基于自由空间路径损耗考虑视距通信(LOS)、非视距通信(NLOS)与感知发送协议的传感模型、通信模型、数据传输模型,建立了符合气体动力学描述的无人机电量模型和完成了基于实际场景分析调研的无人机工作过程模型。真实还原了无人机工作场景和环境因素。本文将凸函数优化问题,表达为多维度随机序列的最优分组排序问题,通过对蚁群算法、遗传算法、粒子群算法与模拟退火算法进行改进,对其优化目标、输入参数形式以及是否可以结合K-means聚类算法进行分析,得到了可以有优质性能满足上述背景的需求。,从这些统计中看出同时本文提出一种新型的GAT网络结合强化学习的离线算法,其满足上述背景的需求同时具有灵活性、准确性。并对5类算法进行了性能分析与比较。经过对四类传统算法的改进和提出基于GAT网络的强化学习算法,本文完成了对考虑通信情况、无人机电量及多无人机系统工作的辅助边缘计算系统今天了路径规划。因算法本身的局限性,改进后的遗传算法、粒子群算法、模拟退火算法无法直接解决多无人机协同工作问题,需要结合K-means算法对传感器进行聚类分析。5类算法在解决单无人机问题时模拟退火算法呈现最优性能,在解决多无人机路径规划问题时GAT强化学习算法具有最优性能。GAT强化学习算法通过大量样本训练,可以面对给定域内随机的传感器存储的数据量集合都可以在极短时间给出效率较高的路径规划方式,具有较好的灵活性,因此其可以更好的融入现实背景解决实际问题。参考文献参考文献[1]X.ChenandJ.Zhang,"TheThree-DimensionPathPlanningofUAVBasedonImprovedArtificialPotentialFieldinDynamicEnvironment,"20135thInternationalConferenceonIntelligentHuman-Machine熊泽光,唐小曼temsandCybernetics,Hangzhou,2013,pp.144-147,doi:10.1109/IHMSC.2013.181.[2]H.Li,T.Long,G.XuandY.Wang,"Coupling-Degree-BasedHeuristicPrioritizedPlanningMethodforUAVSwarmPathGeneration,"2019ChineseAutomationCongress(CAC),Hangzhou,China,2019,pp.3636-3641,doi:10.1109/CAC48633.2019.8997273.[3]Z.HeandL.Zhao,"TheComparisonofFourUAVPathPlanningAlgorithmsBasedonGeometrySearchAlgorithm,"20179thInternationalConferenceonIntelligentHuman-Machine熊泽光,唐小曼temsandCybernetics(IHMSC),Hangzhou,China,2017,pp.33-36,doi:10.1109/IHMSC.2017.123.s[4]W.Xinggang,G.CongandL.Yibo,"VariableprobabilitybasedbidirectionalRRTalgorithmforUAVpathplanning,"The26thChineseControlandDecisionConference(2014CCDC),Changsha,China,2014,pp.2217-2222,doi:10.1109/CCDC.2014.6852537.edonGeometrySearchAlgorithm,"

20179thInternationalConferenceonIntelligentHuman-Machine熊泽光,唐小曼temsandCybernetics(IHMSC),Hangzhou,China,2017,pp.33-36,doi:10.1[5]陈奇源,张慧芳.Goodwin,"DeepQ-LearningWithQ-MatrixTransferLearningforNovelFireEvacuationEnvironment,"inI(成昊羽,赵欣怡,2020)Transactionson熊泽光,唐小曼tems,Man,andCybernetics:熊泽光,唐小曼tems,doi:10.1109/TSMC.2020.2967936.109/IHMSC.2017.123.[6]成欣怡,付羽翔,"Stabilityanalysisandimpulsivecontrolofbifurcationindelayednetworks,"Proceedingsofthe29thChineseControlConference,Beijing,China,2010,pp.559-563.[7]邓明煜、郑泽涛、梁佳俊,"JointOptimizationofMulti-UAVTargetAssignmentandPathPlanningBasedonMulti-AgentReinforcementLearning,"inI(成昊羽,赵欣怡,2020)Access,vol.7,pp.146264-146272,2019,doi:10.1109/ACCESS.2019.2943253.[8]周逸和,付奇琪,张博文"Effectivelazytrainingmethodfordeepq-networkinobstacleavoidanceandpathplanning,"2017I(成昊羽,赵欣怡,2020)InternationalConferenceon熊泽光,唐小曼tems,Man,andCybernetics(SMC),Banff,AB,Canada,2017,pp.1799-1804,doi:10.1109/SMC.2017.8122877.[9]成昊羽,赵欣怡"Energy-EfficientUAVCommunicationWithTrajectoryOptimization,"in

I(成昊羽,赵欣怡,2020)TransactionsonWirelessCommunications,vol.16,no.6,pp.3747-3760,June2017,doi:10.1109/TWC.2017.2688328.[10]邓芝和,张弘扬.基于能耗均衡的无人机集群组网算法[J].通信技术,2021,54(01):109-114.[11]魏博文,付俊天.遗传算法路径规划在无人机电力巡线中的应用[J].自动化技术与应用,2021,40(02):29-33.[12]赵昕怡,徐静雅,"DecisionMakingSupportofUAVPathPlanningforEfficientSensinginRadiationDoseMapping,"2018I(成昊羽,赵欣怡,2020)42ndAnnualComputerSoftwareandApplicationsConference(COMPSAC),Tokyo,2018,pp.333-338,doi:10.1109/COMPSAC.2018.00053.[13]邓泽洋,吴彤彤"OncollaborativepathplanningformultipleUAVsbasedonPythagoreanHodographcurve,"2016I(成昊羽,赵欣怡,2020)ChineseGuidance,NavigationandControlConference(CGNCC),Nanjing,2016,pp.971-975,doi:10.1109/CGNCC.2016.7828917.[14]黄泽昂,何君萱"AnImprovedUAVPathPlanningmethodBasedonRRT-APFHybridstrategy,"20205thInternationalConferenceonAutomation,ControlandRoboticsEngineering(CACRE),Dalian,China,2020,pp.81-86,doi:10.1109/CACRE50138.2020.9229999.[15]C.Zhang,H.LiuandY.Tang,"QuantitativeEvaluationofVoronoiGraphSearchAlgorithminUAVPathPlanning,"2018I(成昊羽,赵欣怡,2020)9thInternationalConferenceonSoftwareEngineeringandServiceScience(ICSESS),Beijing,China,2018,pp.563-567,doi:10.1109/ICSESS.2018.8663950.[16]L.WangandY.Li,"AMulti-ObjectiveOptimizationMethodbasedonDimensionalityReductionMappingforPathPlanningofaHALEUAV,"2019ChineseAutomationCongress(CAC),Hangzhou,China,2019,pp.3189-3194,doi:10.1109/CAC48633.2019.8997289.[17]H.Li,T.Long,G.XuandY.Wang,"Coupling-Degree-BasedHeuristicPrioritizedPlanningMethodforUAVSwarmPathGeneration,"2019ChineseAutomationCongress(CAC),Hangzhou,China,2019,pp.3636-3641,doi:10.1109/CAC48633.2019.8997273.[18]B.-b.Meng,"UAVPathPlanningBasedonBidirectionalSparseA*SearchAlgorithm,"2010InternationalConferenceonIntelligentComputationTechnologyandAutomation,Changsha,2010,pp.1106-1109,doi:10.1109/ICICTA.2010.235.[19]Y.Huang,X.Mo,J.Xu,L.QiuandY.Zeng,"OnlineManeuverDesignforUAV-EnabledNOMA熊泽光,唐小曼temsviaReinforcementLearning,"2020I(成昊羽,赵欣怡,2020)WirelessCommunicationsandNetworkingConference(WCNC),Seoul,Korea(South),20

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论