本发明属于移动边缘计算领域,具体涉及一种空地协作移动边缘计算系统中的uav能耗优化方法。
背景技术:
1、近年来,无线通信技术的发展,如5g和即将推出的6g,促使了高度智能应用的前所未有的进步和普及,例如智能导航、人脸识别以及增强、虚拟现实等。这些应用大多表现出计算密集和延迟敏感的特性,然而用户设备通常在计算能力和电池容量方面受到限制,并且云服务器会带来较大的延迟,这种困境极大地阻碍了用户体验的质量。
2、移动边缘计算(mobile edge computing,mec)很好的解决了上述的问题。mec超越了本地和云计算,将移动计算、网络控制和存储从云和数据中心推向移动网络的边缘,即蜂窝基站(base station,bs)或接入点(access point,ap),从而能够有效满足具有低延迟需求的用户设备的通信和计算需求。然而,用户设备可能位于偏远或山区,通信基础设施分布稀疏且位置固定。远离mec服务器的用户设备通常由于信号覆盖差以及由于多路径和阻塞导致的信道质量恶化而遭受通信速率受限的困扰。此外,在大规模紧急情况下,例如自然灾害、停电和恐怖袭击等,通信基础设施难以访问,而用户设备请求突然增加,使得地面mec服务器难以满足所有通信和计算需求。鉴于mec系统依赖地面基础设施的这些局限性,创建一个能够为偏远地区或紧急情况下的用户设备提供mec服务的平台至关重要。
3、随着制造无人机(unmanned aerial vehicle,uav)的成本持续降低,通信设备的小型化不断推进,将mec服务器安装在uav上并建立无线通信,以执行地面用户设备的计算密集型任务变得可行。与基于地面基础设施的mec相比,基于uav的mec系统具有更好的成本效益,允许更迅速的部署和更灵活的重新配置,使其成为特定场景(如紧急响应和救援)的理想选择。无人机可以飞越用户设备,更有可能与用户设备建立视距(line ofsight,los)连接。此外,uav具有较高的移动性和可控性,可以动态调整其三维位置,从而显著降低传输延迟和能耗。除了作为空中mec服务器,uav还可以作为中继器,改善远程用户设备的通信能力,并帮助它们与地面mec服务器建立连接。因此,更灵活的体系结构使无人机能够根据环境动态地在mec服务器和中继器的角色之间进行切换,以满足用户设备的体验质量。
4、事实上,这种空地协作架构也可以解决uav的能量供应问题。最近,能量捕获(energy harvesting,eh)和无线功率传输(wireless power transfer,wpt)技术已被纳入uav支持的mec系统,但在实践中,由于在不太理想的地理位置和环境条件下发生的路径损耗,射频(radio frequency,rf)能量捕获的有效性可能会严重下降。一种更节能的激光束wpt技术被用于uav支持的空地协作架构,激光发射器与地面mec服务器共存,向uav传输无线电力,并提供长期的能量供应。
5、目前结合uav的空地协作mec系统是一个非常前沿的方向,uav既充当用户设备的移动计算服务器,又充当ap的中继,同时又可从ap通过激光进行能量捕获,但是目前针对这一方面的研究工作还比较少,且大多考虑为用户设备进行供能,忽略了uav的能量限制,此外求解问题的方法也仅采用传统优化算法或深度强化学习算法,对于uav这种实时动态系统来说,传统的优化算法需要进行大量的迭代计算,从而导致极高的复杂度;而对于深度强化学习算法,状态、动作的空间维度过大,会导致算法最终难以收敛。
技术实现思路
1、本发明的目的在于针对解决背景技术中提出的问题,提出一种空地协作移动边缘计算系统中的uav能耗优化方法。
2、为实现上述目的,本发明所采取的技术方案为:
3、一种空地协作移动边缘计算系统中的uav能耗优化方法,包括:
4、建立空地协作的mec系统,mec系统中包括预设数量且不具计算能力的用户设备、携带mec服务器的uav和ap,用户设备将全部任务卸载给uav或进一步通过uav将部分任务卸载给ap进行计算,且ap通过激光发射器为uav供能;
5、计算uav从ap进行能量捕获的能耗、飞行能耗、接收和计算用户设备任务的能耗,以及将部分任务进一步卸载给ap的能耗,且将各能耗的和作为uav总的能量消耗;
6、构建uav在预设时间段的平均能量消耗的最小化目标函数,并附加约束条件;
7、将最小化目标函数转化为对用户设备任务卸载比例和uav能量捕获时间比例的第一优化,以及对uav的飞行轨迹的第二优化;
8、分别求解第一优化和第二优化的解,最终获得目标函数的最优解,将最优解应用在系统中实现uav能耗优化。
9、优选地,建立空地协作的mec系统,mec系统中包括预设数量且不具计算能力的用户设备、携带mec服务器的uav和ap,用户设备将全部任务卸载给uav或进一步通过uav将部分任务卸载给ap进行计算,且ap通过激光发射器为uav供能,包括:
10、各用户设备表示为n∈{1,...,n},n为用户设备的数量,将mec系统的总时间划分为t个时隙,且时隙表示为t∈{1,...,t},一个时隙的长度为τ,在每个时隙t开始时,ap通过激光发射器为uav供能,供能时间为q(t)τ,q(t)是uav能量捕获时间比例,用户设备n产生的任务量为dn(t),为用户设备n引入一个任务卸载比例参数βn(t),且βn(t)dn(t)大小的任务量在uav上计算,(1-βn(t))dn(t)大小的任务量通过uav卸载到ap进行计算。
11、优选地,计算uav从ap进行能量捕获的能耗、飞行能耗、接收和计算用户设备任务的能耗,以及将任务进一步卸载给ap的能耗,且将各能耗的和作为uav总的能量消耗,包括:
12、在时隙t时,uav从ap进行能量捕获的能耗的公式如下:
13、
14、其中,表示uav的接收功率;
15、在时隙t时,uav的飞行能耗的公式如下:
16、
17、其中,
18、
19、其中,p(v(t))表示uav的推进功率,v(t)表示uav飞行的速度,c1,c2,c3,c4和c5表示与uav硬件及其空气动力学参数相关的常数;
20、在时隙t时,uav接收用户设备任务能耗的公式如下:
21、
22、其中,
23、
24、
25、
26、
27、其中,rn(t)表示用户设备n的任务卸载速率,n'(t)表示卸载任务至uav的用户设备数量,hn(t)表示用户设备n和uav之间的信道增益,pn表示用户设备n的发射功率,σ2表示噪声功率,pn,los(t)表示用户设备n和uav之间的los概率,g0表示参考距离1米处的路径损耗,dn(t)表示用户设备n和uav之间的距离,ε表示nlos的附加的衰减因子,a和b是依赖于传播环境的参数,φn(t)表示用户设备n和uav之间的仰角,z表示uav的飞行高度,x(t)和y(t)是uav的横纵坐标,xn和yn是用户设备n的横纵坐标,b表示uav的通讯带宽;
28、在时隙t时,uav计算用户设备任务的能耗的公式如下:
29、
30、其中,κ表示uav的处理器芯片的有效电容系数,表示uav用于计算用户设备n任务的计算资源,cn表示uav计算用户设备n一比特任务所需的cpu周期数;
31、在时隙t时,uav将部分任务进一步卸载给ap的能耗的公式如下:
32、
33、其中,
34、
35、
36、其中,pu表示uav的发射功率,ru(t)表示uav的任务卸载速率,bu表示ap的通讯带宽,hu(t)表示uav和ap之间的信道增益,du(t)表示uav和ap之间的距离;
37、则在时隙t时,uav总的能量消耗eu(t)表示为:
38、
39、其中,αn(t)表示卸载决策,且αn(t)=1表示用户设备n将任务卸载至uav,αn(t)=0表示用户设备n没有将任务卸载至uav。
40、优选地,构建uav在预设时间段的平均能量消耗的最小化目标函数,并附加约束条件,包括:
41、最小化目标函数的公式如下:
42、p1:
43、s.t.c1:0≤θu(t)≤2π
44、c2:0≤d(t)≤dmax
45、c3:0≤x(t)≤xmax,0≤y(t)≤ymax
46、c4:
47、c5:0≤q(t)≤1
48、c6:
49、c7:
50、其中,
51、
52、
53、
54、其中,c1和c2是uav的飞行角度θu(t)和飞行距离d(t)的限制,c3是uav的飞行范围的限制,xmax和ymax分别是uav飞行范围最大的横坐标和纵坐标,c4是用户设备的任务卸载比例参数的限制,c5是uav能量捕获时间比例的限制,c6是用户设备完成任务的时延tn(t)限制,c7是uav能量捕获的限制,dmax表示uav飞行的最大距离,tmax表示用户设备完成任务最大时延,表示当前时隙uav的能量捕获,β表示所有用户设备在所有时隙下的任务卸载比例参数,q表示uav在所有时隙下的能量捕获时间比例参数,u表示uav在所有时隙下的飞行轨迹,其中ω(t)表示uav的三维坐标,且ω(t)=(x(t),y(t),z)。
55、优选地,将最小化目标函数转化为对用户设备任务卸载比例和uav能量捕获时间比例的第一优化,以及对uav的飞行轨迹的第二优化,包括:
56、对用户设备任务卸载比例和uav能量捕获时间比例的第一优化时,将uav的飞行轨迹固定,即得到第一优化问题:
57、p2:
58、s.t.c4-c7;
59、对uav的飞行轨迹的第二优化时,将用户设备任务卸载比例和uav能量捕获时间比例固定,即得到第二优化问题:
60、p3:
61、s.t.c1-c3。
62、优选地,分别求解第一优化和第二优化的解,最终获得目标函数的最优解,将最优解应用在系统中实现能耗优化,包括:
63、分别采用求解线性规划问题的标准python包pulp和ddpg算法依次求解第一优化和第二优化的解;
64、求解第一优化的解时,p2是一个典型的线性规划问题,因为变量β和q都是连续的,并且它所有的约束都是线性的,因此可以使用标准的python包pulp来求解,分别得到当前最优的用户设备任务卸载比例和uav能量捕获时间比例;
65、求解第二优化的解时,定义ddpg算法的状态空间为:
66、
67、其中表示用户设备n和uav之间的水平距离;
68、定义ddpg算法的动作空间为:
69、a(t)={θu(t),d(t)}
70、定义ddpg算法的奖励函数为:
71、
72、其中,
73、
74、
75、其中ω1,ω2,ω3和ω4平衡奖励项的正常数,p是惩罚项的正常数,当n'(t)=0时,r1(t)表示为uav与各用户设备之间的水平距离以及uav总能耗的负值,当n'(t)≠0时,r2(t)表示为各用户设备总任务量与uav总能耗的差值,对于违反条件c6,添加了一个惩罚项γ(c6),其中γ(·)是一个指标函数,如果满足条件c6,γ(c6)=0,如果不满足条件c6,γ(c6)=-1;
76、通过ddpg算法输出最优的uav的飞行轨迹,并根据得到的最优的用户设备任务卸载比例、uav能量捕获时间比例,最终获得目标函数的最优解,进而得到uav总能耗的最优解。
77、与现有技术相比,本发明的有益效果为:
78、本空地协作移动边缘计算系统中的uav能耗优化方法构建uav在预设时间段的平均能量消耗的最小化目标函数,并将目标函数的优化问题转化为对用户设备任务卸载比例、uav能量捕获时间比例的第一优化,以及对uav的飞行轨迹的第二优化,实现uav能耗最小的目标;在优化时,分别采用求解线性规划问题的标准python包pulp以及ddpg算法进行迭代求解,既发挥了深度强化学习在面对动态环境的不确定性时能够进行连续动作分配的优势,又利用了传统优化方法得到了用户设备任务卸载比例和uav能量捕获时间比例的最优解,有利于算法的快速收敛。
1.一种空地协作移动边缘计算系统中的uav能耗优化方法,其特征在于:所述空地协作移动边缘计算系统中的uav能耗优化方法,包括:
2.如权利要求1所述的空地协作移动边缘计算系统中的uav能耗优化方法,其特征在于:所述建立空地协作的mec系统,所述mec系统中包括预设数量且不具计算能力的用户设备、携带mec服务器的uav和ap,用户设备将全部任务卸载给uav或进一步通过uav将部分任务卸载给ap进行计算,且ap通过激光发射器为uav供能,包括:
3.如权利要求2所述的空地协作移动边缘计算系统中的uav能耗优化方法,其特征在于:所述计算uav从ap进行能量捕获的能耗、飞行能耗、接收和计算用户设备任务的能耗,以及将任务进一步卸载给ap的能耗,且将各能耗的和作为uav总的能量消耗,包括:
4.如权利要求3所述的空地协作移动边缘计算系统中的uav能耗优化方法,其特征在于:所述构建uav在预设时间段的平均能量消耗的最小化目标函数,并附加约束条件,包括:
5.如权利要求4所述的空地协作移动边缘计算系统中的uav能耗优化方法,其特征在于:所述将最小化目标函数转化为对用户设备任务卸载比例和uav能量捕获时间比例的第一优化,以及对uav的飞行轨迹的第二优化,包括:
6.如权利要求5所述的空地协作移动边缘计算系统中的uav能耗优化方法,其特征在于:所述分别求解第一优化和第二优化的解,最终获得目标函数的最优解,将所述最优解应用在系统中实现能耗优化,包括:
