欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2022101937853
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:授权未缴费
专利领域: 计算;推算;计数
更新日期:2024-05-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种多无人机协作边缘计算方法,其特征在于:该方法包括以下步骤:S1:无人机相互之间建立通信链路;

S2:初始化边缘计算服务器的CPU频率周期和存储;

S3:构建任务计算服务延迟和严苛任务失败惩罚的加权和的优化模型;

S4:基于优化模型,根据车辆的位置和服务器的状况采用深度确定性策略梯度算法确定各个任务卸载的无人机;

S5:车辆将计算任务卸载到相应的无人机上;

S6:各个无人机利用二分搜索算法将计算任务划分为不同比例大小的子任务;

S7:各个无人机将子任务卸载到其他无人机上,并开始计算服务;

S8:各个无人机判断边缘计算服务器上的任务是否计算完成,若计算任务完成执行S8,否则,执行S6;

S9:基于车辆的位置和方向角采用深度确定性略梯度算法确定各个任务的交付无人机;

S10:各无人机交付任务计算结果给车辆。

2.根据权利要求1所述的一种多无人机协作边缘计算方法,其特征在于:所述S1中,无人机携带计算服务器,且无人机的总数目为N个,每个无人机的编号为n;无人机上的边缘计算服务器上具备相同大小的中央处理器周期频率 缓存

3.根据权利要求2所述的一种多无人机协作边缘计算方法,其特征在于:所述S2中,优化步骤包括以下步骤:S21:设所有无人机覆盖下的车辆的数目为U个,每个车辆的编号为u,每个车辆计算任务可以表征为 其中 为车辆 在t时隙所需要的CPU计算周期数,为车辆 在t时隙所需要的缓存资源大小,也为任务的数据量大小, 表示该任务的服务质量QoS需求,当 时表示该任务为低优先级的计算任务,当 时表示该任务为高优先级的计算任务;

S22:车辆u的将计算任务卸载到无人机n上,其任务卸载的传输延迟为:其中 代表车辆u将计算任务卸载至无人机n上,当 则不卸载,ru,n为车辆u与无人机n之间的传输速率;

S23:无人机将任务划分为不同大小的子任务,并将各个子任务卸载给其他无人机,其任务卸载的传输延迟为 其中 为划分为无人机n'的任务比例大小;

S24:车辆u的各个子任务卸载到无人机n上,无人机上的边缘计算服务器计算时延为:其中 为无人机n边缘计算服务器分给该任务的CPU周期频率;

S25:车辆u的任务的总的服务延迟为

S23:为了保证 任务被正确接收并成功交付,定义其惩罚函数为:S24:建立优化模型: 其中T是系统的运行

总时间,χ为 任务计算卸载服务失败时的单位惩罚。

4.根据权利要求3所述的一种多无人机协作边缘计算方法,其特征在于:所述S4中,深度确定性策略梯度算法包含四个神经网络;其中两个网络为评价网络,在训练神经网络时更新权值;另外两个网络为目标网络,在训练神经网络时定期从评价网络中替换权值;对于评价网络与目标网络,分别采用演员神经网络与评论家神经网络对最优策略和Q值进行评价。

5.根据权利要求1所述的一种多无人机协作边缘计算方法,其特征在于:所述S5中,深度确定性策略梯度算法的状态空间为:各个车辆任务的数据量大小,即 每个车辆的速度与方向角{ut,speed,ut,angle};边缘服务器完成之前时间段内卸载任务的延迟深度确定性策略梯度算法的动作空间为:对于车辆u,任务的卸载无人机与结果交付无人机,即深度确定性策略梯度算法的成本模型为:全体车辆u的任务计算服务延迟和严苛任务失败惩罚的加权和,即: 其中χ为 任务计算卸载服务失败时的单位惩罚因子。

6.根据权利要求5所述的一种多无人机协作边缘计算方法,其特征在于:所述S4中,深度确定性策略梯度算法为了得到长期的期望收益,其状态s的价值函数V为:t

其中γ是与时间相关的的折现因子;通过最小化每个*

状态的价值函数,即得到最优的卸载π,即:

7.根据权利要求6所述的一种多无人机协作边缘计算方法,其特征在于:所述S4中,深度确定性策略梯度算法包括以下步骤:S41:设置算法的迭代次数;

S42:初始化环境以及初始的状态;

S43:选择一个动作 察下一个状态st+1和成本C(st,at);

S44:将(st,at,st+1)存放至经验回放缓冲区;若缓冲区已满,则删除最旧的(st,at,st+1)元素;

S45:评价网络和目标网络的评论家神经网络都对权利要求5中的价值函数进行近似,Q Q 2 Q并计算损失函数L,即:L(θ)=E[(yt‑Q(st,at|θ))],其中Q(st,at|θ)表示的是由评价网络近似得到的Q函数,yt的值由目标网络近似的值函数得到,为yt=C(st,at)+γQ(st+1,μ'(st+1μ' Q'|θ)|θ);

S46:通过最小化步骤S45中的损失函数L,更新评价网络中评论家神经网络的权重;

S47:根据 中的抽样策略梯度更新

评价网络中演员的权重;

S48:判断是否到达迭代次数,达到则输出深度确定性策略梯度算法的网络,否则继续步骤S43‑S48。

8.根据权利要求7所述的一种多无人机协作边缘计算方法,其特征在于:所述S6中,二分搜索算法包括以下步骤:S61:从第一个无人机开始,测量该无人机与其他无人机之间的距离,并将距离表缓存至自己的内存中,计算该无人机与其他无人机之间的距离和;

S62:从第一个无人机开始,将每个无人机收到的任务划分为等大小的两个子问题;

S63:从第一个无人机开始,将第一份子任务保存在本地的缓存区中,第二份子任务根据其他无人机的距离与距离和之比进行划分成不同大小的子问题;

S64:将不同的子问题卸载给步骤S63中相应的无人机上。