1.一种考虑用户移动性的无人机辅助的边缘计算方法,其特征在于,所述边缘计算方法包括以下步骤:
S1,利用自第三方收集的数据建立由数字孪生驱动的无人机辅助计算网络,该无人机辅助计算网络用以模拟用户设备、移动无人机和具有固定地址的空闲设备的状态;空闲设备与移动无人机用于协助用户设备完成用户计算任务;
S2,由无人机辅助计算网络实时反馈用户、无人机和空闲设备的实时数据、位置和状态;
S3,基于步骤S2反馈的用户的任务数据量 和地理位置 、无人机位置 和状态,以及空闲设备位置 和状态,以降低用户总时延为目标,采用分布式深度学习求解用户的卸载策略;每个任务对应的卸载动作包括用户本地计算、无人机计算和空闲设备计算三种;
S4,基于步骤S3求解出的卸载策略,利用差分进化学习求解无人机的位置部署;
S5,循环执行步骤S3和步骤S4,直到结果收敛或者达到最大迭代次数;
步骤S1中,利用自第三方收集的数据建立由数字孪生驱动的无人机辅助计算网络的过程包括以下步骤:
S11,设在时隙t,用户 生成任务数据量 ,用户 的三维坐标表示为;假设用户的速度大小固定为 ,速度的方向 服从一个随机的高斯分布,一个时隙的时间为 ,则用户 在(t+1)时隙的位置表示为:;
S12,根据现实物理层,在虚拟世界建立对应的孪生网络层;
S13,在t时隙,用户 的数字孪生公式表示为:用户基于其本地状态及其历史状态生成数据集Di来训练本地模型,用户状态包括用户对应的任务数据量状态和位置状态;
其中,定义在用户的数据集Di上的损失函数为:式中:是训练模型的参数向量; 是基于机器学习算法的损失函数;
在拟合数据的过程中,使用梯度下降算法训练模型参数,参数更新公式如下:其中: 是t次迭代的学习模型参数;是学习率; 是参数的损失函数梯度;
S14,将无人机j和空闲设备k的数字孪生构建为:式中: 表示无人机j在t时隙的坐标; 表示无人机j在t时隙服务的用户数量; 表示空闲设备k的固定位置; 表示空闲设备k在t时隙服务的用户数量。
2.根据权利要求1所述的考虑用户移动性的无人机辅助的边缘计算方法,其特征在于,步骤S3中,以降低用户总时延为目标,采用分布式深度学习求解用户的卸载策略的过程包括以下步骤:
S31,用 表示用户的卸载动作类型;当 等于0时, 的计算任务由其本地进行计算;当等于1时,的计算任务由与邻近的空闲设备计算;当 等于2时,的计算任务由与 邻近的无人机计算;
S32,考虑无人机和空闲设备在一个时隙下能够服务的用户数量,得到对应的约束条件:
其中, 表示无人机j在t时隙服务的用户数量; 表示空闲设备k在t时隙服务的用户数量; 表示一个时隙下无人机能够服务的最大用户数量; 表示一个时隙下空闲设备能够服务的最大用户数量;
S33,构建K个并行的除参数外全部相同的深度神经网络,每个深度神经网络的输入是用户设备的任务量,输出是对应的卸载动作概率,K为大于1的正整数;
S34,将M个计算任务的任务数据量大小作为输入,输入到K个深度神经网络中,得到每个深度神经网络对应的3*M个卸载动作概率,根据卸载动作概率选择每个深度神经网络的卸载决策,得到K组卸载决策;
S35,根据当前的用户位置和无人机的位置,计算出不同卸载决策下的总时延,筛选得到总时延最小的卸载决策,将总时延最小的卸载决策对应的每个用户的卸载动作类型的概率修正为100%,其余2个卸载动作类型的概率修正为0%;将这一组任务数据和修正后的动作决策概率存储起来,生成一组样本数据;
S36,重复N次步骤S34至S35,生成N组样本数据,存储至记忆库;间隔固定次数,从记忆库中随机抽取一定量的样本数据训练前述K个深度神经网络,输出对应的卸载策略,即每个深度神经网络的权重参数。
3.根据权利要求2所述的考虑用户移动性的无人机辅助的边缘计算方法,其特征在于,每个深度神经网络均包含依次连接的1个输入层、3个隐藏层和1个输出层;3个隐藏层按照由前至后的顺序被分别编号为 [0]、 [1]和 [2];
其中,输入层节点的个数对应用户的数量M,隐藏层Hide[0]节点的个数为20,隐藏层Hide[1]节点的个数为40,隐藏层Hide[2]节点的个数为20,输出层的节点个数对应于用户的数量的3倍;公式化表示几个层之间的关系如下:式中, 是隐藏层[0]的输出值, 是隐藏层[1]的输出值, 是隐藏层[2]的输出值, 是输出层的输出值; 分别表示3个隐藏层和输出层的权重矩阵的转置; 分别表示3个隐藏层和输出层的偏差;relu函数和softmax函数都是激活函数,前者的作用是激活隐藏层节点,后者的作用是将输出值以概率的形式呈现,即卸载动作的概率。
4.根据权利要求2所述的考虑用户移动性的无人机辅助的边缘计算方法,其特征在于,步骤S34中,得到每个深度神经网络对应的3*M个卸载动作概率的过程包括以下步骤:设用户 i对应的深度神经网络的输出值为 和 ;将这三个值通过下述公式计算得到用户i的动作决策概率:
式中, 和 为用户i的卸载动作类型分别为用户本地计算、空闲设备计算和无人机计算的概率;xi0、xi1和xi2分别是用户i通过深度神经网络输出的三个动作的值。
5.根据权利要求2所述的考虑用户移动性的无人机辅助的边缘计算方法,其特征在于,步骤S35中,根据下述公式计算得到总时延最小的卸载决策 :式中, 和 分别表示本地计算模式、空闲设备计算模式和无人机算计模式的时延,根据用户数据量 和地理位置 、无人机位置 和空闲设备位置 计算得到; ,表示K组并行的深度神经网络所选取出来的动作,y表示其中一组用户卸载决策。
6.根据权利要求2所述的考虑用户移动性的无人机辅助的边缘计算方法,其特征在于,步骤S36中,采用交叉损失熵函数来表示训练对应的损失函数;
式中,表示当前的网络参数, 表示根据公式得到总时延最小的卸载决策, 表示根据数据D和当前网络参数 计算出来的卸载决策。
7.根据权利要求1所述的考虑用户移动性的无人机辅助的边缘计算方法,其特征在于,步骤S4中,利用差分进化学习求解无人机的位置部署的过程包括以下步骤:S41,获得无人机初始化的种群;对于无人机j,其个体表示为 ,其中h表示无人机的高度:
式中, 和 表示横纵坐标的下界, 和 表示横纵坐标的上界,是一个(0,1)的随机浮点数;
S42,从生成的种群中随机抽取3个无人机个体,分别表示为 和 :式中,F是变异因子;表示无人机j临时的一个个体;t表示t时隙;
S43,根据下述差分公式生成新的无人机j在t+1时隙的个体Nj( :其中CR表示差分的概率; ∈{0,1},用于保证差分后的个体至少在一个维度上与之前不同; 表示无人机 j临时个体对应的x坐标和y坐标值, 表示新生成的无人机个体在(t+1)时隙对应的x坐标和y坐标;
S44,结合下述公式,采用贪婪算法进行选择,分别计算2个种群的用户总体时延,保留效果更好的种群:
;
式中, 表示在(t+1)时隙无人机 j的个体; 表示S43中无人机 的新个体; 表示在t时隙无人机j的个体, 表示基于t时隙无人机种群的计算时延; 表示基于新的无人机种群的计算时延; 表示t时隙无人机种群; 表示新生成的无人机临时种群;
S45,循环执行步骤S43和S44,直至结果收敛或者达到预设的最大迭代次数。