1.一种无人机集群协同侦察覆盖分布式自主优化方法,其特征在于,包括以下步骤:步骤S1.初始化无人机群中各无人机的位置策略和功率策略,基于无人机群中各无人机的位置策略和功率策略的选择,构建无人机群行动决策;
侦察区域内存在至少一个预设待侦察目标点,基于无人机群行动决策、无人机群中各无人机分别对各预设待侦察目标点的侦察成功率、无人机群中各无人机分别侦察各预设待侦察目标点所需时间,构建全局侦察覆盖效用、全局侦察覆盖能量效率;
基于全局侦察覆盖效用、全局侦察覆盖能量效率,构建无人机群执行不同行动决策时获得的虚拟收益模型;
其中构建无人机群执行不同行动决策时获得的虚拟收益模型的具体步骤如下:步骤S11.针对无人机群中任意一个无人机n,基于侦察区域地形信息,构建无人机n对侦察区域内其中一个预设待侦察目标点i的侦察成功率qi(n)如下式:式中,i为侦察区域内其中一个预设待侦察目标点,i∈I,I为侦察区域内所有待侦察目标点的集合, 为侦察的初始距离, 为预设侦察成功率与侦察距离的预设系数,hn为无人机n的高度,(Xn,Yn)为无人机n水平坐标,(xi,yi)为预设待侦察目标点i的水平坐标;
步骤S12.基于无人机与空中服务器以传输图片进行通信的方式,构建无人机n侦察预设待侦察目标点i所消耗的时间Tn如下式:式中,b为无人机与空中服务器之间所传输的图片中一个像素的比特数,r为所述图片的分辨率,B为传输信息的带宽,Pn为无人机n上传信息所消耗的功率,n0为传输信道的噪声系数,(X0,Y0)为空中服务器的水平坐标;
步骤S13.基于无人机n对侦察区域内其中一个预设待侦察目标点i的侦察成功率qi(n)、预设待侦察目标点i出现的概率σi,构建无人机群对预设待侦察目标点i的侦察成功率gi,N如下式:
式中,N为无人机群中无人机的数量;
步骤S14.基于无人机群对预设待侦察目标点i的侦察成功率gi,N,构建全局侦察覆盖效用U如下式:
式中, 为无人机群中各无人机上传信息时间的最大值,I为侦察区域内所有待侦察目标点的集合;
步骤S15.基于全局侦察覆盖效用U,构建全局侦察覆盖能量效率G如下式:式中,pn表示无人机群中其中一个无人机n的功率策略;
步骤S16.基于无人机群中各无人机的位置策略和功率策略,构建虚拟收益模型:P:S=argmaxG,其中P表示各无人机功率策略的集合,S表示各无人机位置策略的集合;
步骤S2.基于无人机群的行动决策的选择、以及虚拟收益模型,构建该行动决策下的全局侦察覆盖效用的势能函数、全局侦察覆盖能量效率的势能函数,其中全局侦察覆盖效用的势能函数、全局侦察覆盖能量效率的势能函数用于表征无人机群中各无人机位置策略和功率策略变化时对所获虚拟收益模型的影响;
其中构建全局侦察覆盖效用的势能函数、全局侦察覆盖能量效率的势能函数的具体步骤如下:
步骤S21.将无人机群中的一个无人机n的侦察覆盖区域定义为In,将与无人机n存在重叠侦察覆盖区域的无人机定义为邻居无人机,其中邻居无人机的侦察覆盖区域定义为Jn,各无人机的侦察覆盖区域满足In∩Jn≠0;无人机n基于其位置策略移动到下一位置,该位置* * *
记为n ,移动至位置n的无人机n的侦察覆盖区域为 位于位置n的无人机n的邻居无人机的侦察覆盖区域为 针对各无人机的位置策略,构建全局侦察覆盖效用的势能函数如下式:
式中, 为无人机n的位置策略为cn时的全局侦察覆盖效用的势能函数,cn为无人机n的位置策略,c‑n为无人机群中除无人机n以外的其他各无人机的位置策略,Un(cn,c‑n)为无人机n的位置策略为cn时的全局侦察覆盖效用;
针对无人机n进行位置策略的改变,将无人机n的位置策略由cn变为 其位置策略的改变引起的全局侦察覆盖效用的势能函数的变化如下式:式中,Jn为邻居无人机的侦察覆盖区域, 为无人机n的位置策略变为 时的全局侦察覆盖效用的势能函数,J1n为无人机n及其所有邻居无人机的侦察覆盖区域的集合,qi(cn)为无人机n的位置策略为cn时,对预设待侦察目标点i的侦察成功率, 为无人机n的位置策略变为 时,对预设待侦察目标点i的侦察成功率,k为无人机群中除无人机n及其各邻居无人机以外的一个无人机,qi(k)为无人机k对预设待侦察目标点i的侦察成功率;
步骤S22.针对无人机n的功率策略的改变,构建全局侦察覆盖能量效率的势能函数如下式:
式中,φ(pn,p‑n)为无人机n的功率策略为pn时的全局侦察覆盖能量效率的势能函数,pn为无人机n的功率策略,p‑n为无人机群中除无人机n以外的其他各无人机的功率策略,gi,N(pn,p‑n)为无人机n的功率策略为pn时无人机群对预设待侦察目标点i的侦察成功率,pm为无人机群中一个无人机m的功率策略,其中m∈N;
针对无人机n的功率策略由pn变化到 时,该变化引起的全局侦察覆盖能量效率的势能函数的变化如下式:
式中, 为无人机n的功率策略为 时的全局侦察覆盖能量效率的势能函数,为无人机n的功率策略为 时无人机群对预设待侦察目标点i的侦察成功率;
步骤S3.基于虚拟收益模型,结合无人机群中各无人机位置策略和功率策略变化对所获虚拟收益模型的影响,通过分布式自主迭代学习,优化无人机群中各无人机的位置策略和功率策略,实现无人机群所获虚拟收益最大化;
具体步骤如下:
步骤S31.在无人机群中随机选择一个无人机j,构建无人机j的状态参数如下式:sj(t)={cj(t),pj(t)}式中,t为当前时刻,sj(t)为无人机j当前时刻的状态参数,cj(t)为无人机j当前时刻的位置策略,pj(t)为无人机j当前时刻的功率策略;
针对无人机j选择一个位置策略 其他无人机位置保持不变;
步骤S32.计算无人机j基于当前时刻的位置策略的全局侦察覆盖效用Uj(sj(t))和无人机j基于位置策略 进行移动后的全局侦察覆盖效用 其中 为无人机j基于位置策略 进行移动后的状态参数;
步骤S33.针对无人机j,根据下式计算无人机j下一时刻保持当前位置策略的概率P(sj(t+1)=sj(t))和改变位置策略的概率 其中sj(t+1)为无人机j下一时刻的状态参数:
式中,β为预设学习系数;
步骤S34.更新该无人机的状态参数为sj(t+1),然后从无人机群中的其他各无人机中随机选择一个无人机,重复步骤S31至步骤S33的位置策略选择过程,直至达到预设最大迭代次数,保存预设最大迭代次数所对应的无人机群中各无人机的状态参数;
步骤S35.在无人机群中随机选择一个无人机k,构建无人机k的状态参数如下式:sk(t)={ck(t),pk(t)}式中,sk(t)为无人机k当前时刻的状态参数,ck(t)为无人机k当前时刻的位置策略,pk(t)为无人机k当前时刻的功率策略;
针对无人机k选择一个功率策略 其他无人机功率保持不变;
步骤S36.计算无人机k基于当前时刻的功率策略的全局侦察覆盖能量效率Gk(sk(t),s‑k(t)),以及无人机k基于功率策略 的全局侦察覆盖能量效率 其中为无人机k基于功率策略 进行功率改变后的状态参数,s‑k(t)为无人机群中除无人机k以外的其他各无人机的状态参数;
步骤S37.针对无人机k,根据下式计算无人机k下一时刻保持当前功率策略的概率P(sk(t+1)=sk(t))和改变功率策略的概率 其中sk(t+1)为无人机k下一时刻的状态参数:
步骤S38.更新无人机k的状态参数为sk(t+1),然后从无人机群中的其他各无人机中随机选择一个无人机,重复步骤S35至步骤S37的功率策略选择过程,直至达到预设最大迭代次数,保存预设最大迭代次数所对应的无人机群中各无人机的状态参数,此时各无人机的位置策略和功率策略使无人机群所获虚拟收益最大。