欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 202011312164X
申请人: 华侨大学
专利类型:发明专利
专利状态:已下证
专利领域: 电通信技术
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于强化学习的无人机辅助物联网抗敌意干扰方法,其特征在于:包括:步骤10、建立抗敌意干扰攻防Stackelberg博弈模型,在所述抗敌意干扰攻防Stackelberg博弈模型中地面传感器节点、无人机和智能干扰机为博弈的三个参与者;

步骤20、推导所述抗敌意干扰攻防Stackelberg博弈模型中的博弈均衡点及所述博弈均衡点的存在条件,所述博弈均衡点包括智能干扰机的最优干扰功率、无人机的最优发射功率、无人机的最优移动距离以及地面传感器节点的最优发射功率;

步骤30、在未知干扰模型的条件下,引入WoLF‑PHC算法动态优化地面传感器节点的发射功率、无人机的发射功率和无人机的移动轨迹;

所述步骤10具体包括:

步骤11、在时隙k内,无人机在初始位置 收到地面传感器节点发送的信息,然后以速(k)度 直线飞行到目标位置L ,将信息转发给位于LB的基站,智能干扰机对基站实施干扰;

步骤12、定义Ai为功率集,i∈(s,u,j),其中s表示地面传感器节点,u表示无人机,j表示智能干扰机,D为无人机飞行距离动作集,|Ai|表示功率集中元素的个数,|D|表示动作集中元素的个数;

步骤13、地面传感器节点首先以发射功率 将信息传给无人机,无人机通过信号功率与飞行轨迹控制策略提高转发质量,无人机设置当前信号发射功率 之后控制目标飞行距离 飞到 和LB之间的最优位置转发信息,其中Du是无人机的最大可达飞行距离,智能干扰机在地面固定的位置,以功率 向基站持续发送干扰信号,降低无人机与基站之间的通信质量;

步骤14、将地面传感器节点定为领导者,无人机为副领导者,智能干扰机为追随者,三个参与者的目的均为最大化自己的效用函数,地面传感器节点、无人机和智能干扰机之间的先后行为建模为抗敌意干扰攻防Stackelberg博弈模型;

所述步骤20中,推导出的博弈均衡点及所述博弈均衡点的存在条件,具体包括:智能干扰机的最优干扰功率,公式如下:

其中,hs为地面传感器节点的信道增益,hu为无人机的信道增益,hj为智能干扰机的信道增益,ps为地面传感器节点的发射功率,pu为无人机的发射功率,pj为智能干扰机的发射功率,Cj为单位干扰信号功率损耗系数,σ为噪声功率;

无人机的最优发射功率,公式如下:

其中,Cu表示无人机的单位信号功率损耗系数,

Ω1:

Ω2:

其他:

无人机的最优移动距离,公式如下:

其中,Du是无人机的最大可达飞行距离,DB是无人机起始位置和基站位置之间的欧氏距离,Ω1:

Ω2:

其他:

地面传感器节点的最优发射功率,公式如下:

其中,Cs表示地面传感器节点的单位信号功率损耗系数,Cr表示无人机的单位飞行距离损耗系数,Dr表示系统的参考距离,hr表示无人机或者智能干扰机与基站的距离为参考距离Dr时的参考信道增益。

2.根据权利要求1所述的方法,其特征在于:所述步骤30具体包括:步骤31、输入(k‑1)时隙无人机的发射功率和移动距离以及智能干扰机的干扰功率,其中,k为当前时隙序号;

步骤32、通过WoLF‑PHC算法确定地面传感器节点k时隙的发射功率;

步骤33、根据所述地面传感器节点k时隙的发射功率,通过WoLF‑PHC算法确定无人机k时隙的发射功率和移动距离;

步骤34、根据所述地面传感器节点k时隙的发射功率和无人机k时隙的发射功率和移动距离,通过WoLF‑PHC算法确定智能干扰机k时隙的最优干扰功率;

步骤35、判断是否达到博弈均衡点;若否,令k=k+1,然后返回步骤31;若是,结束步骤。

3.一种基于强化学习的无人机辅助物联网抗敌意干扰系统,其特征在于,包括:博弈模型建立模块、博弈均衡点推导模块以及动态优化模块;

所述博弈模型建立模块,用于建立抗敌意干扰攻防Stackelberg博弈模型,在所述抗敌意干扰攻防Stackelberg博弈模型中地面传感器节点、无人机和智能干扰机为博弈的三个参与者;

所述博弈均衡点推导模块,用于推导所述抗敌意干扰攻防Stackelberg博弈模型中的博弈均衡点及所述博弈均衡点的存在条件,所述博弈均衡点包括智能干扰机的最优干扰功率、无人机的最优发射功率、无人机的最优移动距离以及地面传感器节点的最优发射功率;

所述动态优化模块,用于在未知干扰模型的条件下,引入WoLF‑PHC算法动态优化地面传感器节点的发射功率、无人机的发射功率和无人机的移动轨迹;

所述博弈模型建立模块,具体用于执行如下步骤:

步骤11、在时隙k内,无人机在初始位置 收到地面传感器节点发送的信息,然后以速(k)度 直线飞行到目标位置L ,将信息转发给位于LB的基站,智能干扰机对基站实施干扰;

步骤12、定义Ai为功率集,i∈(s,u,j),其中s表示地面传感器节点,u表示无人机,j表示智能干扰机,D为无人机飞行距离动作集,|Ai|表示功率集中元素的个数,|D|表示动作集中元素的个数;

步骤13、地面传感器节点首先以发射功率 将信息传给无人机,无人机通过信号功率与飞行轨迹控制策略提高转发质量,无人机设置当前信号发射功率 之后控制目标飞行距离 飞到 和LB之间的最优位置转发信息,其中Du是无人机的最大可达飞行距离,智能干扰机在地面固定的位置,以功率 向基站持续发送干扰信号,降低无人机与基站之间的通信质量;

步骤14、将地面传感器节点定为领导者,无人机为副领导者,智能干扰机为追随者,三个参与者的目的均为最大化自己的效用函数,地面传感器节点、无人机和智能干扰机之间的先后行为建模为抗敌意干扰攻防Stackelberg博弈模型;

所述博弈均衡点推导模块中,推导出的博弈均衡点及所述博弈均衡点的存在条件,具体包括:智能干扰机的最优干扰功率,公式如下:

其中,hs为地面传感器节点的信道增益,hu为无人机的信道增益,hj为智能干扰机的信道增益,ps为地面传感器节点的发射功率,pu为无人机的发射功率,pj为智能干扰机的发射功率,Cj为单位干扰信号功率损耗系数,σ为噪声功率;

无人机的最优发射功率,公式如下:

其中,Cu表示无人机的单位信号功率损耗系数,

Ω1:

Ω2:

其他:

无人机的最优移动距离,公式如下:

其中,Du是无人机的最大可达飞行距离,DB是无人机起始位置和基站位置之间的欧氏距离,Ω1:

Ω2:

其他:

地面传感器节点的最优发射功率,公式如下:

其中,Cs表示地面传感器节点的单位信号功率损耗系数,Cr表示无人机的单位飞行距离损耗系数,Dr表示系统的参考距离,hr表示无人机或者智能干扰机与基站的距离为参考距离Dr时的参考信道增益。

4.根据权利要求3所述的系统,其特征在于:所述动态优化模块,具体用于执行如下步骤:步骤31、输入(k‑1)时隙无人机的发射功率和移动距离以及智能干扰机的干扰功率,其中,k为当前时隙序号;

步骤32、通过WoLF‑PHC算法确定地面传感器节点k时隙的发射功率;

步骤33、根据所述地面传感器节点k时隙的发射功率,通过WoLF‑PHC算法确定无人机k时隙的发射功率和移动距离;

步骤34、根据所述地面传感器节点k时隙的发射功率和无人机k时隙的发射功率和移动距离,通过WoLF‑PHC算法确定智能干扰机k时隙的最优干扰功率;

步骤35、判断是否达到博弈均衡点;若否,令k=k+1,然后返回步骤31;若是,结束步骤。