欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2022108765114
申请人: 江苏海洋大学
专利类型:发明专利
专利状态:已下证
专利领域: 控制;调节
更新日期:2024-08-07
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于近端策略优化算法的AUV动态避障方法,其特征在于,包括以下步骤:S1、根据三维前视声呐数据格式进行数据解析,每t秒生成一帧三维前视声呐图像,并对图像进行上伪色、降噪等处理;

S2、根据声强信息对声呐图像进行障碍物检测,计算障碍物相对于AUV的位置信息,构建障碍物、AUV和目标位置的绝对坐标三维地图;

S3、比较地图中当前帧和上一帧绝对坐标发生改变的障碍物,计算此动态障碍物在t秒内的位移、平均速度和方向信息,构建碰撞预估模型;

S4、使用训练好的近端策略优化算法,根据碰撞预估模型,控制三维地图中的虚拟AUV在t秒内向着目标位置不断前行和试错,直至探索出一条安全避开障碍物的路径;

S5、AUV使用自身的推进器,在t秒内按照三维地图中虚拟AUV探索的路径前行,完成航行和避障动作;重复以上步骤,直至AUV到达目标位置。

2.根据权利要求1所述的一种基于近端策略优化算法的AUV动态避障方法,其特征在于:所述S1中的数据解析,使用OpenCV处理声纳数据,使用applyColorMap创建COLORMAP_TURBO伪彩色图像;

降噪处理采用双边滤波去除噪声,结合图像的空间近端度和像素值相似度折中处理,同时考虑空域信息和灰度相似性,达到保边去噪的目的。

3.根据权利要求1所述的一种基于近端策略优化算法的AUV动态避障方法,其特征在于:所述S2中三维地图的构建,以主动航行功能开启时AUV的位置为原点(0,0,0),航向为Y轴正方向,水平垂直于航向方向向右为X轴正方向,竖直于航向方向指向水面为Z轴正方向构建三维坐标系,将根据声强信息检测到的障碍物识别框映射到地图中,并实时更新障碍物和AUV的坐标信息。

4.根据权利要求1所述的一种基于近端策略优化算法的AUV动态避障方法,其特征在于:所述S3中假设障碍物在t秒内速度vobs、俯仰角θobs和偏航角ψobs是固定的,声呐测得障碍物上一帧坐标系位置为(x1,y1,z1),障碍物当前帧位置为(xobs,yobs,zobs),则障碍物航行的速度为:偏航角为:

ψobs=arctan((y1‑yobs)/(x1‑xobs))

俯仰角为:

据此可以判断出障碍物的动态信息;存储以上信息,形成障碍物、AUV和目标位置的绝对坐标三维地图。

5.根据权利要求1所述的一种基于近端策略优化算法的AUV动态避障方法,其特征在于:所述S3中构建碰撞预估模型,首先计算碰撞距离;

假设AUV当前帧的位置为(xauv,yauv,zauv),在完成一个step航行动作后坐标的移动量为(Δxauv,Δyauv,Δzauv),即完成一个step航行动作后AUV的位置为(xauv+Δxauv,yauv+Δyauv,zauv+Δzauv),AUV完成一个step航行动作所需时间为Δt秒,Δt为毫秒量级;

障碍物经过Δt秒后在X轴移动量为:Δxobs=vobsΔtcosθobscosψobs在Y轴移动量为:Δyobs=vobsΔtcosθobssinψobs在Z轴移动量为:Δzobs=vobsΔtsinθobs

即Δt秒后障碍物的坐标为(xobs+Δxobs,yobs+Δyobs,zobs+Δzobs);

则经过Δt秒后,AUV与障碍物之间的距离为:

根据dist进行障碍物距离评分,得到障碍物距离奖励RΔt。

AUV动态避障是一个连续的过程,当前step采取的航行动作会在很大程度上影响下一个动作,所以只关注于当前动作产生的效果往往不能顾全大局,影响整体的避障效果;

同时考虑到物体运动的惯性,AUV和动态障碍物都不太可能在很短的几十个Δt秒内改变自身原有的速度和航向;假设AUV在接下来的几十个step都采取当前的航行动作,预估惯性运动带来的影响,从而计算一段整体的AUV障碍物距离奖励GmΔt:式中,GmΔt为m个step获得的总和障碍物距离奖励;RnΔt为第n个step(即n个Δt秒后)的障碍物距离奖励;γ为衰减因子,介于(0,1)之间,因为越近的RΔt对算法影响更为重要,而越远的RΔt因为其预估性使得准确度逐渐降低,γ的加入可以使碰撞预估模型的目光既不短浅也不会过于长远;

考虑到AUV的计算性能,经过仿真实验模拟,最终取m=30,γ=0.95,即:碰撞预估模型分为4个等级,分别是A表示:安全;B表示:较小碰撞风险;C表示:较大碰撞风险;D表示:极度危险,将G30Δt代入以下公式得到AUV对此障碍物的碰撞预估评级Sq:假设在同一帧声呐图像上识别到了q个障碍物,对这q个障碍物重复以上步骤,得到碰撞预估集S:S={S1,S2,S3,...,Sq}。

6.根据权利要求1所述的一种基于近端策略优化算法的AUV动态避障方法,其特征在于:所述S4中为了训练基于近端策略优化算法的深度强化学习网络模型,采用基于Python开发的物理引擎PyBullet进行仿真环境搭建,并依靠碰撞预估集S进行动态避障训练。

7.根据权利要求1所述的一种基于近端策略优化算法的AUV动态避障方法,其特征在于:所述S5中AUV使用自身的推进器沿着规划的路径前行,完成航行和避障动作。