《舰船科学技术》

文章标题:基于上下文感知的强化学习AUV控制器研究

文章作者:徐春晖1,2,3, 徐德胜1,2,3,4, 周仕昊1,2,3, 杨士霖1,2,3,4
关 键 字:AUV;深度控制;强化学习;上下文感知
文章摘要:为了提升基于强化学习的自主水下航行器(Autonomous Underwater vehicle,AUV)控制器在复杂海况中对环境干扰的鲁棒性,设计一种利用上下文信息进行环境感知的强化学习控制器。结合水下机器人运动学及动力学方程对深度跟踪任务进行建模,构建了基于PPO-clip算法的深度控制器,并在算法中融入了上下文变量和域随机化方法。在仿真环境中分别进行海流干扰、暗涌干扰以及两者共同干扰环境的深度跟踪任务,仿真结果表明,本文提出的方法对强化学习控制器的抗干扰能力有明显的提升,在多种环境干扰下更精准地完成深度跟踪任务。