文章标题:基于强化学习的声诱饵航路规划方法
文章作者:张旭, 孔辉, 查淞元
关 键 字:强化学习;声诱饵;航路规划
文章摘要:本文给出一种基于强化学习的声诱饵航路规划方法。设计了适用于强化训练环境的步进式水声对抗仿真环境,通过该环境展示经典对抗态势与不利对抗态势。根据水声对抗的特点,设计了强化学习的观测空间、动作空间、奖励函数等关键要素。动作空间与奖励函数结合水声对抗特性进行了设计。借助Matlab平台进行深度神经网络的训练,并验证了训练结果,证明通过强化学习方法训练的声诱饵航路规划的有效性,具备将不利对抗态势转危为安的能力。