针对多无人机航迹规划问题,对无人机与威胁区域进行数学建模,模拟出接近实际环境的场景,基于此设计一种多智能体强化学习的动态场景航迹规划算法(dynamic scene trajectory planning algorithm based on multi-agent reinforcement learning,DSTP-MARL),用于实现多架无人机的智能航迹规划,该算法通过有效避开威胁区域,保障无人机安全到达目标地点,优化任务执行路径。为验证算法性能,将DSTP-MARL与深度Q网络(deep Q-network, DQN)进行对比,实验结果表明,无论在简单还是复杂威胁区域中,DSTP-MARL均表现出更优的避障能力与任务完成效果,在收敛速度、过程稳定性方面,DSTP-MARL相较于DQN有明显优势,能够更快收敛且更加稳定,有效提升任务执行效率,展现出更高的实用价值与应用前景。