在现代战争中,无人机协同作战已成为提升战场效能的关键技术。其中,无人战斗机(UCAV)与诱饵机(Decoy UAV)的协同作战模式因其战术价值受到广泛关注。针对无人攻击机与诱饵机协同打击敌方重点目标的任务,提出了一种基于近端策略优化(proximal policy optimization, PPO)算法的协同航迹规划方法。构建融合动态威胁评估的马尔可夫决策过程(Markov decision process, MDP)模型,集成无人机运动学与战场环境约束,设计状态、动作空间及分层奖励函数。仿真实验表明,所提方法能有效引导攻击机与诱饵机在复杂战场环境中实现高效协同,显著提升任务成功率并降低被敌方防空系统拦截的风险,为无人机协同作战的智能化路径规划提供了理论与技术支撑。