超视距空战中强化学习性能受限于训练对手质量。为此,提出一种基于规则的智能体决策框架作为强化学习智能体的训练对手。经仿真验证,以此框架训练的智能体可高效掌握典型空战策略,作战效能明显提升。介绍了战机基本机动动作,建立了空战仿真模块和协同策略训练模块。针对现有规则决策树存在的规则梳理不全面、繁琐复杂难梳理等问题,提出了基于状态机转移的决策逻辑框架,利用事件条件实现状态跳转与决策,其相较于传统决策树具备更强的空战决策能力。建立单机超视距空战强化学习智能体,并以基于状态机转移的决策逻辑框架为对手引导智能体学习训练,在规则专家知识引导下训练的智能体能够自主学习到典型机动动作,同时具备更好的决策适应水平和作战能力,为超视距空战决策系统的进一步研究提供了思路。