部分可观测条件下的策略迁移强化学习方法

王忠禹, 徐晓鹏, 王东

Policy Transfer Reinforcement Learning Method for Partially Observable Conditions

Zhongyu WANG, Xiaopeng XU, Dong WANG

现代防御技术 . 2024, (2): 63 -71 . DOI: 10.3969/j.issn.1009-086x.2024.02.007