部分可观测条件下的策略迁移强化学习方法
王忠禹, 徐晓鹏, 王东
Policy Transfer Reinforcement Learning Method for Partially Observable Conditions
Zhongyu WANG, Xiaopeng XU, Dong WANG
现代防御技术 . 2024, (2): 63 -71 .  DOI: 10.3969/j.issn.1009-086x.2024.02.007