推荐文档列表

基于增强学习的无人直升机姿态控制器设计

时间:2021-12-08 16:44:33 航空航天论文 我要投稿

基于增强学习的无人直升机姿态控制器设计

自适应启发评价(AHC)增强学习结构分别逼近马尔可夫决策过程的值函数和策略函数,策略梯度增强学习能够将随机不确定的马尔可夫决策过程转换为确定性的马尔可夫决策过程.通过将AHC增强学习和策略梯度增强学习相结合,对PID控制器参数进行在线自适应整定,实现对无人直升机姿态控制性能的在线优化.仿真结果表明,与固定PID参数控制器相比,该算法能在线调整控制器参数,并很好地控制了无人直升机的悬停姿态.

基于增强学习的无人直升机姿态控制器设计

作 者: 蔡文澜 王俊生 税海涛 马宏绪 黄茜薇 CAI Wenlan WANG Junsheng SHUI Haitao MA Hongxu HUANG Qianwei   作者单位: 蔡文澜,CAI Wenlan(国防科学技术大学机电工程与自动化学院,长沙,410073;空军航空大学航空控制工程系,长春,130022)

王俊生,税海涛,马宏绪,黄茜薇,WANG Junsheng,SHUI Haitao,MA Hongxu,HUANG Qianwei(国防科学技术大学机电工程与自动化学院,长沙,410073) 

刊 名: 弹箭与制导学报  PKU 英文刊名: JOURNAL OF PROJECTILES, ROCKETS, MISSILES AND GUIDANCE  年,卷(期): 2008 28(2)  分类号: V249.1 TP273  关键词: 无人直升机   增强学习   自适应启发评价   策略梯度   PEGASUS