推荐文档列表

基于Sarsa算法的无人直升机悬停控制

时间:2021-12-08 17:16:31 航空航天论文 我要投稿

基于Sarsa算法的无人直升机悬停控制

无人直升机悬停控制,利用Sarsa增强学习算法设计.将Sarsa增强学习算法与多层前馈神经网络相结合,对控制器参数进行在线调整,实现对微小型无人直升机悬停控制性能的在线优化.增强学习的值函数逼近器采用N10-12-16结构的多层前馈神经网络,权值学习采用直接梯度下降的近似梯度迭代算法,用ε-Greed策略进行行为选择.

作 者: 蔡文澜 王俊生 税海涛 马宏绪 CAI Wen-lan WANG Jun-sheng SHUI Hai-tao MA Hong-xu   作者单位: 蔡文澜,CAI Wen-lan(国防科技大学,机电工程与自动化学院,湖南,长沙,410073;空军航空大学,航空控制工程系,吉林,长春,130022)

王俊生,税海涛,马宏绪,WANG Jun-sheng,SHUI Hai-tao,MA Hong-xu(国防科技大学,机电工程与自动化学院,湖南,长沙,410073) 

刊 名: 兵工自动化  ISTIC 英文刊名: ORDNANCE INDUSTRY AUTOMATION  年,卷(期): 2007 26(7)  分类号: V249.1 TP273  关键词: 无人直升机   悬停控制   Sarsa增强学习算法   多层前馈神经网络