基于CA-CMAC的Q学习截球算法
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

TP18

基金项目:


Intercepting Algorithm Based on CA-CMAC Q-learning
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    CMAC神经网络的主要优点在于其局部修正权重系数,使每次修改的权重系数极少,因此具有快速学习能力,非常适合于在线实时控制。但是在实际的使用过程中,CMAC算法会产生可信度的分配问题,因此我们使用CA-CMAC来代替CMAC。Q学习是一种重要的强化学习方法,本文将Q学习与CA-CMAC网络相结合用到Robocup仿真环境中,使智能体通过学习训练球员的截球能力。我们通过实际的仿真取得了很好的效果,证明算法是有效可行的。

    Abstract:

    The main advantage of CMAC neural network is the partial correction of weight coefficient. As we can change very little weight coefficient to get faster learning ability, CMAC is very suitable for real time control. But in the actual process of using,CMAC often faces the problem occurred by the uneven distribution of units’ credibility, therefore we use CA-CMAC instead of CMAC.Q-learning is an important method of reinforcement learning, In this article ,we combine Q-learning and CA-CMAC neural network and use the algorithm in Robocup simulation for improving the agent’s ability of intercepting .We get good results through the simulation which shows that the algorithm is deasible and effective.

    参考文献
    相似文献
    引证文献
引用本文

申迅,刘国栋. 基于CA-CMAC的Q学习截球算法[J]. 科学技术与工程, 2011, (7): .
shenxun, LiuGuodong. Intercepting Algorithm Based on CA-CMAC Q-learning[J]. Science Technology and Engineering,2011,(7).

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2010-11-24
  • 最后修改日期:2010-12-27
  • 录用日期:2010-12-01
  • 在线发布日期: 2011-01-20
  • 出版日期:
×
律回春渐,新元肇启|《科学技术与工程》编辑部恭祝新岁!
亟待确认版面费归属稿件,敬请作者关注