強化学習とフィードバック制御の切替制御系の構成

2014 10/01

制御対象にはモデル化可能が容易な部分と困難な部分が存在します．このモデル化が困難な部分を学習により制御するのが本研究となっています．本研究では学習方法として，教師なし学習の一つである強化学習を用います．強化学習には不確かさが常に存在するため，パラメータの調整が非常に大きな荷重を占めています．現象を把握しパラメータを設定することで適切な制御方法を見出します．