2019-02-09から1日間の記事一覧

強化学習：プランニングと学習（その２）

はじめに今回は、前回の記事（強化学習：プランニングと学習（その１））の続き、迷路問題での実装を行っていきます．迷路問題に対するDyna-Qの導入では、Sutton本に記載されている例題を使って、通常のQ学習と、Dyna-Qを比べてみます．問題設定（6×9マ…