2019-02-20から1日間の記事一覧

強化学習：関数近似（パラメータの更新）

はじめに前回は、近似式と目標値の差を表す誤差関数を最小化するパラメータの探索手法の１つである勾配法について整理しました．強化学習：関数近似（勾配法とか） - 他力本願で生き抜く（本気）今回は、強化学習におけるパラメータの更新について詳しく…