Reinforcement Learning

「これからの強化学習」第1章を読んでみた

強化学習とは よく「試行錯誤しながらシステムが自ら学習を行う枠組み」と説明されます. 実際その通りで,環境におけるエージェントの状態(state),行動(action),それにより得られる報酬(reward)を定義してやり取りを行っていき,最終的に報酬を多くもらう…