Reinforcement Learning: Day 3

Reinforcement Learningについて体系的学習
テキストは「Pythonde学ぶ強化学習、著:久保孝宏」
——————————————-
急に難解になってきたぞ!
——————————————-
まずは、コイントスにおけるEpsilon-Greedy法
実行してみると、Mac OS Xだといきなりnumpyエラー: Users/****/.cond/envs/rlbook/lib/python3.6/site-pkgs/numpyフォルダを消去して、再度、pip install numpyでエラー脱出。
——————————————-
epsilon-greedy.py

CoinTossクラスを読んで見る。

Epsilon−Greedy法に基づいて行動するAgentクラス

このあと、いろいろな方法が示されて、Actor Critic法へたどり着く(省略)。