Reinforcement Learning: Day 4

Reinforcement Learningについて体系的学習
テキストは「Pythonde学ぶ強化学習、著:久保孝宏」
——————————————-
Day 4、88頁もあるぞ。とても一日では終わらないけど、
この本の中心的課題と想像し、おそらく大事!
一週間くらいかかるかなあ。
——————————————-
前半は、ニューラルネットワークの説明部分。TensorFlowの導入は面白い。

ここで、Sequenceモデルは、層を積み上げるだけの単純なモデル。
K.layers.Denseで入力2つ、出力4つ

——————————————-

——————————————-
で、誤差逆伝播法(Bckpropagation)が、ボストン住宅価格データセットで提示される


次に畳み込みニューラルネットワークConvolutional Neural Network: CNNによる数字の認識

次は、ニューラルネットワークの実装
モジュール構成:
Agent
Trainer
Observer
Logger

だいたいの理論は把握できた。Deep−Q Network以下は一旦、休憩ということで、おいておく。