価格:3190円(10%税込) 発売:2021年11月20日

「強化学習」の理論がわかる&Pythonで実装できる

 「強化学習」とは、簡単に言えば、「試行錯誤によって学習するAI」です。機械学習の一種で、近年のディープラーニング技術の発展によって、注目されています。

 強化学習の理論を学ぶには高度な数学やプログラムの知識が必要で、なかなかハードルが高いのが現実です。

 本書は、高校数学の知識があれば理解できるように、機械学習の前提知識や「期待値」などの考え方から一歩一歩解説しています。基本のアルゴリズムからニューラルネットを使った応用まで、強化学習の理論と実装がわかります。

 サンプルプログラムはPythonですぐに動かせます。パソコンの画面上でロボットのアニメーションを動かし、強化学習の問題や学習結果を確認することができます。Pythonの基本や主要なライブラリの使い方も一部解説しています。本書を読み終わったあとは、ぜひ、自分で強化学習の問題やアルゴリズムを改良してみてください。




本ムックのサンプルプログラム(掲載プログラム)は<こちら>からダウンロードできます。



<訂正>2021年11月16日

講座B Pythonの基本
・p.365の下から3行目

誤:__init__()という必ず定義しなくてはいけないメソッドと、
正:__init__()という初期化用のメソッドと、

<訂正>2022年1月4日

4章 強化学習の問題設定
・p.129の下から3行目

誤:=(−1)+0.5×(−1)+0.52×(−1)+0.53×(−1)=−1.111
正:=(−1)+0.1×(−1)+0.12×(−1)+0.13×(−1)=−1.111

5章 基本のQ学習:tableQ
・p.135の本文の下から1行目

誤:Vの更新を100回繰り返し、
正:Vの更新を60回繰り返し、

以上、お詫びして訂正いたします。
情報は随時更新いたします。