強化学習アルゴリズム入門: 「平均」からはじめる基礎と応用
曽我部 東馬, 電気通信大学
オーム社, 2019
ISBN: 9784274223716;
言語: 日本語
平均という初歩的な数学を入口として、「価値」「探索」「マルコフ性」といった強化学習の基本をわかりやすく解説します。また、各アルゴリズムについては、「多腕バンディット問題」および「グリッドワールド問題」のいずれかを用いて、比較しやすい状態で解説します。そのため、各アルゴリズムの特徴や差異がわかりやすくなっています。さらに、中核的なアルゴリズムについては MATLAB のコードを配布しており、コードを実行することで「原理→数式→プログラム」という一連の流れを直感的に把握できます。
本書の特徴
- 難解な強化学習の原理を、中高生にもなじみ深い「平均値の計算」という観点からわかりやすく解説
- さまざまなアルゴリズムを、共通する例題を用いて特徴がわかりやすいように比較
选择网站
选择网站以获取翻译的可用内容,以及查看当地活动和优惠。根据您的位置,我们建议您选择:。
您也可以从以下列表中选择网站:
如何获得最佳网站性能
选择中国网站(中文或英文)以获得最佳网站性能。其他 MathWorks 国家/地区网站并未针对您所在位置的访问进行优化。
美洲
- América Latina (Español)
- Canada (English)
- United States (English)
欧洲
- Belgium (English)
- Denmark (English)
- Deutschland (Deutsch)
- España (Español)
- Finland (English)
- France (Français)
- Ireland (English)
- Italia (Italiano)
- Luxembourg (English)
- Netherlands (English)
- Norway (English)
- Österreich (Deutsch)
- Portugal (English)
- Sweden (English)
- Switzerland
- United Kingdom (English)