25

AIクラスのプロジェクトでは、テトリスの単純なゲームに勝る強化学習アルゴリズムを実装する必要があります。ゲームはJavaで書かれており、ソースコードがあります。私は強化学習理論の基礎を知っていますが、SOコミュニティの誰かがこの種のことを実際に体験したことがあるかどうか疑問に思いました。

  1. テトリスゲームで強化学習を実装するための推奨読書は何ですか?
  2. チェックする価値のある同様のことを達成する優れたオープンソースプロジェクトはありますか?

編集:より具体的であるほど良いですが、主題に関する一般的なリソースを歓迎します。

ファローアップ:

フォローアップを投稿したらいいなと思いました。

これが私が将来の学生のために最終的に得た解決策(コードと記述)です:)。

/コード

4

9 に答える 9

14

2009 年のRL-competitionをご覧ください。問題のあるドメインの 1 つは、テトリス ゲームです。一昨年もテトリスで問題がありました。これは、その年の 5 位のファイナリストからの52 ページの最終レポートで、エージェントがどのように機能したかについて詳しく説明しています。

于 2009-04-13T02:32:22.893 に答える
3

Heaton Researchの電子ブックは、ニューラル ネットワークの概念を (コードと共に) 説明するのに非常に優れています。第 4 章では、機械学習とネットワークのさまざまなトレーニング方法について説明します。ダウンロード可能なライブラリとサンプル アプリケーションを参照できます。

于 2009-04-11T17:05:00.067 に答える
3

このテーマに関する良い本は次のとおりです。

Machine Learning and Data Mining: Introduction to Principles and Algorithms
by Igor Kononenko, Matjaz Kukar (2007 年 6 月)

これらのオープン ソース プロジェクトもご覧ください。

于 2009-04-11T17:08:52.117 に答える
2

TD-Gammon、gnubackgammon、またはその他の同様のプロジェクトは、ゲームで大成功を収めました。

Sutton & Barto の著書 "Reinforcement Learning: An Introduction" には、他にもいくつかのケース スタディがあります。

于 2009-08-25T06:21:51.893 に答える
1

これは強化学習に限ったことではありませんが、スタンフォード大学はYoutubeと iTunesで機械学習に関する素晴らしい一連の講義を行っています。

リンクは、内容に飛び込むのに約 30 分かかる最初の講義へのリンクです。

于 2009-10-12T23:29:33.683 に答える
0

JavaベースのRL4Jを学ぶことをお勧めします。私はこれを使用していましたが、物事がスムーズに機能し、Actor Critic アルゴリズム (A3C と呼ばれる) を使用した強化学習アルゴリズムで LSTM ネットワークも学習できることに驚きました。

リンクは次のとおりです: https://github.com/deeplearning4j/dl4j-examples/blob/master/rl4j-examples/

于 2018-12-11T15:34:14.100 に答える