人間と同じ時間スケールでコンピューターにゲームを学習させるようなアルゴリズムや技術を頭の中で思いついたわけではありません。しかし、時間スケールについて話すときは注意が必要です。
たとえば、Fogel と Chellapilla によって開発された手法があります。これは、ランダムに生成された一連のニューラル ネットワークを互いに対戦させ、遺伝的アルゴリズムを使用して、結果に基づいて新しくより優れたニューラル ネットワークを作成します。これはもともとチェッカーで行われていましたが、多くのゲームに適用できます。この手法は、少なくとも人間のトレーニングの負担を取り除きます。ネットワークは自分自身と戦っています。
しかし、それはどのくらいの速さで学習するのでしょうか? Fogel と Chellapilla は、わずか約 250 世代のチェッカーで高品質の結果 (クラス A の成績で、Expert の評価をわずかに下回っています) を獲得しました... しかし、各世代のトーナメントには約 150 の個別のゲームが含まれ、合計で約 37,000 のゲームが行われました。1日に1回ゲームをするとしたら、100年かかる計算になります。そのレベルでプレイする人は、1 日 10 試合を 10 年間プレイしているかもしれませんが、そうは思えません。そういう意味では人間より遅い。一方、優れたラップトップはおそらく、1 週間にこれほど多くのゲームをプレイできますが、これは人間には不可能なことです。
したがって、人間がトレーニングを行い、妥当な規模でパフォーマンスの向上を実感できるトレーニング ルーチンを探しているなら、今日、それを実現できるものを私は知りません。(これは当然のことです。私たちの最高のスーパーコンピューターはまだ人間の脳の生の処理能力を持っておらず、その多くの能力を活用するように設計されたアルゴリズムはまだありません。)
ただし、不完全な AI を探しているだけの場合は、Fogel や Chellapilla のような手法を試して、究極の、ほぼ専門家に評価された結果を取得する代わりに、実行の途中から何かを取得するか、最後から何かを取得することができます。世代ですが、最良の結果ではありません。