私は遺伝的アルゴリズムについて調べてきました。私の目的は、プレーヤー (外部の人間のプレーヤーによって制御されていない) が障害物を避けて報酬に向かう単純なシミュレーションを実装することです。
遺伝的アルゴリズムは進化的アルゴリズムに分類されることを理解しています。これは、トレーニング データを提供する必要がないため、このシナリオに最適です。それはそれ自体で学習します。
私が読んでいるこれらの紹介は、バイナリ文字列としてエンコードされている集団について話しています (私は思います)。集団と、新しい世代を生成するための集団の改良が、この問題ドメインとどのように関係しているのかわかりません。
誰か説明してくれませんか