私は現在、組み合わせゲーム理論の研究を行っており、ニューラル ネットワークを使用して人工知能を開発しようとしています。これに対する私の最初のアプローチは、ゲームの統計を取得し、それらを入力として使用し、それらの入力の最大出力値を取得するために、それらの入力の最適な重み構成を開発するようにニューラル ネットワークをトレーニングすることです。入力の各セットは動きを表し、各動き (入力 x 重み) をニューラル ネットワークに渡すことで、どの動きが最大値を持つかを見つけることができます。したがって、その動きは行うのに最適な動きです。
これはすべて理論上であり、期待値を知らずにニューラル ネットワークを構築することがまったく可能であるかどうかに興味があります。これが合理的ではないと思われる場合、この種の問題を調査する必要がある他のアルゴリズムはありますか?
フィードバックをお待ちしております。よろしくお願いします。