現在、ゲーム用の AI プレーヤーを作成するプロジェクトに取り組んでいます。私は UCT アルゴリズムを使用しており、対戦相手の動きの予測を追加する予定です。そのためにニューラル ネットワークを使用したいのですが、いくつかの問題が発生しました。
デフォルト プレーヤー、つまり、これまでに見たことのないプレーヤー用の基本的なニューラル ネットワークを構築したいデータが既にいくつかあります。問題は、特定の対戦相手ごとに適応するように、このネットを更新したいということです。オンライン ニューラル ネットワーク アルゴリズムを検索してみましたが、これまでのところあまり成功していません。これを実装する方法についてアドバイスをいただけますか?トレーニングを最初から完全に実行せずに、新しいデータに基づいてパラメーターを更新するにはどうすればよいですか?
コーディングは Java で行われ、Weka を使用してデータを処理しようとしました。ただし、そこで見つけた唯一のニューラル ネットワーク分類器は、多層パーセプトロンです。私は単層パーセプトロンに精通しており、その出力が確率ではないことを知っています (対数線形または単純ベイズ分類器とは対照的に)。多層パーセプトロンも生成的ではないのですか? もしそうなら、それが出力するこれらの「スコア」を確率として使用することはどれほど不正確ですか? 別のニューラル ネット アルゴリズムを使用する必要がありますか? もしそうなら、そのために利用できるJava用のライブラリはありますか?
どうもありがとうございました。