私はニューラル ネットワーク (または他のアルゴリズム) をポーカーで互いにプレイさせるプロジェクトを行っています。勝つか負けるかのたびに、ニューラル ネットワーク (または他のアルゴリズム) が損失のエラーに応じて更新されるようにします (ここでは、これがどのように計算されるかは重要ではありません)。
Weka は非常に優れており、車輪の再発明はしたくありません。ただし、Weka の API は主にデータセットからトレーニングするように設計されているようです。ゲームのプレイではデータセットを使用しません。むしろ、ネットワークが再生され、その損失に基づいてネットワークが更新されるようにします。
Weka API を使用して、データセットの代わりにネットワークを更新することは可能ですが、1 つのインスタンスで何度も何度も行うことはできますか? 私はこれについて考えていますよね?
私が実装したいもう 1 つのアイデアは、バックプロパゲーション アルゴリズムの代わりに、遺伝的アルゴリズムを使用してニューラル ネットワークの重みを更新することです。私が知る限り、Weka でニューラル ネットワークの重みを手動で指定する方法はありません。もちろん、この目的のために遺伝的アルゴリズムを使用する場合、これは非常に重要です。
助けてください:)ありがとうございます。