チェッカー ゲーム用のニューラル ネットワークを開発しています。私たちの訓練データでは、
0 は空白セル、1 は白の駒、-1 は白のキング、2 は黒の駒、-2 は黒のキングを表します。
したがって、必要なのは範囲 [-2, 2] 内のアクティベーション関数です。どのアクティベーション関数を使用する必要がありますか? これに関するあなたの提案を教えてください。
チェッカー ゲーム用のニューラル ネットワークを開発しています。私たちの訓練データでは、
0 は空白セル、1 は白の駒、-1 は白のキング、2 は黒の駒、-2 は黒のキングを表します。
したがって、必要なのは範囲 [-2, 2] 内のアクティベーション関数です。どのアクティベーション関数を使用する必要がありますか? これに関するあなたの提案を教えてください。
状態のエンコードが最適ではありません。通常、ニューラル ネットワークは、カテゴリの 1-of-c エンコーディングでより適切に機能します。次に、シグモイドユニットを使用するのは簡単です。状態を判断するには、5 つの出力の argmax を取得するだけです。