- 私はRL&NNとのプロジェクトに取り組んでいます
- ニューラルネットワークに供給されるアクションベクトル構造を決定する必要があります..
私は 3 つの異なるアクション (A & B & Nothing) をそれぞれ異なるパワー (例: A100 A50 B100 B50) で持っています。最良の結果を得るために、これらのアクションを NN にフィードする最良の方法は何でしょうか?
1- 入力 1 に A/B をフィードし、入力 2 にアクション パワー 100/50/何も入力しない
2- A100/A50/Nothing を入力 1 にフィードし、B100/B50/Nothing を入力 2 にフィードします。
3- A100/A50 を入力 1 にフィードし、B100/B50 を入力 2 にフィードし、Nothing フラグを入力 3 にフィードします。
4- また、100 & 50 をフィードするか、2 & 1 に正規化しますか?
1 つの方法を選択する理由が必要です。任意の提案をお勧めします
ありがとう