2

トレーニング値を提供せずにニューラルネットワークをトレーニングする方法を考えています。私の前提は、センサーから正/負のフィードバックを受け取ることができるロボットでニューラルネットワークが使用されることです。IEは、物にぶつかることなく自由にローミングするようにトレーニングするために、衝突センサーや近接センサーがトリガーされていないときに正のフィードバックが発生します。衝突/近接センサーがトリガーされると、負のフィードバックが発生します。この方法を使用してニューラルネットワークをどのようにトレーニングできますか?

私はこれをC++で書いています

4

2 に答える 2

5

あなたが説明することは、強化学習と呼ばれます。ニューラル ネットワークにも適用できますが、一般的には必要ありません。このテーマについて読むべき標準的な教科書は、強化学習:リチャード・サットンとアンドリュー・バルトによる紹介です。ニューラル ネットワークと強化学習の関係は、James McClelland によるPDP ハンドブックでもう少し詳しく説明されています。

于 2012-01-26T00:01:17.020 に答える
1

SLAMをご覧になりましたか?これは、ロボットがエリアをナビゲートしながら、同時にそのエリアのマップを作成および保持するために使用できる手法です。

于 2012-01-25T21:45:44.023 に答える