machine-learning - トレーニング値のないニューラルネットワーク学習

Question

トレーニング値を提供せずにニューラルネットワークをトレーニングする方法を考えています。私の前提は、センサーから正/負のフィードバックを受け取ることができるロボットでニューラルネットワークが使用されることです。IEは、物にぶつかることなく自由にローミングするようにトレーニングするために、衝突センサーや近接センサーがトリガーされていないときに正のフィードバックが発生します。衝突/近接センサーがトリガーされると、負のフィードバックが発生します。この方法を使用してニューラルネットワークをどのようにトレーニングできますか？

私はこれをC++で書いています

score 5 · Accepted Answer

あなたが説明することは、強化学習と呼ばれます。ニューラルネットワークにも適用できますが、一般的には必要ありません。このテーマについて読むべき標準的な教科書は、強化学習:リチャード・サットンとアンドリュー・バルトによる紹介です。ニューラルネットワークと強化学習の関係は、James McClelland によるPDP ハンドブックでもう少し詳しく説明されています。

score 1 · Accepted Answer

SLAMをご覧になりましたか？これは、ロボットがエリアをナビゲートしながら、同時にそのエリアのマップを作成および保持するために使用できる手法です。

machine-learning - トレーニング値のないニューラルネットワーク学習

2 に答える 2

Related

Reference