強化学習アルゴリズムで値関数を近似するためにニューラル ネットワークを使用する予定です。状態とアクションを表現する方法に一般化と柔軟性を導入するために、これを行いたいと考えています。
現在、ニューラル ネットワークはそれを行うための適切なツールであるように見えますが、私は AI の専門家ではないため、ここでの可視性は限られています。特に、ニューラル ネットワークは最近、サポート ベクター マシンなどの他の技術に取って代わられているようですが、これがファッションの問題なのか、それともニューラル ネットワークに私のアプローチを破滅させる可能性のある実際の制限があるのか はわかりません。何か提案はありますか?
ありがとう、
トゥヌズ