2

現在、削減されたデータを別のニューラルネットワークに使用するために、入力データサイズを削減するためにオートエンコーダーを使用したいと考えています。私の仕事は、ビデオを撮り、ビデオの画像をオートエンコーダーに渡すことです。入力として少数の画像のみを使用する場合、オートエンコーダーはうまく機能しますが、画像のシーケンスが必要な場合は機能しません。

動いているボールからビデオを撮ることを想像してみてください。たとえば、200 枚の画像があります。オートエンコーダーを 200 枚の画像に使用すると誤差は大きくなりますが、5 枚の画像にのみ使用すると再構成誤差は小さく許容範囲内です。オートエンコーダーは、循環するボールのシーケンスまたは時間的な動きを学習していないようです。スタックされたオートエンコーダーも表示しようとしましたが、結果は良くありません。

問題が何であるかを知っている人はいますか、またはこのタスクにオートエンコーダーを使用することは可能ですか?

4

1 に答える 1