私は tflearn を初めて使用し、入力画像が MxN グレースケールまたは MxNx3 RGB のいずれかである画像入力 - >画像出力回帰問題を解決するために CNN をトレーニングしようとしています。
メモリに収まらない非常に大きなトレーニング セットがあるため、「オンザフライ」でトレーニングし、トレーニングでイメージを使用する準備ができたら、ディスクから画像を取得したいと考えています。
image_preloader は、X が入力画像であり、y が X に対応するスカラー ラベルのセットである場合に、常に問題を解決するという前提を置いているようです。
X と y の両方が画像である回帰問題に対して、tflearn フレームワーク内で同様のことを行う最良の方法は何ですか? 明らかな何かが欠けているように感じますが、Data Utils、Data Augmentation、および Data Preprocessing セクションを調べましたが、何も表示されません。
私がやろうとしていることの全範囲について:私はディスク上に大量の画像を持っています。その場で、画像をロードし、画像にいくつかの変更を加えて、入力画像 X と y を定義できるようにする必要があります。X と y を適切に定義するには、ディスク上のイメージを拡張する必要があります。ディスクから読み取ったミニバッチ X があれば、X と ya のバッチを一度に定義できます。