Theano/Lasagne の例はすべて、メモリに完全にロードできる mnist や cifar10 などの小さなデータ セットを扱っていることがわかりました。
私の質問は、大規模なデータセットでトレーニングするための効率的なコードを作成する方法です。具体的には、GPU をビジー状態に保つためにミニバッチ (リアルタイムのデータ拡張を含む) を準備する最善の方法は何ですか?
たぶん、CAFFE の ImageDataLayer を使用するのが好きですか? たとえば、すべての画像パスとラベルを含む大きな txt ファイルがあります。いくつかのコードを示していただければ幸いです。
どうもありがとうございました!