私は Caffe とディープ ラーニングを始めていますが、HDF5 データで Caffe を使用してモデルをトレーニングするために必要な前処理手順を理解できません。具体的には、
- 画像を [0-1] の範囲に変換する必要がありますか。ノートブックの例 (00-classification.ipynb) では、モデルが [0-255] の範囲で動作することが示されていますが、一部の参照では [0-1] である必要があることが示されています。これはどうやって決めるのですか?
- ドキュメントによると、画像データのバッチの従来のブロブの寸法は、N x チャネル K x 高さ H x 幅 W です。これについて競合はありません。
- RGB から BGR への変換のチャネル スワップ ステップは必須ですか?
- HDF5データの画像平均計算を実行するには? の場合
compute_image_mean.cpp
、バックエンドは lmdb です。これはパフォーマンスを向上させるためだけですか?
LMDB の使用に関しては、質問 1 から 3 は依然として保持されます。これに関する明確化は高く評価されます。