一連の画像と一連のグラウンド トゥルース画像を LMDB データベースに変換しています。目的はピクセル単位の予測です。CxHxW
RGB 画像から LMDB を作成するためのほとんどのコードには、次のように順番に転置を示す行があります。
im = im.transpose((2,0,1)) # convert to CxHxW
画像データ (トレーニング データと対応するグラウンド トゥルース画像の両方) はグレースケール (つまり、単一チャネル) です。私の質問は、この行の目的は何single channel
ですか?画像とグラウンドトゥルースに対してこの行列転置を行うべきですか、それとも必要ありませんか?
あなたの助けに感謝します。