3

cv2 経由で読み込まれた numpy 配列内の画像を、畳み込み層用の深層学習ライブラリ mxnet の正しい形式に変換する必要があります。

私の現在の画像は、(256、256、3)、または (高さ、幅、チャンネル) のような形になっています。

私が言われたことから、これは実際には (3, 256, 256) または (チャンネル、高さ、幅) である必要があります。

残念ながら、numpy/python opencv に関する私の知識は、配列を正しく操作する方法を知るのに十分ではありません。

cv2.split で配列をチャネルに分割できることがわかりましたが、それらを正しい形式で再度組み合わせる方法がわかりません (cv2.split の使用が最適かどうか、または存在するかどうかはわかりません)。 numpyでより良い方法です)。

助けてくれてありがとう。

4

2 に答える 2

2

次のように使用できますnumpy.rollaxis:image(height, width, channels)

import numpy as np

new_shaped_image = np.rollaxis(image, axis=2, start=0)

これは、 の2nd 軸がスポットにあるnew_shaped_imageことを0意味します。

そうnew_shaped_image.shapeなる(channels, height, width)

于 2016-09-08T13:39:11.283 に答える