こんにちは、MNIST データベースを使用するチュートリアルに従っています。現在、彼らは cPickle を使用してデータを解凍し、リストのタプルなどを取得しています。独自のデータを使用したいのですが、csv 形式になっています。MNIST 形式に変換する方法がわかりません。トレーニング データに 48 ユニットを使用しており、最後のユニットが望ましい結果です
私がcsvファイルを持っている方法の例:
1,2,3..........48,1
私がフォローしているチュートリアルでは、彼らはこれを使用しています:
training_data, validation_data, test_data = cPickle.load(f)
もし私が
トレーニングデータを出力
私はこれを得る:
(array([[ 0., 0., 0., ..., 0., 0., 0.],
[ 0., 0., 0., ..., 0., 0., 0.],
[ 0., 0., 0., ..., 0., 0., 0.],
...,
[ 0., 0., 0., ..., 0., 0., 0.],
[ 0., 0., 0., ..., 0., 0., 0.],
[ 0., 0., 0., ..., 0., 0., 0.]], dtype=float32), array([5, 0, 4, ..., 8, 4, 8]))
トレーニングデータを出力[0]
[[ 0. 0. 0. ..., 0. 0. 0.]
[ 0. 0. 0. ..., 0. 0. 0.]
[ 0. 0. 0. ..., 0. 0. 0.]
...,
[ 0. 0. 0. ..., 0. 0. 0.]
[ 0. 0. 0. ..., 0. 0. 0.]
[ 0. 0. 0. ..., 0. 0. 0.]]
print training_data[0][0] は各セットの値の numpy.array() であり、training_data[1][0] は float32 であり、すべてのセットの出力が必要です。
そして、私がやっているコードはこのようなものですが、プロンプトに表示される array() と dtype=float32 について混乱しています
def load(filename):
finalDataset = []
res = 0
with open(filename, 'rb') as csvfile:
lines = csv.reader(csvfile)
datos = list(lines)
for i in datos:
tempA = np.array(i[:len(datos)-2]).astype(np.float64)
tempB = np.float64(i[len(datos)-1:])
finalDataset.append((tempA,tempB))
return finalDataset