2

こんにちは、MNIST データベースを使用するチュートリアルに従っています。現在、彼らは cPickle を使用してデータを解凍し、リストのタプルなどを取得しています。独自のデータを使用したいのですが、csv 形式になっています。MNIST 形式に変換する方法がわかりません。トレーニング データに 48 ユニットを使用しており、最後のユニットが望ましい結果です

私がcsvファイルを持っている方法の例:

1,2,3..........48,1

私がフォローしているチュートリアルでは、彼らはこれを使用しています:

training_data, validation_data, test_data = cPickle.load(f)

もし私が

トレーニングデータを出力

私はこれを得る:

(array([[ 0.,  0.,  0., ...,  0.,  0.,  0.],
       [ 0.,  0.,  0., ...,  0.,  0.,  0.],
       [ 0.,  0.,  0., ...,  0.,  0.,  0.],
       ..., 
       [ 0.,  0.,  0., ...,  0.,  0.,  0.],
       [ 0.,  0.,  0., ...,  0.,  0.,  0.],
       [ 0.,  0.,  0., ...,  0.,  0.,  0.]], dtype=float32), array([5, 0, 4, ..., 8, 4, 8]))

トレーニングデータを出力[0]

[[ 0.  0.  0. ...,  0.  0.  0.]
 [ 0.  0.  0. ...,  0.  0.  0.]
 [ 0.  0.  0. ...,  0.  0.  0.]
 ..., 
 [ 0.  0.  0. ...,  0.  0.  0.]
 [ 0.  0.  0. ...,  0.  0.  0.]
 [ 0.  0.  0. ...,  0.  0.  0.]]

print training_data[0][0] は各セットの値の numpy.array() であり、training_data[1][0] は float32 であり、すべてのセットの出力が必要です。

そして、私がやっているコードはこのようなものですが、プロンプトに表示される array() と dtype=float32 について混乱しています

def load(filename):
    finalDataset = []
    res = 0
    with open(filename, 'rb') as csvfile:
        lines = csv.reader(csvfile)
        datos = list(lines)
        for i in datos:
            tempA = np.array(i[:len(datos)-2]).astype(np.float64)
            tempB = np.float64(i[len(datos)-1:])
            finalDataset.append((tempA,tempB))
    return finalDataset
4

1 に答える 1