2

私は裏庭のpythonを派手な用語を一切使わずに学んだようで、ピクルスファイルのこの説明に出くわしました...

「ピクルス化されたファイルは、トレーニング セット、検証セット、およびテスト セットの 3 つのリストのタプルを表します。3 つのリストのそれぞれは、画像のリストと各画像のクラス ラベルのリストから形成されたペアです。画像は、0 から 1 の間の 784 (28 x 28) の float 値の numpy 1 次元配列として表されます (0 は黒を表し、1 は白を表します)。ラベルは、画像が表す数字を示す 0 から 9 の間の数字です。

( http://deeplearning.net/tutorial/gettingstarted.htmlより)

私は頭の中でそれを視覚化しようとしています(これは彼らがピクルスにしたいフォーマットなので、私はそれを変更することはできません)、それはファイルが

(1) 3 つのリスト。それぞれが 2 つのリストで構成されています。1 つは画像付き、もう 1 つはラベル付きです。

(2) 3 つのリスト。それぞれがタプルで構成されます (tuple[0] は画像で、tuple[1] はラベルです)。

または、他の何か?

4

2 に答える 2

4

データのトポロジを調査する方法は次のとおりです。

In [1]: import cPickle
In [2]:
In [3]: f = cPickle.load(open('mnist.pkl', 'rb'))

In [4]: type(f)
Out[4]: tuple

In [5]: len(f)
Out[5]: 3

In [6]: type(f[0])
Out[6]: tuple

In [7]: len(f[0])
Out[7]: 2

In [8]: type(f[0][0])
Out[8]: numpy.ndarray

In [9]: len(f[0][0])
Out[9]: 50000

In [10]: f[0][0].shape
Out[10]: (50000, 784)
于 2013-06-13T18:55:15.773 に答える
2
training_set is ([image,image,image,...],[label,label,label,...])
validation_set is ([image,image,image,...],[label,label,label,...])
testing_set is ([image,image,image,...],[label,label,label,...])

1 つのトリプルとしてまとめます。

(
    ([image,image,image,...],[label,label,label,...]),
    ([image,image,image,...],[label,label,label,...]),
    ([image,image,image,...],[label,label,label,...])
)

「学習者」はトレーニング セットから学習し、検証セットから学習した内容を検証します。その後、テスト セットは「実世界」のライブ データになります。

于 2013-06-13T18:53:12.457 に答える