1

データをトレーニング (80%) とテスト (20%) セットに分割しようとしていますが、最初にデータをシャッフルしてから、各データセットの各ラベル (y、10 クラス) に同数のサンプルを割り当てる必要があります。

ルア/トーチでこれを行うにはどうすればよいですか? ありがとう!

これはこれまでの私のコードです...

loaded = torch.load(data_file, 'ascii')
Data = {
data = loaded.data,
labels = loaded.labels,
size = 60000
}



Data.data:nDimension()
4

Data.labels:nDimension()
1

Data.data:size()
 60000
 1
32
32
[torch.LongStorage of size 4]

validationData.labels:size()
 60000
[torch.LongStorage of size 1]
4

1 に答える 1

0

シャッフルするには、以下のようなことができます。

    dataSize = Data.data:size()[1]
    shuffleIdx = torch.randperm(dataSize)
    Data.data = Data.data:index(1,shuffleIdx:long())
    Data.labels = Data.labels:index(1,shuffleIdx:long())

しかし、あなたの質問の2番目の部分についてはわかりません。

于 2016-02-08T10:04:16.407 に答える