Lasagne/Theano で出力分類を取得する
コードを純粋な Theano から Lasagne に移行しています。チュートリアルからこの特定のコードを取得して、特定のデータを使用した予測の結果を取得し、kaggle に送信する csv ファイルを生成しました。しかし、ラザニアではうまくいきません。私はいくつかのことを試しましたが、すべてエラーが発生します。
誰かが何が悪いのかを理解するのを手伝ってくれたら嬉しいです!
ここにコード全体を貼り付けました: http://pastebin.com/e7ry3280
test_data = np.loadtxt("../inputData/test.csv", dtype=np.uint8, delimiter=',', skiprows=1)
# The inputs are vectors now, we reshape them to monochrome 2D images,
# following the shape convention: (examples, channels, rows, columns)
data = data.reshape(-1, 1, 28, 28)
test_data = test_data.reshape(-1, 1, 28, 28)
index = T.lscalar() # index to a [mini]batch
preds = []
for it in range(len(test_data)):
test_data = test_data[it]
N = len(test_data)
# print "N : ", N
test_data = theano.shared(np.asarray(test_data, dtype=theano.config.floatX))
test_labels = T.cast(theano.shared(np.asarray(np.zeros(batch_size), dtype=theano.config.floatX)),'uint8')
###target_var
#y = T.ivector('y') # the labels are presented as 1D vector of [int] labels
#index = T.lscalar() # index to a [mini]batch
ppm = theano.function([index],lasagne.layers.get_output(network, deterministic=True),
givens={
input_var: test_data[index * batch_size: (index + 1) * batch_size],
target_var: test_labels
}, on_unused_input='warn')
p = [ppm(ii) for ii in range(N // batch_size)]
p = np.array(p).reshape((N, 10))
print (p)
p = np.argmax(p, axis=1)
p = p.astype(int)
preds.append(p)
subm = np.empty((len(preds), 2))
subm[:, 0] = np.arange(1, len(preds) + 1)
subm[:, 1] = preds
np.savetxt('submission.csv', subm, fmt='%d', delimiter=',',header='ImageId,Label', comments='')
return preds
で始まる行でコードが失敗しますppm = theano.function...
。
TypeError: タイプ TensorType(float32, 3D) (Variable Subtensor{int64:int64:}.0) をタイプ TensorType(float32, 4D) に変換できません。Subtensor{int64:int64:}.0 を TensorType(float32, 4D) に手動で変換することを試みることができます。
テストデータを CNN に入力し、結果を CSV ファイルに取得しようとしています。どうすればいいですか?テスト データ全体が GPU に収まらないため、ミニバッチを使用する必要があることはわかっています。