3

次のチュートリアルに基づいて畳み込みニューラル ネットワークを作成しようとしています。

https://github.com/torch/tutorials/tree/master/2_supervised

問題は、私の画像がチュートリアルで使用されているものとは異なる寸法であることです。(3x200x200)。また、私は2つのクラスしか持っていません。

私が行った変更は次のとおりです。

1_data.lua にロードするデータセットを変更します。

nfeats = 3
width = 200
height = 200
ninputs = nfeats*width*height

nclass,noutputs

3_loss.lua と 4_train.lua で。

私のモデルは、チュートリアルでトレーニングされているものと同じです。便宜上、以下のコードを配置します。

  model = nn.Sequential()

  -- stage 1 : filter bank -> squashing -> L2 pooling -> normalization
  model:add(nn.SpatialConvolutionMM(nfeats, nstates[1], filtsize, filtsize))
  model:add(nn.Tanh())
  model:add(nn.SpatialLPPooling(nstates[1],2,poolsize,poolsize,poolsize,poolsize))
  model:add(nn.SpatialSubtractiveNormalization(nstates[1], normkernel))

  -- stage 2 : filter bank -> squashing -> L2 pooling -> normalization
  model:add(nn.SpatialConvolutionMM(nstates[1], nstates[2], filtsize, filtsize))
  model:add(nn.Tanh())
  model:add(nn.SpatialLPPooling(nstates[2],2,poolsize,poolsize,poolsize,poolsize))
  model:add(nn.SpatialSubtractiveNormalization(nstates[2], normkernel))

  -- stage 3 : standard 2-layer neural network
  model:add(nn.Reshape(nstates[2]*filtsize*filtsize))
  model:add(nn.Linear(nstates[2]*filtsize*filtsize, nstates[3]))
  model:add(nn.Tanh())
  model:add(nn.Linear(nstates[3], noutputs))

doall.lua ファイルを実行すると、次のエラーが表示されます。

 ==> online epoch # 1 [batchSize = 1]   
 /home/torch/install/share/lua/5.1/torch/Tensor.lua:462: Wrong size for view. Input size: 64x47x47. Output size: 64x1600
 stack traceback:
 [C]: in function 'error'
 /home/torch/install/share/lua/5.1/torch/Tensor.lua:462: in function 'view'
 /home/torch/install/share/lua/5.1/nn/Reshape.lua:49: in function 'updateOutput'
 /home/torch/install/share/lua/5.1/nn/Sequential.lua:29: in function 'forward'
 4_train.lua:160: in function 'opfunc'
 /home/torch/install/share/lua/5.1/optim/sgd.lua:43: in function 'optimMethod'
 4_train.lua:184: in function 'train'
 doall.lua:77: in main chunk
 [C]: in function 'dofile'
 [string "_RESULT={dofile('doall.lua' )}"]:1: in main chunk
 [C]: in function 'xpcall'
 /home/torch/install/share/lua/5.1/trepl/init.lua:630: in function 'repl'
 .../torch/install/lib/luarocks/rocks/trepl/scm-1/bin/th:185: in main chunk
 [C]: at 0x00406670 

私はこれで1日以上立ち往生しています。助けてください。

4

1 に答える 1

2

問題は、このチュートリアルの畳み込みニューラル ネットワークが、32x32 ピクセルの固定サイズの入力解像度で動作するように作成されていることです。

2 つの畳み込み/プーリング レイヤーの直後に、5x5 の解像度で 64 の特徴マップを取得します。これにより、次の全結合層に対して 64x5x5 = 1,600 要素の入力が得られます。

チュートリアルでわかるように、3D 入力テンソルを 1,600 要素の 1D テンソルに変換する専用のreshape操作があります。

-- nstates[2]*filtsize*filtsize = 64x5x5 = 1,600
model:add(nn.Reshape(nstates[2]*filtsize*filtsize))

より高い解像度の入力で作業すると、より高い解像度の出力特徴マップが生成されます。ここでは、200x200 ピクセルの入力により、サイズ 47x47 の 64 の出力特徴マップが得られます。これが、この間違ったサイズエラーが発生する理由です。

したがって、それに応じて、形状変更とそれに続く線形レイヤーを適応させる必要があります。

model:add(nn.Reshape(nstates[2]*47*47))
model:add(nn.Linear(nstates[2]*47*47, nstates[3]))
于 2015-06-20T15:43:41.190 に答える