Caffe と DIGITS インターフェイスを使用して、LeNet で独自の画像のデータセット (信号機の画像 11x27) をトレーニングしました。99% の精度が得られ、DIGITS を介して新しい画像を提供すると、適切なラベルが予測されるため、ネットワークは非常にうまく機能しているようです。
ただし、カフェの Python/Matlab API を使用してラベルを予測するのに苦労しています。最後のレイヤー出力 (ip2) は 2 つの要素 (2 つのクラスがあります) を持つベクトルで、たとえば [4.8060, -5.2608] のようになります (最初の成分は常に正で、2 番目の成分は常に負で、絶対値の範囲は 4 から20まで)。Python、Matlab、および DIGITS での多くのテストからそれを知っています。
私の問題は:
- Argmax はこのレイヤーで直接動作できません (常に 0 になります)
- ソフトマックス関数を使用すると、常に [1, 0] が返されます (これは実際には、イメージのクラスに関係なく、
net.blobs['prob']
またはout['prob']
Python インターフェイスの値です)
では、どうすれば適切なラベルを予測できますか?
ありがとう!