Caffe と Theano になるまでに、さまざまな深層学習フレームワークを学習 (および比較) しようとしています。
http://caffe.berkeleyvision.org/gathered/examples/mnist.html
と
http://deeplearning.net/tutorial/lenet.html
チュートリアルに従って、これらのフレームワークを MNIST データセットで実行します。ただし、精度とパフォーマンスの点でかなりの違いがあることに気付きました。
Caffe の場合、精度が最大 97% まで上がるのは非常に高速です。実際、プログラムを完了するのに 5 分しかかからず (GPU を使用)、テスト セットでの最終的な精度は 99% を超えています。なんて印象的!
ただし、Theano では、はるかに貧弱です。92% のテスト パフォーマンスを達成するだけで、(同じ GPU を使用して) 46 分以上かかりました。
同じデータセットで比較的同じアーキテクチャを実行しているフレームワーク間にそれほど大きな違いはないはずなので、私は混乱しています。
だから私の質問はです。Caffe によって報告される精度の数値は、テスト セットでの正しい予測のパーセンテージですか? もしそうなら、不一致の説明はありますか?
ありがとう。