私はcntkとpythonが初めてです。私は、TrainResNet_CIFAR10.py に基づいて 4736 個の (64x64x3) 画像をトレーニングし、4 つのクラスで 2180 個の画像をテストする Python プログラムを作成しました。160 エポックのトレーニング後、損失 = 0.663、メトリック = 29.37% になりました。終了評価指標 = 18.94%。CNTKLibraryCSEvalExamples.cs に基づいて列車モデルを評価して 2180 枚の画像をテストすると、ほぼすべての 2180 枚が 1 つのクラス (2 番目のクラス) に分類されます。私の質問は次のとおりです。
- 損失は cross_entropy_with_softmax(z, label_var) から計算され、メトリックは classification_error(z, label_var) を使用していると仮定します。私は正しいですか、実際にどのように決定されますか?
- 指標 = 29.37% と評価指標 = 18.94% の意味は何ですか? それらはそれぞれトレーニング画像とテスト画像からのものですか?
- 完全に間違った評価結果を引き起こす可能性があるのは何ですか?
どんな助けでも大歓迎です。