現在、私はcaffe imagenet の例に従っていますが、それを自分のトレーニング データ セットに適用しています。私のデータセットは約 2000 クラスで、各クラスは約 10 ~ 50 枚の画像です。実際に車両画像を分類していたのですが、画像が正面にトリミングされていたため、各クラス内の画像は同じサイズ、同じ画角 (ほぼ) です。
imagenet スキーマを試してみましたが、うまくいかなかったようで、約 3000 回繰り返した後、精度が 0 になりました。スキーマを調整する方法に関する実用的なガイドはありますか?