caffeで数か月作業した後、自分のモデルをうまくトレーニングすることができました。たとえば、私自身のモデルよりもさらに、1000 個のクラスで ImageNet をトレーニングできました。
現在、私のプロジェクトでは、関心のあるクラスの領域を抽出しようとしています。その後、Fast R-CNNのデモをコンパイルして実行しましたが、正常に動作しましたが、サンプル モデルには 20 個のクラスしか含まれておらず、たとえばすべてのクラスなど、さらに多くのクラスが必要です。
ImageNetのバウンディング ボックスと実際の画像を既にダウンロードしました。
今、私は空白になりました。次のステップを理解できず、その方法を説明したドキュメントもありません。私が見つけた唯一のことは、INRIA 人物モデルをトレーニングする方法であり、データセット + 注釈 + python スクリプトを提供します。
私の質問は次のとおりです。
- 見逃したチュートリアルやガイドはありますか?
- 画像を分類してバウンディング ボックスを抽出できる 1000 クラスでトレーニングされたモデルは既にありますか?
事前にどうもありがとうございました。
よろしく。
ラファエル。