5

で数か月作業した後、自分のモデルをうまくトレーニングすることができました。たとえば、私自身のモデルよりもさらに、1000 個のクラスで ImageNet をトレーニングできました。

現在、私のプロジェクトでは、関心のあるクラスの領域を抽出しようとしています。その後、Fast R-CNNのデモをコンパイルして実行しましたが、正常に動作しましたが、サンプル モデルには 20 個のクラスしか含まれておらず、たとえばすべてのクラスなど、さらに多くのクラスが必要です。

ImageNetのバウンディング ボックスと実際の画像を既にダウンロードしました。

今、私は空白になりました。次のステップを理解できず、その方法を説明したドキュメントもありません。私が見つけた唯一のことは、INRIA 人物モデルをトレーニングする方法であり、データセット + 注釈 + python スクリプトを提供します。

私の質問は次のとおりです。

  • 見逃したチュートリアルやガイドはありますか?
  • 画像を分類してバウンディング ボックスを抽出できる 1000 クラスでトレーニングされたモデルは既にありますか?

事前にどうもありがとうございました。

よろしく。

ラファエル。

4

1 に答える 1

4

Ross Girshik 博士は、物体検出に関して多くの研究を行ってきました。高速な RCNNに関する彼の詳細な git から多くのことを学ぶことができます: デモのある caffe ブランチを見つけることができるはずです。私自身は使っていませんが、とても分かりやすいようです。

興味深いと思われるもう 1 つの方向性はLSDAです。弱い監視を使用して、多くのクラスのオブジェクト検出をトレーニングします。

ところで、faster-rcnnを調べましたか?

于 2015-10-13T11:21:26.903 に答える