0

私は他のクラスとは少し異なる機能を持つクラスを持っています: ex - この画像にはバックルが付いています (クラスと考えてください)ブラック-1000006329245-822018_01-345.jpg

しかし、この画像はそれに非常に似ていますが、バックルがありません :

実際にピクセルからピクセルへの値を学習するこの種のケースでどのモデルを使用するかについて、私は少し混乱しています。

どんな考えでもかなりの価値があります。ありがとう !!

私はすでにInception、Resnetなどのモデルを試しました.

より少ない量のトレーニング データ (各クラスで 300 ~ 400) を使用すると、良好な再現率/精度/F1 スコアに到達できます。

4

1 に答える 1

0

データセットが小さいため、転移学習を検討することをお勧めします。できることは、転送された ResNet モデルを使用して特徴抽出器として機能させ、その上で YOLO (一度だけ見る) アルゴリズムを試し、各ウィンドウを調べます (見てください)。 ConvNets を使用したスライディング ウィンドウの実装) を使用してベルトのバックルを取得し、それに基づいて画像を分類できます。

データセットに関する私の理解に基づいて、上記のアプローチを実行するには、YOLO アルゴリズムの要件に従ってデータセットに再度注釈を付ける必要があります。

上記のアプローチの例を見るには、https://mc.ai/implementing-yolo-using-resnet-as-feature-extractor/にアクセスしてください。

編集XML 注釈付きデータセットがあり、上記の例に従うためにそれを csv に変換する必要がある場合は、https://github.com/datitran/raccoon_datasetを使用します

楽しいモデリング。

于 2019-01-23T06:55:21.260 に答える