8

何時間もの調査の結果、オブジェクト検出 API を使用したマルチラベル予測の例を見つけることができませんでした。基本的に、画像内のインスタンスごとに複数のラベルを予測したいと考えています。以下の画像のように:

ここに画像の説明を入力

衣服のカテゴリだけでなく、色やパターンなどの属性も予測したいと考えています。

私の理解では、各属性ごとにより多くの分類ヘッドを第 2 段階の ROI 機能マップに追加し、各属性の損失を合計する必要がありますか? ただし、オブジェクト検出コードでこれを実装するのに問題があります。どの関数を変更し始めるべきかについて、誰かがヒントを教えてくれますか? ありがとうございました。

4

1 に答える 1