複数カテゴリの分類を実行するいくつかの方法について、Caffeinated の説明を編集できるのではないかと考えました。
マルチカテゴリ分類とは、複数のモデル出力カテゴリの表現を含む入力データ、および/または単に複数のモデル出力カテゴリに分類可能な入力データを意味します。
たとえば、猫と犬を含む画像は、(理想的には) 猫と犬の両方の予測カテゴリに対して ~1 を出力し、その他すべてに対して ~0 を出力します。
このペーパー、この古くて閉じられた PR、およびこのオープンな PRに基づくと、caffe はラベルを完全に受け入れることができるようです。これは正しいです?
このようなネットワークの構築には、この論文の 13 ページにあるように、複数のニューロン (内積 -> relu -> 内積) とソフトマックス層を使用する必要があります。または、Caffe の ip & softmax は現在、複数のラベル ディメンションをサポートしていますか?
ラベルをネットワークに渡すとき、どちらの例が正しいアプローチを示していますか (両方ではない場合)?:
例: りんごを食べる猫注: Python 構文ですが、c++ ソースを使用しています。
列 0 - クラスは入力です。列 1 - クラスが入力されていません
[[1,0], # Apple [0,1], # Baseball [1,0], # Cat [0,1]] # Dog
また
列 0 - クラスは入力にある
[[1], # Apple [0], # Baseball [1], # Cat [0]] # Dog
何か不明な点があればお知らせください。私が尋ねようとしている質問の絵の例を生成します。