Watson Image Recognition (IR) demoでは、アプリに画像を与えると、アプリが画像を分類し、画像に何が含まれているかを教えてくれます。それはどのようにこれを達成しますか?
ドキュメントからわかる限り、ポジティブとネガティブのイメージしか与えられず、「はい」、これはピザです、または「いいえ」、これはピザではありませんとしか言えません。ピザなのかパスタなのかは特定できません。
これを達成する方法はありますか?
Watson Image Recognition (IR) demoでは、アプリに画像を与えると、アプリが画像を分類し、画像に何が含まれているかを教えてくれます。それはどのようにこれを達成しますか?
ドキュメントからわかる限り、ポジティブとネガティブのイメージしか与えられず、「はい」、これはピザです、または「いいえ」、これはピザではありませんとしか言えません。ピザなのかパスタなのかは特定できません。
これを達成する方法はありますか?
このサービスは、分類子のコレクションを使用して機能します。各分類子は 1 つのタグのみを対象としており、独自のポジティブ イメージとネガティブ イメージのセットを使用してトレーニングする必要があります。ピザとパスタを比較するには、2 つの分類子を作成し、それぞれをポジティブ イメージとネガティブ イメージでトレーニングする必要があります。(しかし、その特定のケースでは、ピザの否定的なイメージはパスタの肯定的なものである可能性があり、逆もまた同様です.
かなり広い範囲のタグを持つ利用可能な分類子のデフォルトのコレクションがあり、そのすべてがこの方法でトレーニングされています。デモでは、そのデフォルト コレクション + AlchemyVision (より広い範囲の分類がありますが、トレーニング可能ではありません) の組み合わせを使用していると思います。github でデモのソース コードを確認できます。
Visual Recognition サービスの資料でもう少し詳しく読むことができます: http://www.ibm.com/smarterplanet/us/en/ibmwatson/developercloud/doc/visual-recognition/index.shtml