api - IBM ワトソンの視覚認識。特定のオブジェクトから X、Y 座標を取得することは可能ですか?

Question

私は大学のプロジェクトから始めており、画像内の特定のオブジェクトから座標(X、Y)をピクセル単位で見つけるのに役立つツールを探しています(テキストについては話していません)。IBM Watson Visual Recognition がこれを達成するのに役立つかどうか、またはよりうまく機能する他のツールを知っているかどうかを知りたいと思っています。

ありがとうございました。

score 1 · Accepted Answer

これは、Watson の視覚認識で「ある程度」行うことができます。まず、探しているオブジェクトを「見つける」ようにカスタム分類器をトレーニングする必要があります。ここまでできれば半分は終わりです。

2 番目の部分では、オブジェクトを見つけたい画像を取得し、それを 4 つの部分 (左上、左下、右上、右下) に分割します。次に、画像の各部分でターゲットオブジェクトを検索します。それらの象限の 1 つで見つかった場合は、その象限を 4 つの部分に分割し、画像の各部分でターゲットオブジェクトを検索します。これを繰り返して再帰的に行うと (そして、各象限とサブ象限のピクセル境界を追跡し続けると)、最終的には探しているオブジェクトを絞り込むことができます。

ここで、他の検索アルゴリズムも実行する必要があります。ターゲットオブジェクトが画像の中心にある場合を考えてみましょう。どの象限にも表示されません。オブジェクトがたまたま象限境界にまたがっている場合、正確な位置を取得できないため、複数の検索パターンが必要になりますが、戦略とアプローチは同じです。

api - IBM ワトソンの視覚認識。特定のオブジェクトから X、Y 座標を取得することは可能ですか?

2 に答える 2

Related

Reference