2

画像内の特定のオブジェクトを認識するための分類子をトレーニングしています。私は Watson Visual Recognition API を使用していますが、同じ質問が他の認識 API にも当てはまると思います。

何かの写真を 400 枚集めました。たとえば、犬です。

Watson をトレーニングする前に、物事を台無しにする可能性のある写真を削除できます。次の写真を削除する必要がありますか:

  1. 複数の犬
  2. 別の動物と一緒の犬
  3. 人と犬
  4. 部分的に隠れている犬
  5. 眼鏡をかけた犬

また、白い背景の犬はより良いトレーニング サンプルになりますか?

ワトソンも否定的な例を取ります。猫やその他の小動物は悪い例でしょうか? ほかに何か?

4

1 に答える 1

5

vize.itclarifaiIBM Watson自分でニューラル ネットワークを訓練するなど、あらゆる種類のカスタム分類器と認識器にとって、これが一般的な問題であることは間違いありません。(使用する必要があるサンプル画像の数でソートされています。)

質問する必要がある重要なことは、分類器をどのように使用するかということです。表示されるオブジェクトを予測するためにマシンに入力する実際の画像は何ですか? 原則として、トレーニング画像は、描写するもの (オブジェクトの種類と種類) と描写方法 (背景など) の両方において、可能な限り予測時間画像に似ている必要があります。ニューラル ネットワークは非常に強力で、十分な数の画像を与えれば、困難なケースも学習します。

家族の写真、スクリーンショット、ドキュメントのスキャンなど、ユーザーのフォルダで犬の画像を見つけたいと思うかもしれません。その多様性をトレーニング セットに反映します。別の動物と一緒にいる犬を犬の写真としてタグ付けする必要があるかどうかをユーザーに尋ねます。

荒野のフォト トラップで犬の画像を見つけたいと思うかもしれません。そのフォト トラップ (ネットワーク全体の場合は複数のフォト トラップ) で撮影したさまざまな画像を使用するだけです。

要するに、サンプル画像を目前のタスクに合わせて調整してください!

于 2016-10-31T19:21:49.427 に答える