6

ミュージシャンのウェブサイトから .jpeg をいくつか持っています。これらの画像は、今後のショーのポスターとバンドの写真 (実際のバンドの写真) で構成されています。

ポスターの例を次に示します。

ここに画像の説明を入力

私は現代の技術やアルゴリズムに精通していません (存在する場合)。

  • 画像内のテキストは、通常、ポスターの死んだ景品です。
  • 現実的な写真 (つまり、ポスターではないもの) は、異なる色分布に従っているのでしょうか?
  • ポスターに顔が写っている可能性はおそらく低いですが、それはかなり弱い主張です。

画像がポスターかどうかを検出できる分類アルゴリズムはありますか?

4

1 に答える 1

11

あなたの質問は非常に広いです。ポスター写真は明確なオブジェクトではありません。ポスターとは?実生活では、ポスターは写真、写真の組み合わせ、または少し修正された写真であることがよくあります。

あなたの質問の最初の部分で言及されているバンドの写真と今後のショーのポスターに絞り込むと、答えはおそらくイエスです(私は誰もそれをやっているのを見たことがありませんが. バイナリ分類器を探しているので、いくつかの機械学習モデルを使用することをお勧めします (単純ベイズで十分ですが、より複雑な機能を使用する場合は、SVM、ELM、またはランダム フォレスト/デシジョン ツリーを試してください)、それを適用します。以下を含むベクトルでエンコードされたデータに:

バイナリ機能:

  • 「画像に何か言葉はありますか?」- 外部テキスト検出アルゴリズムが必要です
  • 「画像に番号はありますか」 - イベントには日付が必要です
  • 「画像に日付はありますか」
  • 「画像に顔はありますか」

Naive Bayes を使用すると、条件付き確率などを構築できますP(poster|there is a word)。これにより、分類子が得られるだけでなく、機能がどれほど重要であるかについての洞察も得られます (特定の機能が役に立たないという示唆にP(poster|there is a number)近い確率)。0.5

非常に大きなトレーニング セットを作成する場合を除き、可能な写真、フォト セッション スタイルなどの範囲が広いため、ヒストグラムなどは使用しません。

これで十分でない場合は、これらをより複雑な機能に変更し、単純ベイズよりも強力な分類器を使用できます。

複雑な機能:

  • 画像には何文字ありますか?
  • 画像にはいくつの数字がありますか?
  • 画像にはいくつの日付がありますか?
  • 画像にはいくつの顔がありますか?
  • 画像ヒストグラム

最後のオプションとして、すべてが失敗した場合は、Deep Belief Network などの最新のモデルを未加工の画像でトレーニングすることができます。それにはかなりの計算能力が必要ですが、結果は科学界にとっても非常に価値があります。

于 2013-08-20T12:01:46.813 に答える