7

N個のサンプルサイズの選択を含む画像がある場合、どのmean-stat-equationを使用する必要がありますか?

何かを逃さないように、アドバイスをもらいたいと思っていた独特の問題があります。問題:ユーザーがさまざまな選択比率で選択した領域に基づいて、画像上で最も好まれた/高く評価された/重要な領域を見つけること。

シナリオ:犬の画像を考えてみましょう。何百人ものユーザーがこの画像の上の領域をさまざまな解像度で選択しています。ほとんどの選択で明らかに焦点が当てられている領域は、犬がいる領域です。x1、x2、y1、y2座標を記録して、それらをデータベースに入れることができます。この画像のバージョンを一連の解像度で自動的に生成したい場合は、最大の引力で領域を認識できるはずです。ユーザー。私がうまくいくと思う方法は次のとおりです。

  1. すべての選択の平均中心点を見つけ、その中の選択を基にします。-非常に単純ですが、それほど正確ではありません。
  2. K平均法やEMクラスタリングなどのアルゴリズムを使用しますが、どちらが最適かわかりません。

私の問題に対するいくつかの素晴らしい解決策を楽しみにしています

問題の詳細:実際の画像はおそらく1024x768の画像であり、その上で行われる選択は最も一般的な携帯電話の解像度になります。目的は、ユーザーの選択に基づくインテリジェントな学習によって携帯電話の壁紙を自動的に生成することです。

4

2 に答える 2

2

別の方法で問題に取り組むことができるかもしれないと思います。シームカービングについて聞いたことがない場合は、使用できるデータが完全に適しているので、チェックすることをお勧めします。画像をトリミングしてサイズを変更する代わりに、必ずしも直線ではないピクセルのパスを削除できるという考え方です。これにより、より多くの「興味深い」情報を保持しながら、画像のサイズを変更できます。

通常、エネルギーが最小のパスを選択します。ここでのエネルギーは、パスに沿って色相/強度がどの程度変化するかを測定したものです。これは、画像の非常に重要な領域(犬の顔など)があるが、それらの領域のエネルギーが必ずしも非常に高いとは限らない場合は失敗します。画像のどの部分が非常に重要であるかを示すユーザーデータがあるので、誰かがそのピクセルの領域を選択するたびに、ピクセルに少しのエネルギーを明示的に追加することで、画像のそれらの領域を確実に切り分けることができます。

このビデオは、シームカービングの動作を示しています。これを使用するとは思わない場合でも、見るのはクールです。試してみる価値はあると思いますが、以前はいくつかの興味深いサイズ変更アプリケーションに使用したことがあり、実際には非常に簡単に実装できます。

于 2012-06-04T17:03:34.420 に答える
2

上記の2 つの明確な問題があると思います。

ONE: ポイントの識別

このためには、ポイントを考慮する必要があるかどうかを識別するための何らかのヒューリスティックを開発する必要があります。

何百人ものユーザーがこの画像の選択場所になるとおっしゃっていたと思いますか? 数百は、クラスター化するポイントが多い場合があります。外れ値を除外することを検討してください (特定の距離内に特定の数の近傍を持たないポイントを削除することによって)

データセットを減らすためにできることは何でも役に立ちます。


2: ポイントのクラスタリング

K Means Clustering がこの特定の問題に最も適していると思います。 リンク

あなたの特定の問題は、このアルゴリズムの説明で使用される標準のデカルト座標クラスタリングの例をよく反映しているようです。

あなたがやろうとしていることは NP-Hard のように見えますが、古典的な近似で満足するはずです。

クラスター化したら、そのクラスター内のポイントの平均をとって、かなり正確な概算を行うことができます。

更に:

あなたのデータセットは、すでに密集しているように聞こえます。(つまり、ほとんどの人は、胴体の側面ではなく、犬の顔を選びます。) 極小値に注意する必要があります。リンクこれらは、アルゴリズムに実際にレンチを投げることができます. 特にクラスタ数が少ない場合。これに対抗するには、少し動的プログラミングが必要になる場合があることに注意してください。通常、アルゴリズムにある程度の分散を導入して、平均点がこれらの極小値から「飛び出す」ようにすることができます。極小値/極大値

お役に立てれば!

于 2012-06-04T14:44:08.990 に答える