描画およびペイントロボットのアルゴリズム-
こんにちは
画像を分析し、色や不透明度が変化する最小限のベジェパスオブジェクトを使用して、元の画像で人間の目が知覚するものをキャプチャする画像を生成するソフトウェアを作成したいと思います。
最近のTwitterスーパーコンプレッションコンテスト(stackoverflow.com/questions/891643/twitter-image-encoding-challengeを参照)とは異なり、私の目標は、画像に忠実なレプリカを作成することではなく、画像を見てください。
たとえば、元の画像の左上隅に赤い風船が表示されていて、複製の左上隅に赤い風船のように見える場合、複製の風船がまったく同じ位置ではなく、まったく同じサイズや色でもありません。
私が「人間に知覚される」と言うとき、私はこれを非常に限られた意味で意味します。私は画像の意味を分析しようとはしていません。画像が何であるかを知る必要はありません。人間の目が気付くであろう主要な視覚的特徴にのみ興味があります。実際に観察しているものを概念化する能力がないアルゴリズム。
写真の正確さに対する人間の知覚のこの珍しい基準はなぜですか?
このソフトウェアは、人間のアーティストと協力する描画およびペイントロボットを駆動するために使用されます(video.google.com/videosearch?q=mr%20squiggleを参照)。
写真的に完全ではない人間によって作成されたマークを必ずしも間違いであるとして扱うのではなく、アルゴリズムは、キャンバス上にすでにあるものを最終的な画像に組み込むように努める必要があります。
したがって、相対的な明るさ、色相、彩度、サイズ、および位置は、写真的にオリジナルと同一であるよりもはるかに重要です。フィーチャーのトポロジー、色のブロック、グラデーション、凸面および凹面の曲線を維持することは、これらのフィーチャーの正確なサイズの形状と色がより重要になります。
まだ私と一緒に?
私の問題は、「ハンマーを持っていると、すべてが釘のように見える」症候群に少し苦しんでいることです。私には、これを行う方法は、 retrievr (labs.systemone.at/を参照)で使用されるウェーブレット変換(grail.cs.washington.edu/projects/query/を参照)の比較のような遺伝的アルゴリズムを使用することであるように思われます。 retrievr /)適切なソリューションを選択します。
しかし、これを答えと見なす主な理由は、これらが私が知っている手法であるということです。おそらく、今は何もしていない手法を使用した、はるかに洗練されたソリューションがあります。
人間の視覚システムが画像を分析する方法を考慮することは特に興味深いので、おそらく直線、角度、高コントラストの境界線、および同様の色の大きなブロックに特別な注意を払う必要があります。
視覚、画像アルゴリズム、遺伝的アルゴリズム、または同様のプロジェクトについて私が読むべきことについて何か提案はありますか?
ありがとうございました
マット
PS。上記のスペルの一部は、あなたとあなたのスペルチェックに間違って見えるかもしれません。これは、お住まいの国の標準とは異なる可能性のある国際的なスペルのバリエーションです。たとえば、オーストラリアの標準:色とアメリカの標準:色