0

特定の画像に似た画像を検索できるドメイン固有の画像検索アプリケーションを構築することに興味があります。少しグーグルフーを使って、このサイトでこの質問を見つけることができました。最高評価の回答を正しく理解している場合、ライブラリに各画像の輝度データを保存することで、私がやろうとしていることを達成できます。

これで問題ありませんが、25,000 以上のレコードをすばやく検索して比較する方法が必要です。私はPostgreSQLを使用していたので、すぐに思いつきました。私が直面している問題は、3 色にわたる 256 個の個別の可能な値の輝度データを格納するには、768 列のテーブル ( r0,g0,b0,...,r255,g255,b255) が必要であり、すべてのレコードで類似性を効果的に検索するには、768 個のインデックスが必要になることです。これまでこのレベルで大規模なデータを実際に扱ったことはありませんが、その数は少し扱いに​​くいように思えます (わかりませんが、私の経験はこの領域には及んでいません)。

私のもう 1 つのアイデアは、輝度データを 1 つの大きなテキスト列 (次のようにフォーマットr0:rrr g0:ggg b0:bbb ... r255:rrr g255:ggg b255:bbb) に格納し、その列に全文検索インデックスを作成して、データ全体で類似の画像を検索できるようにすることです。

もう 1 つの可能性は、クエリ ヒストグラムと保存されたヒストグラムの間のハミング距離を使用することですが、データベース内のすべてのレコードに対して迅速に実行できるとは思いません。

私はこれに正しい方法でアプローチしていますか?また、データセット全体で高速なリアルタイム検索を提供できるリレーショナル データベースの代替手段についてもオープンです。

4

1 に答える 1

0

各画像を 3 次元空間に配置しているようです。地理空間/多次元クエリ エンジンを調べてみましたか。あなたのアプローチでは、同様の画像が 3 空間で互いに接近している必要があります。

于 2012-08-07T21:28:21.250 に答える