0

テキストを検索し、検索されたテキストを逆索引で見て、対応する Web ページのセットを作成し、対応する Web ページをスローする検索エンジンがあります。

ここで、もう 1 つ機能を追加します。つまり、色に応じて検索します。

たとえば、「RED SHOES」を検索すると、逆インデックス データ構造にあるすべての赤い靴が表示されます。

同じアルゴリズムについて私が考えたことは、

  1. 別の場所で画像のデータ構造を作成します。
  2. ジャケットの画像と同じように、画像を見つけるたびに、何らかの色検出アルゴリズムを使用してすべての色を計算します。
  3. そのイメージをすべてのカラー インデックスに入れます。

「赤い靴」のような検索が来たら、これがクローリングに対する私のアプローチです。赤色のインデックスで見て、対応する赤色のアイテムを見つけます。

これは私のアルゴリズム構築フェーズです。そのため、上記のアルゴリズムのコードを記述していません。正しいアプローチを取得したら、コーディング フェーズを開始します。

では、お勧めを教えてください、

それは良いアルゴリズムですか?また

必要な最適化や変更はありますか? もしそうなら、親切にその変更を私と共有/議論してください.

前もって感謝します。あなたの親切な対応を求めています。

4

1 に答える 1

1

スケーラブルな検索エンジンの場合、ほぼ確実に、画像分析を使用しないほうがよいでしょう。<img>代わりに、egタグ内の属性のテキストによって画像のインデックスを作成することを検討してください。たとえば、画像の代替テキストが の場合、"red shoes"そのテキストの下に画像をインデックス化できます。後で を検索する"red"と、画像が返される可能性があります。

この種の画像分析を真剣に行う場合は、画像マジックなどのライブラリを使用してカラー ヒストグラムを計算できます。次に、クラスタリング モデルまたは決定木だけを適用して、特定の範囲内の大量の色に注目し、一連のカラー タグ ( 、 、 など) を宣言し"red""rouge""vermillion"画像のインデックスを作成することができます。

あなたが完全に狂っていると感じているなら、ヒストグラム自体でコサイン類似度を行うことができます. これにより、画像をクエリとして送信できます。どういうわけか、それはあなたが念頭に置いていることではないと思います。

于 2013-02-28T04:06:10.407 に答える