1

エンド ユーザーにとってより実用的な検索結果を作成することに問題があります。問題はむしろアルゴリズムとアプローチに関連しており、使用する正確なテクノロジーまたはフレームワークに関連しています。

現時点では、次のスキーマで記述できる製品のデータベースがあります。

http://goo.gl/391qj

検索の観点からは、かなり標準的なこと、トークン アナライザーを使用したサード パーティのテキスト検索、ミスタイプと同義語の処理を行いました (これは完全なリストではありませんが、前述したように範囲外です)。しかし、検索結果を実際のユーザーのニーズに近づけるために、Google がインデックスされたページを関連性でランク付けするのと似たような方法で、追加の作業を行う必要があります。問題の解決に適用できる可能性があるとすでに考えているアイデア:

  • 広く普及している検索エンジンで最も人気のある検索リクエストを分析し (それらを取得する方法はまだ問題です)、人気のあるリクエストに対応する (見つけることができる) インデックス内のエントリのランクを上げます。
  • 最新の (ホットな) エントリのランクを上げます。
  • 人気のあるリクエストに対応し、共通点があるエントリの最大のグループのランクを上げます (それがグループである理由です)。

助けや方向性、掘る場所のアドバイスに感謝します。

4

1 に答える 1

1

pLSA を試すことができます。ウェブ上には多くのリファレンスがあり、ライブラリとソース コードがあるはずです。

編集:

最近、Lucene を詳しく調べたところ、質問が実際に尋ねたことに対して、はるかに優れた回答が得られたようです (pLSA は使用されていません)。db との統合に関しては、Hibernate Search を使用できます (ただし、Lucene ダイレクトを使用するほど強力ではないようです)。

于 2012-12-13T14:39:54.363 に答える