1

私は、自然言語モードで MySQL を使用した情報検索システムに取り組んでいます。私が持っているデータには、さまざまなカテゴリを考慮するように注釈が付けられています。例えば。サル、ネコ、イヌは「動物」、アヒル、スズメは「鳥」として注釈が付けられます。問題は、これらのタグの出現に基づいてドキュメントを取得していることです。

現在、MySQL には、特定の用語がデータ全体の 50% を超えて含まれる場合、その用語は考慮されないという制限があります。私の要件を考慮して、特定の用語がデータ全体の 50% を超えている場合でも、一致するすべての用語をスコア付けしたいと考えています。

検索効率のためにSphinxとMySQLを組み合わせることについて読んだことはほとんどありませんが、これが私の状況に適用できるかどうかはわかりません.

この問題の解決策を教えてください

4

1 に答える 1

1

Sphinxは、非常に高速な全文検索に非常に優れています。mySQLの50%のルールはありませんが、mySQLの全文検索の代わりに使用する必要があります。基本的には、Sphinxをインストールし、インポートを設定してすべてのmySQLデータをSphinxにコピーします。次に、SphinxSEをビルドするか、ライブラリを介して直接Sphinxにクエリを実行して、結果を取得できます。次に、mySQLにクエリを実行して、結果の詳細を取得できます。

私はSphinxSEを使用しています。これは、mySQLを介してSphinxにクエリを実行し、mySQLテーブルを単一のクエリで結果に結合できるためです。とてもいいです。

于 2012-05-07T16:46:17.197 に答える