solr - Solr/Lucene は Fuzzy Field Collapse を実行できますか?

Question

編集

Solrはファジーフィールドの崩壊を行うことができますか? IEは、同一の値ではなく、類似した値を持つフィールドを折りたたんでいますか?

私はそれができると思っていましたが、今はわかりません.

元の質問

与えられた値の大規模なセットについて、どれが最も一般的かを判断する必要があります。すべての値のセットは時間の経過とともに変化するため、出力も時間の経過とともに変化する可能性があると予想できます。

Solr は「フィールドの折りたたみ」を実行して、類似性の許容範囲内で、特定のフィールドごとに結果をグループ化できると思います。Solr だけを使用してフィールドを縮小し、最も一般的な値を導出することは可能でしょうか? ビジネスの他の部分でも Solr を使用していますが、カスタムソリューションを自作するよりも、既存のコードを活用した方がよいでしょう。

score 2 · Accepted Answer

いいえ、solr はあいまいな折りたたみをサポートしていません。(少なくとも、wiki に記載されている内容には基づいていません)

Solr 4.0 は、 FunctionQuerygroup.funcの結果に基づいて結果をグループ化できるようにする機能をサポートしているため、ある時点で関数を作成しておおよそ目的を達成できる可能性がありますが、既存の関数はいずれも目的を達成しません。 .

ただし、Solr は結果のクラスタリングをサポートしているため、ユースケースでうまくいく可能性があります。クラスタリングはCarrot ²で行われます。ニンジンが使用するフィールドを 1 つのフィールドに制限すると、「ファジークラスタリング」と同様の結果が得られる可能性がありますが、フィールドを折りたたむ場合よりもニンジンの動作を制御することはできません。

通常のドキュメントの場合、すべてのフィールドをキャロットで分析したい場合があります。たとえば、次のようになります。

carrot.title=my_title&carrot.snippet=my_title,my_description

しかし、たとえば、スペルや句読点がわずかに異なるフィールドがある場合は、ニンジンにとmanufacturerの両方に対して単一のフィールドのみを与えるとうまくいくかもしれません:titlesnippet

carrot.title=manufacturer&carrot.snippet=manufacturer

solr - Solr/Lucene は Fuzzy Field Collapse を実行できますか?

1 に答える 1

Related

Reference