search - 複数の引数でのCarrot2クラスター

Question

ハロー、

SolrとCarrot2を使用するSearchEngineに取り組んでいます。

すべてが順調ですが、キャロットは私が理解できない奇妙なことをします。Solrから結果を取得し、Carrotを使用してそれらをクラスター化したい。私はすべてを統合し、それはうまく機能しますが、Carrotは私の属性の1つだけにクラスタリングしています。結果に一致し、他の属性に一致しないもの。好き：

データ

名前：ピータータウン：ロンドン趣味：ゴルフ、スキー

名前：アーサー町：ベルリン趣味：ゴルフ、サイクリング

名前：パリ町：ロンドン趣味：ゴルフ、ハイキング

検索：ゴルフ

クラスターのようなもの：スキー、サイクリング、ハイキング

..しかしロンドンではありません。

それだけでは驚きませんが、CarrotClusteringWorkbenchを使用すると、他の引数でクラスター化されます。

最初に、ワークベンチからSolrconfigに構成をエクスポートしようとしましたが、何も変更されませんでした。Solrは構成を使用しますが、この問題に変更を加えるものはありません。

誰かが私を助けたり、それを説明したりできますか？

score 0 · Accepted Answer

クラスター化するフィールドの名前をsolrconfig.xmlに入れる必要があります。Carrot2 Clustering Workbenchで機能した構成を複製するには、これらをクラスタリング要求ハンドラーに配置します（またはクエリURLで指定します）。

<!-- In Workbench this is "Title field name" -->
<str name="carrot.title">name</str>

<!-- In Workbench this is "Summary field name" -->
<str name="carrot.snippet">features</str>

一般に、Carrot2は、検索結果、ドキュメントの要約、コンテンツなどの自然な/構造化されていないテキストで最適に機能します。フィールドに構造化データを示す文字列が含まれている場合、クラスターは、期待しているもの（および専用のクラスタリングアルゴリズムが生成できるもの）から遠く離れている可能性があります。

search - 複数の引数でのCarrot2クラスター

1 に答える 1

Related

Reference