0

ハロー、

SolrとCarrot2を使用するSearchEngineに取り組んでいます。

すべてが順調ですが、キャロットは私が理解できない奇妙なことをします。Solrから結果を取得し、Carrotを使用してそれらをクラスター化したい。私はすべてを統合し、それはうまく機能しますが、Carrotは私の属性の1つだけにクラスタリングしています。結果に一致し、他の属性に一致しないもの。好き:

データ

名前:ピータータウン:ロンドン趣味:ゴルフ、スキー

名前:アーサー町:ベルリン趣味:ゴルフ、サイクリング

名前:パリ町:ロンドン趣味:ゴルフ、ハイキング

検索:ゴルフ

クラスターのようなもの:スキー、サイクリング、ハイキング

..しかしロンドンではありません。

それだけでは驚きませんが、CarrotClusteringWorkbenchを使用すると、他の引数でクラスター化されます。

最初に、ワークベンチからSolrconfigに構成をエクスポートしようとしましたが、何も変更されませんでした。Solrは構成を使用しますが、この問題に変更を加えるものはありません。

誰かが私を助けたり、それを説明したりできますか?

4

1 に答える 1

0

クラスター化するフィールドの名前をsolrconfig.xmlに入れる必要があります。Carrot2 Clustering Workbenchで機能した構成を複製するには、これらをクラスタリング要求ハンドラーに配置します(またはクエリURLで指定します)。

<!-- In Workbench this is "Title field name" -->
<str name="carrot.title">name</str>

<!-- In Workbench this is "Summary field name" -->
<str name="carrot.snippet">features</str>

一般に、Carrot2は、検索結果、ドキュメントの要約、コンテンツなどの自然な/構造化されていないテキストで最適に機能します。フィールドに構造化データを示す文字列が含まれている場合、クラスターは、期待しているもの(および専用のクラスタリングアルゴリズムが生成できるもの)から遠く離れている可能性があります。

于 2011-07-14T10:15:41.747 に答える