1

Carrot2 Workbench を使用して、Solr でクラスタリングを調整しようとしています。Workbench は良い結果を生み出していますが、Solr はそうするのを拒否しており、そのクラスターは非常に異なっています。

私の流れ:

  • ドキュメント ID のセットを準備し、それらのみをクエリする (fq)
  • Workbench から XML 構成を調整してエクスポートする
  • Solrを再起動して、すべてがピックアップされていることを確認します
  • 同じクエリを繰り返します (Solr ログをチェックして、Wrokbench のクエリとまったく同じであることも確認しました)。
  • クラスターを比較してください...そして、これは私が迷った瞬間です。構造も全く違います。Workbench はより長く複雑なラベルを生成しますが、Solr ラベルは非常に単純です。

XML とクエリの両方からパラメーターを微調整しようとしましたが、ほとんど効果がありませんでした。ただし、構成が取得されていることを確認するには十分です。

私がチェックしたもう 1 つのことは、Carrto2 CLI ツールです。Solr から XML にデータをエクスポートし、Workbench からエクスポートした構成と共に CLI を使用してクラスターを生成しました。CLI は Workbench と一致しています。

そのため、Solr は奇妙なものです。私は Carrot2 v3.15.1 と Solr 7.2.1 を使用しています

私は何が欠けていますか?Solr が同じデータと構成から異なるクラスターを生成するのはなぜですか?

4

0 に答える 0