Carrot2 Workbench を使用して、Solr でクラスタリングを調整しようとしています。Workbench は良い結果を生み出していますが、Solr はそうするのを拒否しており、そのクラスターは非常に異なっています。
私の流れ:
- ドキュメント ID のセットを準備し、それらのみをクエリする (fq)
- Workbench から XML 構成を調整してエクスポートする
- Solrを再起動して、すべてがピックアップされていることを確認します
- 同じクエリを繰り返します (Solr ログをチェックして、Wrokbench のクエリとまったく同じであることも確認しました)。
- クラスターを比較してください...そして、これは私が迷った瞬間です。構造も全く違います。Workbench はより長く複雑なラベルを生成しますが、Solr ラベルは非常に単純です。
XML とクエリの両方からパラメーターを微調整しようとしましたが、ほとんど効果がありませんでした。ただし、構成が取得されていることを確認するには十分です。
私がチェックしたもう 1 つのことは、Carrto2 CLI ツールです。Solr から XML にデータをエクスポートし、Workbench からエクスポートした構成と共に CLI を使用してクラスターを生成しました。CLI は Workbench と一致しています。
そのため、Solr は奇妙なものです。私は Carrot2 v3.15.1 と Solr 7.2.1 を使用しています
私は何が欠けていますか?Solr が同じデータと構成から異なるクラスターを生成するのはなぜですか?