ワークベンチを使用していくつかのテストを行いたいのですが、クエリを指定せずに実行する方法がわかりませんでした。ワークベンチを使用してクエリを指定せずに、ドキュメントのクラスターを作成したいと考えています。出来ますか?
タンク
ワークベンチを使用していくつかのテストを行いたいのですが、クエリを指定せずに実行する方法がわかりませんでした。ワークベンチを使用してクエリを指定せずに、ドキュメントのクラスターを作成したいと考えています。出来ますか?
タンク
最も単純な 2 つのオプションは次のとおりです。
データをCarrot2 XML 形式に変換し、Workbench で XML ドキュメント ソースを使用します。クエリはオプションです。
データから Lucene インデックスを作成し、Lucene ドキュメント ソースを使用します。この場合、クエリは必須ですが、*:*
キャッチオール クエリを使用して、インデックスからすべてのドキュメントをクラスター化できます。この質問には、さまざまな種類のドキュメントを必要な Lucene インデックスに変換するためのヒントがいくつかあります。