0

いくつかのsolrインスタンスがあります。1つは400万、もう1つは800万のドキュメントで、分割して新しいsolr環境に移動したいと考えています。さまざまなドキュメントをエクスポートして、最終的にはそれぞれ約100万のドキュメントを持つインスタンスのセットを作成できるようにしたいと思います。単にインデックスファイルをコピーすることについて読み、lukeのようなツールを見ましたが、最初のオプションはすべてをコピーするように強制し、2番目のオプションは範囲オプションを提供しますが、インデックスを付けたフィールドではなく、保存したフィールドのみを出力します。

別のsolrインスタンスにインポートできる一連の完全なドキュメントをエクスポートできるツールはありますか?

4

2 に答える 2

1

これは、Solr インデックスを分割してルセン インデックスを 2 つに分割する一般的な方法です。私はこれを数回行いましたが、均一に分散された論理キー (日付範囲など) があれば非常に簡単です。

Lucene インデックス分割ツールがあります。私はこれを自分で使用したことはありません。

于 2012-07-11T17:47:58.267 に答える
0

単に「エクスポート」するために、CSVResponseWriterを使用して、後で別のインスタンスでインデックスを作成できる csv にできますが、格納されていないフィールドは明らかに含まれません。

ただし、インデックスをより小さなインデックスに分割する場合は、IndexSplitterを参照してください。詳細については、この質問を参照してください。

于 2012-07-11T17:48:34.400 に答える