0

ツールの検索機能を提供するために Solr サーバーを使用しています。インデックスを作成する前にいくつかのファイルをフォーマットできるようにする solr が提供する機能があるかどうか知りたいですか? より具体的には、多くのデータを含むプレーンテキストファイルがあります! xml ファイルにインデックスを付ける前に、それらを xml 形式に変換したいと考えています。例えば

    some data! some more data : more values 

このサンプル行を次のようなものに変換したい

    <field 1>sample data </field 1>
    <field 2> some more data </field 2>  
    <field 3> more values  </field 3>

solrは、solrセルを使用してファイルをiindexする前に、このタイプの変換のための機能を提供しますか? 私のJavaアプリケーションに実装できるクラスまたはインターフェースを提供しますか??

前もって感謝します!

4

2 に答える 2

1

データを Solr にプッシュしていますか、それとも Solr によってソースからプルできますか?

Solr にプッシュする場合は、Update Request Processorを使用する必要があります。ただし、データを複数のフィールドに分割するものは知りません。自分で書く必要があるかもしれません。

DataImportHandler を使用してソースからプルする場合、RegexTransformerを使用してコンテンツを複数のフィールドに分割するためのサポートが組み込まれています。

Request Processor と DIH はどちらも JavaScript (および場合によっては他の Java スクリプト言語) トランスフォーマーをサポートしているため、独自のスクリプトを記述して、必要な方法でデータを分割することもできます。

ただし、一部は Solr のバージョン 4 から開始されています。それは覚えておくべき要件です。

于 2013-01-18T14:11:56.573 に答える
0

カスタムIndex HandlerまたはSolrRequestHandler

于 2013-01-18T11:27:47.183 に答える