RDBMS からインデックスを作成しています。パイプで区切られた値を持つテーブルに列があり、インデックス作成時にこれらの値を複数値フィールドに変換したいと考えています。例えば、
ColumnA (From RDBMS)
---------------------
apple|orange|banana
これを次のように変換したい:
SOLR Index
------------
Fruit=apple
Fruit=orange
Fruit=banana
RegexTransformerを使用している場合は、splitBy="|"を指定できます。
<field column="Fruit" splitBy="|" sourceColName="ColumnA"/>
http://wiki.apache.org/solr/DataImportHandler#RegexTransformer