1

ツイートを含む大きなアラビア語テキスト ファイルがあり、各行には 1 つのツイートが含まれています。このドキュメントの各行が別の solr ドキュメントでインデックス付けされるように、solr でインデックス付けしたいと考えています。

私がこれまでに試したこと:

  • SolrでデータベースレコードをSQLする方法を知っています
  • データに合わせてsolrスキーマを変更し、データインポートハンドラーを操作する方法を知っています
  • solr でデータをインデックス化するためにクエリがどのように使用されたかを知っています

私が欲しいのは:

各行がsolrドキュメントと見なされるように、solrでテキストファイルにインデックスを付ける方法を知っている

4

1 に答える 1

1

DataImportHandler 機能の LineEntityProcessor を確認する必要があると思います。これについては、以下のリンクで詳しく説明されています。

LineEntityProcessor この EntityProcessor は、データ ソースからすべてのコンテンツを行単位で読み取り、読み取った行ごとに rawLine というフィールドを返します。コンテンツは決して解析されません。ただし、トランスフォーマーを追加して rawLine フィールド内のデータを操作したり、他の追加フィールドを作成したりすることはできます。

http://lucidworks.lucidimagination.com/display/solr/Uploading+Structured+Data+Store+Data+with+the+Data+Import+Handler

情報が役立つことを願っています。幸運を!

于 2013-01-27T12:08:58.150 に答える