fb2 形式の書籍を表すライブラリのインデックス作成に Solr を使用したいと考えています。実際、fb2 は同様のxsd 形式の xml です。しかし、post.jar は *.fb2 ファイルを無視し、次のように fb2 ファイルの値をインデックス フィールドにマップする方法がわかりません。
<book-title>some book</book-title>
...インデックスの「本のタイトル」フィールドに。プラグインを作成する必要がありますか?
Solr Data Import Handler (DIH) を確認する必要があります。
Solr の例のフォルダーには、RSS インポートの例があります。rss-data-config.xml ファイルを見ると、XPathEntityProcessor を使用して XML から Solr フィールドにマップする方法がわかります。
ここにいくつかの詳細情報があります: http://www.andornot.com/blog/post/Sample-Solr-DataImportHandler-for-XML-Files.aspx
また、過去に特定のファイル形式を扱う Tika パーサーを作成したこともあります。
https://lucidworks.com/blog/2010/06/18/extending-apache-tika-capabilities/
柔軟性を高めるために、お気に入りのプログラミング言語を使用してファイルを読み取り、API を使用してデータを Solr に送信することができます。DIH は私たちが達成したいことに対して十分な柔軟性を持っていなかったため、最近のアプリケーションではこれを行う必要がありました。