xml - 「Solr XML」ファイルを解析して結果にインデックスを付ける際に、Solr にリンクをたどらせるにはどうすればよいですか?

翻译自：https://stackoverflow.com/questions/17029724 2013-06-10T17:40:00.687

273 次

Solr (Lucidworks を使用) でインデックスを作成する必要がある、何千もの PDF ファイルの Web アクセス可能なファイルシステムがあります。

それぞれに対応するデータを含む XML ファイルがあります。XML には、ID、単純なメタデータ、およびファイルシステム内の対応する PDF の URL が含まれています。

現在、Solr が XML を読み取り、必要なすべてのメタデータ (PDF の URL を含む) のインデックスを作成できるように、XML をフォーマットできます。

Solr がファイルを解析しているときに、実際に URL をたどり、参照されている PDF データを XML 提供のメタデータと一緒にインデックス付けしてほしいと思います。これは可能ですか？

1 に答える 1