2

いくつかのPDFドキュメントにインデックスを付けてから、検索UIを作成しようとしています。

この質問はやや関連しています

Solr Index PDFドキュメントを作成し、リモートサーバーに投稿します

1)PDFドキュメントのインデックス作成-> tika jarを使用してPDFをテキストファイルに変換してから、curlコマンドを使用してインデックスを作成します。

2)検索UI-> Solritasブラウズ機能とその組み込みUIを使用しています。

目的 :

インデックス付けされたドキュメントのリストで「Lucene」という単語を検索し、指定されたクエリの結果セットを取得したときに、返されたドキュメントごとにリンクを表示し、開くことができるはずのドキュメントをクリックすると表示されます。そのドキュメント。

私の現在の考え:

ステップ1を双方向のステップから直接インデックスを作成する単一のステップに変更する必要があるかもしれないと思います。これらのPDFドキュメントの場所を示す追加のフィールドがschema.xmlにあるはずだとさえ思います。

いくつかの提案を教えてください

4

1 に答える 1

1

これは役立つかもしれません:

http://wiki.apache.org/solr/ExtractingRequestHandler

于 2011-07-26T05:05:01.627 に答える