7

Ubuntu10.04(apt-get solr-tomcatを介してインストール)でSolr 1.4を実行していますが、正常に動作しているようです。ただし、ドキュメントのインデックスを作成する方法に関する一貫した情報を見つけるのに苦労しています。私はSOLRを初めて使用するので、我慢してください。マウントされたWindows共有であるフォルダー(/ mnt / folder)があります。このフォルダーには、インデックスを作成したいWordファイルとPDFファイルが含まれています。SOLRでフォルダー全体のインデックスを作成する最も簡単な方法は何ですか?

SOLRのドキュメントはかなり貧弱で、それを使って物事を成し遂げるためのまともなチュートリアルを見つけることは不可能なので、どんな助けも大歓迎です!

S

4

3 に答える 3

7

Solr wikiを見てください。かなり詳細なドキュメントです。

特に、Word や PDF ドキュメントなどのバイナリ ファイルのインデックスを作成できるExtractingRequestHandlerを参照してください。話題の紹介です。

wiki だけでは不十分な場合は、Solr に関するすばらしい本もあります。

于 2010-05-10T12:21:55.463 に答える
0

コア ドキュメントで同じ課題を見つけましたが、SOLR に関する多くのことを明確にするのに役立つ、LucidImagination からのこの非常に役立つリファレンス ガイドに出会いました。

http://docs.lucidworks.com/display/solr/Apache+Solr+Reference+Guide

于 2010-05-11T01:27:33.340 に答える
0

Solr を使用したリッチ ドキュメントの処理: http://wiki.apache.org/solr/UpdateRichDocuments

于 2011-08-25T12:27:48.793 に答える