2

Solr 4.8.1 を使用して検索エンジンを構築しています。その際、GUI 検索結果に各インデックス付きドキュメントのファイル名を表示しようとしています。

Solr の Schema.xml ファイル (タイトル、作成者、ID、リソース名 last_modified など) にある任意のフィールドを正常に表示できます。ただし、ファイルの名前を保持する schema.xml 内のフィールドを見つけることができません (ファイル Test.pdf の場合は「Test」という名前、Example.docx の場合は「Example」という単語など)。

私が見つけることができる最も近いフィールドは、システム内のファイル パス全体を表示する "resourcename" です (例: C:\Users\myusername\Documents\solr-4.8.1\example\exampledocs\filename.docx をすべて表示したい場合)。は filename.docx です)

(1) ファイルの名前をインデックス化するように solr に指示するにはどうすればよいですか? または(2)欠落しているファイル名をカバーするフィールドはありますか?

心から感謝します!

---調査の更新--- この質問は、Solr が返すファイル名と同じことを求めているようですが、「filename」というフィールドを追加するだけで、Solr がファイル名のインデックスを作成するとは思えません。Schema.xml ファイルにフィールドを追加する必要があることはわかっていますが、そのフィールドにファイル名を指定するにはどうすればよいでしょうか?

4

1 に答える 1

0

これは機能に関する質問ではなく、solrsolr に公開するために使用するツールに関する質問です。fileName という新しいフィールドを solr に追加すると、問題の一部が解決されますが、公開ツールを変更しtestPDF.pdfて各 . http://tika.apache.org/に目を向けると思いTikaます。あなたがとファイルの両方についてどのように言及しているかを見てください。pdfdoc

于 2014-06-27T07:31:01.860 に答える