1

私は完全に迷子になっています。私はここで基本的な何かを間違いなく見逃していると思います。誰もがSolrについて言うべき素晴らしいことを持っていますが、私はそれを見ることができません。

Solrで構造化されたPDFドキュメントのインデックスを作成しました。問題は、単純な文字列を検索するときです。コンテンツフィールド全体が応答として取得されます。それを変える方法がわかりません。私の要件は、「メタデータ」を検索すると、それが私に与えるはずだということです

" MetadataDiscussion。。。4つの一致...TikaユーザーがTikaによって作成および/または抽出されたすべてのメタデータにアクセスできるようにします。==元の問題==このページの元のインスピレーションはTikaです。 。10.7k-rev:2(現在)最終更新日:2010-08-02 18:09:45 "

しかし、それは私にドキュメント全体を与えます!-インデックス付けされた文字列全体。Luceneは、フィールドのどこで発生したかではなく、どのフィールドで発生したかしか教えてくれないようです。

どんな助けでも大歓迎です!!

4

1 に答える 1

0

Lucene / Solrは主に検索エンジンであり、クエリに一致するドキュメントを検索します。したがって、この動作は望ましく、予想されます。これで、要件として、Solrの強調表示機能を使用して正確にそれを実現できます。ドキュメントのテキストがtext-という名前のフィールドに格納されているとすると、次のパラメータをSolrに渡します。

&hl=true&hl.fl=text&hl.snippets=5&hl.fragsize=200

他のパラメータを調べて、さらにカスタマイズします。

Solr素晴らしいです:)

于 2012-05-19T02:08:45.317 に答える