java - Solrクエリ結果-検索されたテキストとその周囲の数行が必要

Question

私は完全に迷子になっています。私はここで基本的な何かを間違いなく見逃していると思います。誰もがSolrについて言うべき素晴らしいことを持っていますが、私はそれを見ることができません。

Solrで構造化されたPDFドキュメントのインデックスを作成しました。問題は、単純な文字列を検索するときです。コンテンツフィールド全体が応答として取得されます。それを変える方法がわかりません。私の要件は、「メタデータ」を検索すると、それが私に与えるはずだということです

" MetadataDiscussion。。。4つの一致...TikaユーザーがTikaによって作成および/または抽出されたすべてのメタデータにアクセスできるようにします。==元の問題==このページの元のインスピレーションはTikaです。。10.7k-rev：2（現在）最終更新日：2010-08-02 18:09:45 "

しかし、それは私にドキュメント全体を与えます！-インデックス付けされた文字列全体。Luceneは、フィールドのどこで発生したかではなく、どのフィールドで発生したかしか教えてくれないようです。

どんな助けでも大歓迎です!!

score 0 · Accepted Answer

Lucene / Solrは主に検索エンジンであり、クエリに一致するドキュメントを検索します。したがって、この動作は望ましく、予想されます。これで、要件として、Solrの強調表示機能を使用して正確にそれを実現できます。ドキュメントのテキストがtext-という名前のフィールドに格納されているとすると、次のパラメータをSolrに渡します。

&hl=true&hl.fl=text&hl.snippets=5&hl.fragsize=200

他のパラメータを調べて、さらにカスタマイズします。

Solrは素晴らしいです:)

java - Solrクエリ結果-検索されたテキストとその周囲の数行が必要

1 に答える 1

Related

Reference