2

Solr の強調表示機能で Regexp Fragmenter を使用してフラグメントをカスタマイズしたいと考えています。

要件に従って、用語を強調表示する前後に 25 語を返す必要があります。

以下は、ハイライト フラグメントの 1 つのサンプルです。

Some polls show a major gender gap between men and women when it comes to gun control. A Washington Post/ABC News poll in January showed that <span class="highclass">women</span> supported a semi-automatic gun ban by 20 more points than men. They favored a ban on high-capacity magazines by 15 points.

そのために、以下の正規表現を作成しました

((?:\w+\W*){25})\b(span class)\b((?:\W*\w+){25})

この正規表現は、単純な文字列で正常に機能します。(動作確認済) ですが、solrで使っているとうまく動かないようです。

うまくいくハイライトはほとんどありませんが、いくつかのハイライトの場合、ハイライト用語はハイライトフラグメントの最初に来ます。

私が必要としている正規表現フラグメンタができることはわかりません。そして、この要件を満たす他の方法はありますか。

誰でもこれについて私に提案できますか?

4

1 に答える 1