特定の形式でSolrハイライトが必要です。
以下は、強調表示機能を提供する必要がある文字列形式です
130s: LISTEN! LISTEN! 138s: [THUMP] 143s: WHAT IS THAT? 144s: HEAR THAT?
152s: EVERYBODY, SHH. SHH. 156s: STAY UP THERE. 163s: [BOAT CREAKING] 165s:
WHAT IS THAT? 167s: [SCREAMING] 191s: COME ON! 192s: OH, GOD! 193s: AAH!
249s: OK. WE'VE HAD SOME PROBLEMS 253s: AT THE FACILITY. 253s: WHAT WE'RE
ATTEMPTING TO ACHIEVE 256s: HERE HAS NEVER BEEN DONE. 256s: WE'RE THIS CLOSE
259s: TO THE REACTIVATION 259s: OF A HUMAN BRAIN CELL. 260s: DOCTOR, THE 200
MILLION 264s: I'VE SUNK INTO THIS COMPANY 264s: IS DUE IN GREAT PART 266s:
TO YOUR RESEARCH.
ユーザー検索後、以下の形式でユーザーフラグメントを提供したい
Previous Line of Highlight + Line containing Highlight + Next Line of
Highlight
にとって。たとえば、ユーザーが「聞く」という用語を検索した場合、1つの典型的なハイライトフラグメントは次のようになります。
<str>143s: WHAT IS THAT? 144s: <em>HEAR</em> THAT? 152s: EVERYBODY, SHH.
SHH.</str>
上記は私の最終的な計画ですが、現在、nsで始まるフラグメントを取得しようとしています。ここで、nは0から9999までの数値です。
私はhl.regex.slop=0.6を使用し、hl.fragsize=120以下はそのための正規表現です。
\b(?=\s*\d{1,4}s:){50,200}
上記の正規表現を使用すると、フラグメントは常にnsで始まらない:
これについて私に提案してください、どうすれば究極の計画を達成できますか
ありがとう