問題タブ [lucene-highlighter]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
1084 参照

zend-framework - Symfony と Zend Lucene のハイライト

私は symfony 1.4 を使用し、Zend Lucene 検索をJobbetのように使用します。また、検索結果の強調表示を作成する必要があります。これを読み ましたが、symfony(

$sourceHTML とは? そして、それはすべて1行だけでできていますか?

更新:

私のモデルでは機能しますが、私の見解ではどのように実装されていますか?

0 投票する
1 に答える
2471 参照

solr - Position offset for Phrase queries in Lucene

I am working on customizing the Highlighter plugin(using FVH) to output the position offset of query terms for a given search. So far I have been able to extract the offset information for normal queries using the code below. However, for Phrase queries the code returns the position offset of all the query terms(i.e. termSet) even when it is not part of the Phrase query. Therefore, I am wondering if there is a way in Lucene to get the offset information of only the matched phrase for Phrase queries using FVH?

Current Output:

Expected Output:

The field that I am trying to highlight has termVectors="true", termPositions="true" and termOffsets="true" and am using Lucene 3.1.0.

0 投票する
1 に答える
132 参照

lucene - Luceneは2つのフィールド値を単一として検索します

Luceneドキュメントにはa、コンテンツhelloaコンテンツを含むフィールドがありますworld。検索すると、それが見つかります"hello world"~2=(。どうすれば修正できますか? (スペースなしで)
FastVectorHighlighterのように強調表示されます<b>helloworld</b>(とにかく強調表示されるべきではありません)

0 投票する
1 に答える
550 参照

java - Lucene ハイライターがプレフィックスと一致しない

Lucene の Highlighter を使用して、文字列の一部を強調表示しています。以下のコードは、単語の語幹を見つけるには問題なく機能するようですが、プレフィックス マッチングには機能しません。

接頭辞の一致を機能させるために Query.rewrite を呼び出す必要があるいくつかの異なる場所を読みました。ただし、そのメソッドは IndexReader 引数を受け取りますが、それを取得する方法がわかりません。呼び出し Query.rewreite が IndexReader がどこから来たのかを示していないことがわかったすべての例。これが私が使用している唯一の Lucene コードであることを付け加えておきます。強調表示のためだけに、Lucene を使用して検索自体を行っているわけではありません。

IndexReader を作成するにはどうすればよいですか? また、私のように Lucene を使用している場合に作成することは可能ですか? または、接頭辞の一致を強調表示する別の方法があるのでしょうか? 私は Lucene に非常に慣れていないので、これらのすべての部分が何をするのか、またはそれらがすべて必要なのかを確信しています。オンラインで見つけたさまざまな例からそれらをコピーしました。だから私が他に何か間違ったことをしているなら、私に知らせてください。ありがとう。

0 投票する
1 に答える
200 参照

fonts - Lucene と強調表示されたテキストのフォントの問題

私はLucene HighLighterを使用して成功しています。これが私のコードです:

問題は、検索結果/強調表示されたテキストにあり、文字化けしています。これはフォントが見つからないためですか?

これが私のハイライトテキストです:

ファンキーなテキストに注目してください!

どんな助けでも大歓迎です。

0 投票する
3 に答える
2251 参照

java - HTMLを含むフィールドの強調表示

ユーザー入力としてHTMLコードを含む可能性のあるフィールドがあります。<em>単純な蛍光ペンを使用すると、タグを追加する前に入力をエスケープしません。たとえば、入力が

「キャプション」を検索すると、次のようになります。

しかし、私は取得したい:

これは、HTMLとしてレンダリングすると、一致した単語が強調表示された入力と同じように見えます。

0 投票する
0 に答える
446 参照

solr - Solr の引用符で囲まれたクエリの問題を強調表示する - フラグメントが返されない

これは非常に興味深いです。強調表示は他のすべてのケースで正常に機能しますが、この 1 つのケースではフラグメントが返されません。私の文書は次のとおりです( fieldType text_en):

アブ ヤヒヤ スハイブ ビン シナン (彼にアッラーのご満悦あれ) は次のように報告しています: アッラーの使徒 (PBUH) は次のように述べています。繁栄が彼に臨むならば、彼はアッラーに感謝を表明し、それは彼にとって良いことであり、逆境が彼に降りかかるならば、彼はそれに忍耐強く耐え、それは彼にとってより良いことです.

私のクエリは

Solr はドキュメントが正常に返されることを検出しますが、戻り値の強調表示コンポーネントにはドキュメントのテキストが含まれていません。ドキュメントの主キーのフィールドがありますが (いつものように)、それ以上の深さはありません。

最後の単語を削除すると、すべてが正常に機能します。引用符から最後の単語を削除して外側に配置すると、機能します。引用符で囲まれたより長い (異なる) 文字列でも機能します。これだけではうまくいきません!

これをデバッグするにはどうすればよいですか?

schema.xml に強調表示の設定がありません。クエリの一部として渡すパラメーターは次のとおりです。 <-1%205<-2&hl.usePhraseHighlighter=true

0 投票する
3 に答える
605 参照

lucene.net - 定義がないのはなぜですか? Lucene.Net 3.0.3 - 高速ベクター ハイライター

Lucene.Net/Lucene と C# の初心者として、数行のコードを記述して検索を実行することができました。

ここで、見つかった領域のスニペットを取得したいと考えています。以下のコードを見つけましたが、Visual Studio は、a) "Searcher には getIndexReader の定義が含まれています" および b) "ScoreDoc には doc の定義が含まれていません" と言い続けています。

助けてくれる人はいますか。

Visual Studio 2010 Express で Lucene.Net 3.0.3 と Lucene Contrib 3.0.3 を使用しています。

以下のコードを参照してください。

ご協力いただきありがとうございます!

RC


0 投票する
2 に答える
10464 参照

java - ルセンハイライター

Lucene 4.3.1 ハイライターはどのように機能しますか? ドキュメントから検索結果(検索された単語とその単語の後の8単語)を印刷したい。Highlighter クラスを使用してそれを行うにはどうすればよいですか? 完全なtxt、html、およびxmlドキュメントをファイルに追加し、それらをインデックスに追加しました。これで検索式ができました。そこからおそらく蛍光ペン機能を追加します。

}

0 投票する
1 に答える
53 参照

lucene - Lucene で検索されたドキュメントごとに 1 つの検索のみを許可する方法

Lucene 検索で、ドキュメントごとにハイライト表示されたフラグメントのスコアが最も高くなるようにしたいだけです。したがって、「パフォーマンス」という単語がそれぞれ 3 回含まれる 5 つのドキュメントがあるとします。それでも、5 つの結果だけを印刷して結果ページに強調表示する必要があります。どうすればそれを行うことができますか?ありがとう!