solr - Solr-Highlight: 予期しない結果

Question

SOLR 4.4 のハイライト機能を使ってみます。いくつか試してみたところ、最終的には機能しましたが、期待どおりではありませんでした:

一般的な設定: テキストとタイトルフィールドがあります。どちらも索引付けされて検索されますが、強調表示が必要なのはタイトルフィールドだけです。

1 回目の試行: ドキュメントのタイトルフィールドがstring=> フィールドが保存されていても、ハイライト表示なしに設定されました
2 回目の試行: フィールドをtext_ws(のみWhiteSpace-Tokenizer) に変更しました。indexタイトル欄までやらなきゃいけないのかよくわからなかったのでやってみた。=> HL は機能しますが、直接一致する場合のみ (q=Apple はタイトルで HL Apple-Pie を使用しませんでした - q=Apple-Pie は使用しました)
3 回目の試行:ngramタイトルフィールドに追加されました。ここで、q:apple がヒットしますが、クエリ用語だけでなく、完全な Apple-pie が強調表示されます。

ここで質問があります。それは予想される動作ですか、それともクエリ用語のみを強調表示する方法はありますか

編集:のスニペット..

..solrconfig.xml

<requestHandler name="/query" class="solr.SearchHandler">
    <lst name="defaults">
        <str name="echoParams">explicit</str>
        <str name="wt">json</str>
        <str name="indent">true</str>
        <str name="df">text</str>
        <str name="defType">edismax</str>
        <str name="qf">title, text</str>
        <str name="hl">true</str>
        <str name="hl.fl">title</str>
        <str name="hl.simple.pre">&lt;b class="text-success"&gt;</str>
        <str name="hl.simple.post">&lt;/b&gt;</str>
    </lst>
</requestHandler>

..スキーマ.xml

<fieldType name="text" class="solr.TextField" positionIncrementGap="100">
    <analyzer type="index">
        <charFilter class="solr.HTMLStripCharFilterFactory" />
        <tokenizer class="solr.WhitespaceTokenizerFactory" />
        <filter class="solr.WordDelimiterFilterFactory" stemEnglishPossessive="0" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="0" preserveOriginal="1" />
        <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
        <filter class="solr.LowerCaseFilterFactory" />
        <filter class="solr.SnowballPorterFilterFactory" language="German" />
        <filter class="solr.RemoveDuplicatesTokenFilterFactory" />
    </analyzer>
    <analyzer type="query">
        <tokenizer class="solr.WhitespaceTokenizerFactory" />
        <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="0" preserveOriginal="1" />
        <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
        <filter class="solr.LowerCaseFilterFactory" />
        <filter class="solr.SnowballPorterFilterFactory" language="German" />
        <filter class="solr.RemoveDuplicatesTokenFilterFactory" />
    </analyzer>
</fieldType>

<fieldType name="text_ngrammed" class="solr.TextField" positionIncrementGap="100">
    <analyzer type="index">
        <charFilter class="solr.HTMLStripCharFilterFactory" />
        <tokenizer class="solr.WhitespaceTokenizerFactory" />
        <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
        <filter class="solr.LowerCaseFilterFactory" />
        <filter class="solr.NGramFilterFactory" minGramSize="3" maxGramSize="10" />
        <filter class="solr.RemoveDuplicatesTokenFilterFactory" />

        <!--        <filter class="solr.SnowballPorterFilterFactory" language="English" protected="protwords.txt"/> -->
    </analyzer>
    <analyzer type="query">
        <tokenizer class="solr.WhitespaceTokenizerFactory" />
        <filter class="solr.LowerCaseFilterFactory" />
    </analyzer>
</fieldType>

 <fields>
    <!-- IDs -->
    <field name="id" type="string" indexed="true" stored="true" required="true" />
    <!-- Content -->
    <field name="title" type="text_ngrammed" indexed="true" stored="true" termVectors="true" termPositions="true" termOffsets="true" />
    <field name="text" type="text" indexed="true" stored="false" multiValued="true" />
</fields>

score 0 · Accepted Answer

トークナイザーをからに変更しWhiteSpaceTokenizerFactory、 ->NGramTokenizerFactoryを削除しましたが、NGramFilterFactory(ほぼ) 期待どおりに動作しています

solr - Solr-Highlight: 予期しない結果

1 に答える 1

Related

Reference