0

私はマジェントでSOLR検索を使用しており、SOLRファジー検索の力を利用しようとしています。しかし、これまでのところ運がないようです。

検索クエリの最後にチルダ (~) を使用してみました。また、これまでのところ、私が知っている最高のステム ファクトリである「PorterStemFilterFactory」も使用してみました。しかし、それは私に何の結果も与えていません。例えば; 「シラーズ」という商品があります。したがって、あいまい検索では、「shirag」または「shrag」を使用して検索すると、同じ結果が返されます。

これは私のスキーマ セクションです (私が使用する唯一の部分であるため、英語のセクションのみを示しています)。

<fieldType name="text_en" class="solr.TextField" positionIncrementGap="100">
        <analyzer type="index">
            <tokenizer class="solr.WhitespaceTokenizerFactory"/>
            <charFilter class="solr.MappingCharFilterFactory" mapping="mapping-ISOLatin1Accent.txt"/>
            <filter class="solr.EdgeNGramFilterFactory" minGramSize="3" maxGramSize="10" />
            <!--
                In this example, we will only use synonyms at query time.
                <filter class="solr.SynonymFilterFactory" synonyms="index_synonyms.txt" ignoreCase="true"
                    expand="false"/>
            -->
            <!--
                Case insensitive stop word removal. Add enablePositionIncrements=true in both the index and query
                analyzers to leave a 'gap' for more accurate phrase queries.
            -->
            <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords_en.txt"
                    enablePositionIncrements="true"/>
            <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1"
                    catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
            <filter class="solr.LowerCaseFilterFactory"/>
            <filter class="solr.SnowballPorterFilterFactory" language="English" protected="protwords_en.txt"/>
        </analyzer>
        <analyzer type="query">
            <tokenizer class="solr.WhitespaceTokenizerFactory"/>
            <charFilter class="solr.MappingCharFilterFactory" mapping="mapping-ISOLatin1Accent.txt"/>
            <filter class="solr.SynonymFilterFactory" synonyms="synonyms_en.txt" ignoreCase="true" expand="true"/>
            <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords_en.txt"
                    enablePositionIncrements="true"/>
            <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1"
                    catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="0"/>
            <filter class="solr.LowerCaseFilterFactory"/>
            <filter class="solr.SnowballPorterFilterFactory" language="English" protected="protwords_en.txt"/>
            <filter class="solr.PorterStemFilterFactory" />
        </analyzer>
    </fieldType>

また、これらは私が試したリンクです:

http://johntwang.com/blog/2011/09/05/Fuzzy-and-Document-Searching-with-WebSolr-and-Heroku/ http://docs.lucidworks.com/display/solr/The+Standard+クエリ + パーサー http://www.rqna.net/qna/mnuhwh-solr-fuzzy-search-for-similar-words.html

4

1 に答える 1

0

「 Solr Fuzzy Search for similar words」および「 Solr/Lucene あいまい検索が遅すぎる」を参照してください。

自動提案を探している場合は、EdgeNGramFilterを使用することも考慮すべき別のオプションです。

于 2013-02-22T22:21:51.667 に答える