0

このタイトルの言い方がよくわからなかった。基本的に「anim」で検索すると「animals」がヒットするのですが、「anima」で検索してもヒットしません。次に、「動物」を検索すると、再び「動物」が見つかります...

「アニマ」で機能しない理由を知っている人はいますか? ほとんどの単語で発生するようですが、さまざまな文字で発生します。たとえば、'eleph' と 'elephan' は問題ありませんが、'elepha' は何も返しません。

クエリと結果は次のとおりです。

クエリ 1 (わかりました)

/solr/select?fq=type:tag&q=name:anim

<response>
<lst name="responseHeader">
<int name="status">0</int>
<int name="QTime">1</int>
<lst name="params">
<str name="fq">type:tag</str>
<str name="q">name:anim</str>
</lst>
</lst>
<result name="response" numFound="1" start="0">
<doc>
<int name="id">1</int>
<str name="name">Animals</str>
<arr name="name_auto">
<str>Animals</str>
<str>Animals</str>
</arr>
<date name="timestamp">2012-08-01T08:16:38.789Z</date>
<str name="type">tag</str>
<str name="unique_id">tag_1</str>
</doc>
</result>
</response>

クエリ 2 (いいえ)

/solr/select?fq=type:tag&q=name:anima

<response>
<lst name="responseHeader">
<int name="status">0</int>
<int name="QTime">1</int>
<lst name="params">
<str name="fq">type:tag</str>
<str name="q">name:anima</str>
</lst>
</lst>
<result name="response" numFound="0" start="0"/>
</response>

クエリ 3 (わかりました)

/solr/select?fq=タイプ:タグ&q=名前:アニマル

<response>
<lst name="responseHeader">
<int name="status">0</int>
<int name="QTime">0</int>
<lst name="params">
<str name="fq">type:tag</str>
<str name="q">name:animal</str>
</lst>
</lst>
<result name="response" numFound="1" start="0">
<doc>
<int name="id">1</int>
<str name="name">Animals</str>
<arr name="name_auto">
<str>Animals</str>
<str>Animals</str>
</arr>
<date name="timestamp">2012-08-01T08:16:38.789Z</date>
<str name="type">tag</str>
<str name="unique_id">tag_1</str>
</doc>
</result>
</response>

編集1:

フィールド定義

 <field name="name" type="text" indexed="true" stored="true" required="true" />

フィールドタイプ:

 <fieldType name="text" class="solr.TextField" positionIncrementGap="100" autoGeneratePhraseQueries="true">
      <analyzer type="index">
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
        <!-- in this example, we will only use synonyms at query time
        <filter class="solr.SynonymFilterFactory" synonyms="index_synonyms.txt" ignoreCase="true" expand="false"/>
        -->
        <!-- Case insensitive stop word removal.
          add enablePositionIncrements=true in both the index and query
          analyzers to leave a 'gap' for more accurate phrase queries.
        -->
        <filter class="solr.StopFilterFactory"
                ignoreCase="true"
                words="stopwords.txt"
                enablePositionIncrements="true"
                />
        <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
        <filter class="solr.LowerCaseFilterFactory"/>
        <filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt"/>
        <filter class="solr.PorterStemFilterFactory"/>
      </analyzer>
      <analyzer type="query">
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
        <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
        <filter class="solr.StopFilterFactory"
                ignoreCase="true"
                words="stopwords.txt"
                enablePositionIncrements="true"
                />
        <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="1"/>
        <filter class="solr.LowerCaseFilterFactory"/>
        <filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt"/>
        <filter class="solr.PorterStemFilterFactory"/>
      </analyzer>
    </fieldType>

編集2:

アナライザーを介して文字列を渡す:

4

1 に答える 1

1

アンサリは正しいです、問題はステミングによるものです。投稿したSolrスキーマは、を使用しているため、それを証明しますPorterStemFilterFactory。部分的な単語を検索する場合は、使用しているクエリパーサーに応じて、ワイルドカードクエリを試すことができます。SOlr 3.xを使用している場合は遅すぎる可能性がありますが、Solr4.xではこれが大幅に改善されています。その場合、 EdgeNGramsを作成して、それもanima一致させることをお勧めしanimalsます。

于 2012-08-01T13:29:52.520 に答える