solr - Solr では、複数単語の同義語と用語の位置を拡張する

Question

インデックス時に使用される同義語ファイルがあり、これには次の等価物が含まれています。

uc, university of california

次に、"uc berkeley" のインデックス作成が analysis.jsp でどのように見えるかを調べました。私はびっくりしました：

org.apache.solr.analysis.SynonymFilterFactory {synonyms=companysyns.txt, expand=true, ignoreCase=true, luceneMatchVersion=LUCENE_36}
position    1               2               3
term text   university      berkeley        california
            uc              of
type        SYNONYM         word            SYNONYM
            SYNONYM         SYNONYM
startOffset 0               3               3
            0               3
endOffset   2               11              11
            2               11

「berkeley」は「university」と「california」の間にあることに注意してください。これは、「university of california berkeley」を検索しても一致しないことを意味しています。でも「カリフォルニア州バークレー校」は効く！

「カリフォルニア大学バークレー校」が正しく機能することを確認するにはどうすればよいですか?

ありがとう！

score 0 · Accepted Answer

既知の問題のようです。言及されている修正があります（luceneMatchVersionをLUCENE_33に設定します）。それがあなたのために働くかどうかわからない。彼らがすぐにそれを修正することを期待しましょう。

score 0 · Accepted Answer

強調表示された応答で間違った単語が強調表示されるという同様の問題に直面しています。私はsolr 3.6を使用しています

私の使用例では、expand=true を使用して、インデックス作成側で同義語を構成しています。

たとえば、synonyms.txt、dns、ドメインネームシステムに以下があるとします。

「機能するサンプルDNSエントリ」のようなものにインデックスを付けます。強調表示された応答で「名前」(引用符なし) を検索すると、「機能するサンプル dnsエントリ」が表示されます。ご覧のとおり、単語エントリが強調表示されています。
また、「システム」を検索すると、「機能するサンプル dns エントリ」という結果になります。

solr - Solr では、複数単語の同義語と用語の位置を拡張する

2 に答える 2

Related

Reference