2

Lucene 5.4.1 バージョンを使用してインデックス ファイルを作成するためにカスタム アナライザーを使用しています。また、インデックス ファイル内のデータを検索するために Luke を使用しようとしています。カスタム アナライザーを Luke に追加しようとしていますが、アナライザー タブに見つかりません。

アナライザーを Luke に追加するために以下の構文を使用しています java -cp "pivot-luke-with-deps.jar;CatalogSearchAnalyzer.jar" org.getopt.luke.Luke

私のアナライザーコード `

public class CatalogSearchAnalyzer extends Analyzer {
private Version matchVersion;
private String termValue;
private boolean retMultiple;
public static final String[] STOP_WORDS = { "a", "and", "are", "as", "at",
        "be", "but", "by", "for", "if", "in", "into", "is", "it", "no",
        "not", "of", "on", "or", "such", "t", "that", "the", "their",
        "then", "there", "these", "they", "this", "to", "was", "will",
        "with" };
private CharArraySet stopTable;
private int maxTokenLength;

public CatalogSearchAnalyzer(Version matchVersion) {
    this.stopTable = StopFilter.makeStopSet(STOP_WORDS);
    this.maxTokenLength = 255;

    this.matchVersion = matchVersion;
}

public CatalogSearchAnalyzer() {
    this(STOP_WORDS);
}

public void setTermValue(String termValue) {
}

public void setRetMultiple(boolean retMultiple) {
}

public CatalogSearchAnalyzer(String[] stopWords) {
    this.stopTable = StopFilter.makeStopSet(STOP_WORDS);
    this.maxTokenLength = 255;

    StopFilter.makeStopSet(stopWords);
}

private TokenStream getStemmingFilter(TokenStream result) {
    PorterStemFilter temp = new PorterStemFilter(result);
    temp.setRetMultiple(this.retMultiple);
    return temp;
}

protected Analyzer.TokenStreamComponents createComponents(String fieldName)          {
    StandardTokenizer st = new StandardTokenizer();
    st.setMaxTokenLength(this.maxTokenLength);
    Tokenizer tk = st;
    TokenStream ts = new StandardFilter(tk);
    ts = new LowerCaseFilter(ts);
    ts = new StopFilter(ts, this.stopTable);
    ts = getStemmingFilter(ts);
    return new Analyzer.TokenStreamComponents(tk, ts) {
        protected void setReader(Reader reader) {
            int m = CatalogSearchAnalyzer.this.maxTokenLength;
            if (this.source instanceof CmgtTokenizer) {
                ((CmgtTokenizer) this.source).setMaxTokenLength(m);
            }
            super.setReader(reader);
        }
    };
}
}

` jar を Luke に追加している間、例外は発生しません。

ご検討いただきありがとうございます。

4

1 に答える 1

1

質問の下のコメント セクションに記載されているように、ソリューションは、ピボット ベースのルークの代わりにオリジナルのシンレット ベースのバージョンのルークを使用することです。ピボット ベースの luke は進行中の作業であり、まだすべての機能をサポートしているわけではありません (ただし、さらにテストすることをお勧めします!)

マスターのシンレット ルーク (現在): https://github.com/DmitryKey/luke

ブランチでルークをピボット: https://github.com/DmitryKey/luke/tree/pivot-luke

于 2016-07-27T12:22:35.527 に答える