Lucene APIを使用して、文からngramを抽出したいと思います。しかし、私は独特の問題に直面しているようです。JavaDocには、NGramTokenizerと呼ばれるクラスがあります。3.6.1と4.0の両方のAPIをダウンロードしましたが、このクラスの痕跡は見当たりません。たとえば、次のことを試してみると、シンボルNGramTokenizerが見つからないというエラーが表示されます。
NGramTokenizer myTokenizer;
ドキュメントでは、NGramTokenizerがパスorg.apache.lucene.analysis.NGramTokenizerにあるように見えます。これは私のコンピューターのどこにも見当たりません。3.6.1と4.0の両方のAPIで発生するため、ダウンロードやその他のエラーが発生した可能性は低いようです。
- NGramTokenizerクラスを取得するにはどうすればよいですか?
- lucene-core-3.6.1.jarをプロジェクトに追加しました