最初は、アナライザー「言語アナライザー」を使用していましたが、すべてがうまく機能しているように見えました。「a」がフランス語のストップワードのリストに含まれていないことに気付くまで
そこで、スノーボールでテストすることにしました。それもうまく機能しているように見えましたが、この場合、「 l' 」、「 d' 」などの短い単語が削除されます...
したがって、私の質問: スノーボールを使用し、デフォルトでフィルターを保持し、ストップワードと省略のリストを追加する方法は?
それ以外の場合、アナライザー「言語アナライザー」のストップワードのリストを変更するにはどうすればよいですか?
最後にもう 1 つ質問があります。「言語アナライザー」というアナライザーではなく、スノーボールを使用することに本当に関心があるのでしょうか。速いですか?より適切ですか?
ありがとうございました