すべての言語の全文検索をサポートしたい場合、どのステミング言語を使用する必要がありますか。私の知る限り、その言語での検索をサポートするには、その特定のステミング言語を使用してインデックスを作成する必要がありますが、私の検索プログラムには異なる言語が含まれている可能性があるため、これは不可能です
-- マノジ
すべての言語の全文検索をサポートしたい場合、どのステミング言語を使用する必要がありますか。私の知る限り、その言語での検索をサポートするには、その特定のステミング言語を使用してインデックスを作成する必要がありますが、私の検索プログラムには異なる言語が含まれている可能性があるため、これは不可能です
-- マノジ
ステミングは、すべての言語に適用できる概念ではありません。たとえば、中国語には当てはまりません。しかし、印欧語グループの言語 (そして、Snowball サイトのステマーのほとんどは印欧語用です) では、単語構造の共通パターンが明らかになります。単語が左から右に書かれていると仮定すると、語幹または語根は左側にあり、0 個以上の接尾辞が右側に追加される場合があります。このプロセスによってルートが変更された場合、通常は右端になります。また、左側にプレフィックスを追加することもできます。
@Resource: Snowball の Web サイト