Luceneドキュメントにチーズバーガーという単語が含まれていて、ユーザーがハンバーガーを検索してこのドキュメントが表示されるようにしたいと思います。この複合語をチーズとハンバーガーに分解するには、おそらくカスタムアナライザーが必要になると思います。ただし、言葉を壊すことも無関係な結果をもたらす可能性があります。
例:生産のインデックスを作成するときに製品とイオンのインデックスも作成すると、ユーザーが生産を含むイオンドキュメントを検索すると表示されますが、これは関係ありません。
したがって、単純なワードブレーカーはそれをカットしません。チーズバーガーがハンバーガーとチーズに関連していることを知る方法が必要ですが、その生産はイオンに関連していません。
これを達成するためのよりインテリジェントなプロセスはありますか?
これは、語幹を語根の形に減らすためのステミングのような名前を持っていますか?