部分的な用語を検索できるドキュメント検索エンジン(Xapian、Whoosh、Lucene、Solr、Sphinxなど)を探しています。
たとえば、「brit」という用語を検索する場合、検索エンジンは「britney」または「britain」のいずれかを含むドキュメント、または一般にrに一致する単語を含むドキュメントを返す必要があります。*brit*
正直なところ、ほとんどのエンジンがTF-IDF(用語頻度-逆ドキュメント頻度)または部分的な用語ではなく完全な用語に基づくその派生物を使用していることに気づきました。ドキュメント検索用のTF-IDF以外に、正常に実装された他の手法はありますか?