編集距離で Lucene インデックスを検索したいと思います。たとえば、フィールド FIRST_NAME を持つドキュメントがあるとします。たとえば、'john' から 1 編集距離離れた名前のすべてのドキュメントが必要です。
Lucene はあいまい検索 (FIRST_NAME:john~) をサポートしており、あいまいさを制御するために 0 から 1 までの数値を取ることを知っています。(私にとって) 問題は、この数値が編集距離に直接変換されないことです。また、ドキュメント内の値が短い文字列 (3 文字未満) の場合、あいまい検索ではそれらを見つけるのが困難です。たとえば、FIRST_NAME が「J」のドキュメントがあり、FIRST_NAME:I~0.0 を検索すると、何も返されません。