一連の単語 (「辞書」) があり、新しい単語が与えられた場合、辞書から最も近い単語を見つける必要があります。(実際には可変長の抽象的な「文字」のシーケンスであるため、「単語」をキーワードとして使用しています)。
メトリックとしてレーベンスタイン距離の一般化を使用しています。一般化する必要がある理由は、特定の 2 文字を交換する特定の「コスト」が必要だからです。 'a' と 'c' を交換することにより、より少なくなります。私の一般化はまだメトリックであることを自分自身に納得させる必要があると思います.
現在、単純な線形検索を使用しています。つまり、辞書内のすべての単語を繰り返し処理し、最小距離を追跡しています。より効率的な方法を探しています。
最近傍探索の方法について読み始めましたが、概念上の主な難点は、「ポイント」(単語) が視覚化できる空間に埋め込まれておらず、次元などを持つベクトルではないことです。
それを念頭に置いて、どのアルゴリズムを探すべきかについてアドバイスを聞きたいと思います。