algorithm - 辞書を使用せずにスペルミスを識別するアルゴリズムクラスは何ですか?

Question

次の状況を考慮してください: テキストのセグメントで、文字列 "slnFile" が 5 回出現し、"snlFile" が 1 回出現します。後者はスペルミスですが、前者の単語は適切な辞書にないことに注意してください (「slnFile」は「ビジュアルスタジオソリューションファイル」を示す変数名であり、テキストセグメントの作成者にのみ意味があります)。

私自身、単純なスペルチェックの実装を思いつくことができます。テキストセグメント内でスペルが 1 文字異なるすべての単語のペアを見つけ、頻度カウントが 1 の単語を疑わしい単語として示します。（これが完全な解決策ではないことはわかっています。）

私の質問: この問題を扱うアルゴリズムのクラスの名前は何ですか?

score 2 · Accepted Answer

語彙内のすべての単語間のダメラウレーベンシュタイン距離を計算します。発生頻度が非常に低く、頻繁に発生する単語との距離が特に短い単語にフラグを付けます。

algorithm - 辞書を使用せずにスペル ミスを識別するアルゴリズム クラスは何ですか?

1 に答える 1

Related

Reference

algorithm - 辞書を使用せずにスペルミスを識別するアルゴリズムクラスは何ですか?