2

次の状況を考慮してください: テキストのセグメントで、文字列 "slnFile" が 5 回出現し、"snlFile" が 1 回出現します。後者はスペルミスですが、前者の単語は適切な辞書にないことに注意してください (「slnFile」は「ビジュアル スタジオ ソリューション ファイル」を示す変数名であり、テキスト セグメントの作成者にのみ意味があります)。

私自身、単純なスペル チェックの実装を思いつくことができます。テキスト セグメント内でスペルが 1 文字異なるすべての単語のペアを見つけ、頻度カウントが 1 の単語を疑わしい単語として示します。(これが完全な解決策ではないことはわかっています。)

私の質問: この問題を扱うアルゴリズムのクラスの名前は何ですか?

4

1 に答える 1

2

語彙内のすべての単語間のダメラウ レーベンシュタイン距離を計算します。発生頻度が非常に低く、頻繁に発生する単語との距離が特に短い単語にフラグを付けます。

于 2013-09-10T21:33:33.007 に答える