PHPでスペルチェックシステムを構築しようとしています。
私はすでに英語の多くの単語の辞書/コーパスを持っています。新しい行の各単語。
私がやろうとしているのは、文字列が与えられたら、それを $string1 と呼び、テキスト ファイルを開いて $string1 に最も似た文字列を検索し、その文字列を返すことです。
テキスト ファイルを検索するには、内容を配列にインポートしてから in_array() を使用するというのが私の考えです。すべての単語をメモリにインポートせずにテキスト ファイルを検索するより良い方法がある場合は、お知らせください。
2 つの文字列の類似性を比較する方法がわかりません。どうすればいいですか?
私の考えでは、すべて同じ文字でも順序が異なると、別の文字よりも上位にランク付けされます。ただし、両方よりも上位にランクされるのは、部分一致 +/- 1 文字または 2 文字です。
テキスト ファイルを開いて検索し、文字列を比較する方法を教えていただければ幸いです。