PHP/Python/C/C++ ライブラリ/アプリケーションにシンプルで軽量なライブラリ/アプリケーションを用意して、入力に一致/修正/提案を提供したいと考えています。イン/アウトの例:
- 入力: ウェブ開発 ==> 出力: ウェブ開発
- 入力: Web 開発者 ==> 出力: Web 開発
- 入力: ウェブ開発 ==> 出力: ウェブ開発
正しい単語とフレーズのデータベースがあるとすれば、フレーズを照合/推測するためのライブラリが必要なだけです。どなたかご存知でしたらおしえてください。
PHP/Python/C/C++ ライブラリ/アプリケーションにシンプルで軽量なライブラリ/アプリケーションを用意して、入力に一致/修正/提案を提供したいと考えています。イン/アウトの例:
正しい単語とフレーズのデータベースがあるとすれば、フレーズを照合/推測するためのライブラリが必要なだけです。どなたかご存知でしたらおしえてください。
あなたがやりたいことは、文字列 (入力、出力のペア) 間の編集距離を計算することだと思います。より単純なものの1つ(3文字の短いものからチームのフルネームを理解するために使用しました-それは長い話です..)はレーベンシュタイン距離です。ページの最後の外部リンクには、さまざまな実装が含まれています (PHP 4.0.1 以降では標準であることがわかります)。
Google のリサーチ ディレクター Peter Norvik によるスペル修正プログラムの作成方法21 行の Python で記述されたスペル修正プログラムが説明付きで含まれています。
これを自分でモジュールに変換する必要がありますが、それは簡単なはずです。もちろん、コーパス(単語など)も必要ですが、彼はこれらのソースも提供しています。