私の仕事では、ダメラウ・レーベンシュタイン距離などの近似文字列マッチングアルゴリズムを使用して、コードがスペルミスの影響を受けにくくするという素晴らしい結果が得られました。
ここで、文字列をのような単純な正規表現と照合する必要がありますTV Schedule for \d\d (Jan|Feb|Mar|...)
。これは、文字列TV Schedule for 10 Jan
が0をT Schedule for 10. Jan
返し、2を返す必要があることを意味します。
これは、正規表現(この場合は100x12)ですべての文字列を生成し、最適な文字列を見つけることで実行できますが、実用的ではありません。
これを効果的に行う方法について何かアイデアはありますか?