テキスト内の特定のパターンを見つける方法を探しています。たとえば、次のような形式のテキストからすべての参照を検索したい場合:
- Baron, Naomi (2000) Alphabet to Email: How Written English Evolved and Where It's Heading, Routledge: London and New York.
したがって、これに似たものは入力テキストから返されます。これに適したアルゴリズムはありますか。これまでに見つけたのは、テキスト内の類似した文字列を検索するためのアルゴリズムだけでした。
正規表現を使用することを考えていましたが、それが最善の方法であるかどうかはわかりません。類似性のインデックスを計算し、最高のスコアを持つヒットを返すものが必要になるためです。