0

テキスト内の特定のパターンを見つける方法を探しています。たとえば、次のような形式のテキストからすべての参照を検索したい場合:

  • Baron, Naomi (2000) Alphabet to Email: How Written English Evolved and Where It's Heading, Routledge: London and New York.

したがって、これに似たものは入力テキストから返されます。これに適したアルゴリズムはありますか。これまでに見つけたのは、テキスト内の類似した文字列を検索するためのアルゴリズムだけでした。

正規表現を使用することを考えていましたが、それが最善の方法であるかどうかはわかりません。類似性のインデックスを計算し、最高のスコアを持つヒットを返すものが必要になるためです。

4

1 に答える 1

0

あなたが探している技術は、情報抽出と呼ばれます。

同様の質問に対する私の答えは次のとおりです。

Apple はメールの日付、時刻、住所をどのように見つけますか?

Named Entity Recognition も組み合わせる必要があるかもしれません。http://en.wikipedia.org/wiki/Named-entity_recognition

于 2012-06-21T18:50:24.303 に答える