文に単語のリストが含まれていることを検出する方法 (パターン、Python、NLTK など) はありますか。
すなわち
The cat ran into the hat, box, and house.
| | The list would be hat, box, and house
これは文字列処理される可能性がありますが、より一般的なリストがある場合があります。
すなわち
The cat likes to run outside, run inside, or jump up the stairs.
| |
List=run outside, run inside, or jump up the stairs.
これは、段落の途中または文の終わりにある可能性があり、事態をさらに複雑にします.
私はしばらく Python 用のパターンを使用してきましたが、これを行う方法が見当たらず、パターンまたは nltk (自然言語ツール キット) を使用する方法があるかどうかに興味がありました。