Pythonを使用して、テキストから文を抽出しようとしています。テキスト内のすべての単語は、その単語に関連する追加情報とともに行に書かれています。
Mary Noun Name
loves Verb No-Name
John Noun Name
. Punct No-Name
文の境界は空行でマークされます。特定の機能を持つ単語を含む文全体を抽出したい (名前のある文など)。
これまでのところ、文全体ではなく、関心のある単語のみを抽出できました。私.readlines()
はテキストを一行一行読んでいました。次に、行をループ処理し、 re と を使用して行.split('\t')
を分割し、すべての行が 3 つの要素のリストで表されるようにします。次に、リスト内の要素を目的の値と一致させ、関連する単語を抽出できますが、文全体を抽出する方法がわかりません..
誰かアドバイスはありますか?