各単語の POS (品詞) タグを含む次の txt ファイルがあります。
不必要/jj to/to say/vb ,/, I/ppss was/bedz furious/jj at/in this/dt unparalleled/jj intrusion/nn on/in free/jj enterprise/nn ./. どうやって/wrbあえて/vbn彼ら/ppss
POS タグなしでファイルを読み取る方法はあるので、結果は次のようになります。
言うまでもなく、私はこの比類のない自由企業への侵入に激怒しました。彼らはどれほど大胆でしたか
したがって、基本的には . の後の文字を削除したいと思い/
ます。
words = re.findall('\w+',open(input_file).read())
上記のコードは / を削除しますが、 jj 、 ppss などの省略形は引き続き表示されます。では、 / の後に任意の文字を削除する方法。