次の文があります。
**I**%%AABB%&&**WANT**%%AO%**ONLY**%RA%$**THESE**
関連すると定義されている単語のみを抽出したいと思います: I, WANT, ONLY, THESE, WORDS, NEXT, STEP
。他のすべての文字 (数字、英字、特殊記号) は文から削除する必要があります。
この場合、結果の文は次のようになります。
I WANT ONLY THESE.
私はこれらのような行を何千も持っており、それぞれが有用な単語の間に独自の文字セットを持っています. Rでこれらを取り除く効率的な方法はありますか?