R の gsub を使用して、アポストロフィを除くすべての句読点をテキストから削除したいと思います。私は正規表現にかなり慣れていませんが、学んでいます。
例:
x <- "I like %$@to*&, chew;: gum, but don't like|}{[] bubble@#^)( gum!?"
gsub("[[:punct:]]", "", as.character(x))
現在の出力 (don't にアポストロフィなし)
[1] "I like to chew gum but dont like bubble gum"
希望する出力 (アポストロフィーはそのままにしておきたい)
[1] "I like to chew gum but don't like bubble gum"