複数の文字ベクトルから複数のパターンを削除したいと考えています。現在、私は行っています:
a.vector <- gsub("@\\w+", "", a.vector)
a.vector <- gsub("http\\w+", "", a.vector)
a.vector <- gsub("[[:punct:]], "", a.vector)
などなど
これは痛いです。この質問と回答を見ていました: R: gsub, pattern = vector and replacement = vectorしかし、問題は解決していません。
mapply
もも機能していませんmgsub
。これらのベクトルを作成しました
remove <- c("@\\w+", "http\\w+", "[[:punct:]]")
substitute <- c("")
どちらmapply(gsub, remove, substitute, a.vector)
でもないmgsub(remove, substitute, a.vector) worked.
a.vector
次のようになります。
[4951] "@karakamen: Suicide amongst successful men is becoming rampant. Kudos for staing the conversation. #mental"
[4952] "@stiphan: you are phenomenal.. #mental #Writing. httptxjwufmfg"
私が欲しい:
[4951] "Suicide amongst successful men is becoming rampant Kudos for staing the conversation #mental"
[4952] "you are phenomenal #mental #Writing" `