Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
R を使用して未加工の Twitter スニペットを検索していますが、次のような非標準の英数字文字があると問題が発生し続けます"̆ºÌøÑ"。
"🏄"
[abcdefghijklmnopqrstuvwxyz0123456789]を使用してすべての非文字を取り出したいと思いgsubます。
[abcdefghijklmnopqrstuvwxyz0123456789]
gsub
にないgsubアイテムの置換を指定するために使用できますか?[abcdefghijklmnopqrstuvwxyz0123456789]
次のようにパターンを単純に否定できます[^ ...]。
[^ ...]
x <- "abcde🏄fgh" gsub("[^A-Za-z0-9]", "", x) # [1] "abcdefgh"
[:alnum:]クラスは、指定したすべての特殊文字と一致することに注意してください。gsub("[^[:alnum:]]", "", x)それが機能しない理由です。
[:alnum:]
gsub("[^[:alnum:]]", "", x)