4

R を使用して未加工の Twitter スニペットを検索していますが、次のような非標準の英数字文字があると問題が発生し続けます"̆ºÌøÑ"

[abcdefghijklmnopqrstuvwxyz0123456789]を使用してすべての非文字を取り出したいと思いgsubます。

ないgsubアイテムの置換を指定するために使用できますか?[abcdefghijklmnopqrstuvwxyz0123456789]

4

1 に答える 1

9

次のようにパターンを単純に否定できます[^ ...]

x <- "abcde🏄fgh"
gsub("[^A-Za-z0-9]", "", x)
# [1] "abcdefgh"

[:alnum:]クラスは、指定したすべての特殊文字と一致することに注意してください。gsub("[^[:alnum:]]", "", x)それが機能しない理由です。

于 2013-07-26T10:43:04.820 に答える