42

R に大量の単語を含む文字列があります。文字列を表示すると、次のようなテキストを含む大量のテキストが表示されます。

>docs

....

\u009cYes yes for ever for ever the boys cried in their ringing voices with softened faces

....

したがって、これらの \u009 文字 (すべて、一部はわずかに異なる数字) を文字列から削除する方法を考えています。を使用してみましgsub()たが、文字列からコンテンツを削除するのに効果的ではありませんでした。

4

2 に答える 2

58

これはうまくいくはずです

gsub('\u009c','','\u009cYes yes for ever for ever the boys ')
"Yes yes for ever for ever the boys "

ここで 009c は Unicode の 16 進数です。常に 4 桁の 16 進数を指定する必要があります。が多数ある場合の解決策の 1 つは、それらをパイプで区切ることです。

gsub('\u009c|\u00F0','','\u009cYes yes \u00F0for ever for ever the boys and the girls')

"Yes yes for ever for ever the boys and the girls"
于 2013-03-02T04:06:12.660 に答える
12

試す: gsub('\\$', '', '$5.00$')

于 2016-04-19T10:53:29.060 に答える