私はCSVで外国からの著者名をたくさん持っていますが、Rはそれをうまく読みます。Mechanical Turkにアップロードするためにそれらをクリーンアップしようとしています(これは、1つの国際化されたキャラクターでさえ本当に好きではありません)。そうすることで、私は質問があります(後で投稿されます)が、私はdput
それらを賢明な方法でさえすることができません:
> dput(df[306,"primauthfirstname"])
"Gwena\xeblle M"
> test <- "Gwena\xeblle M"
<simpleError in nchar(val): invalid multibyte string 1>
つまり、dput
正常に機能しますが、結果をに貼り付けると失敗します。dput
コピー/貼り付けをRに戻すために必要な情報を出力しないのはなぜですか(おそらく、必要なのは、構造ステートメントにエンコーディング属性を追加することだけですか?)。どうすればそうすることができますか?
\xeb
Rに関する限り、これは有効な文字であることに注意してください。
> gsub("\xeb","", turk.df[306,"primauthfirstname"] )
[1] "Gwenalle M"
ただし、文字を個別に評価することはできません。16進コード\ x ##か、何もありません。
> gsub("\\x","", turk.df[306,"primauthfirstname"] )
[1] "Gwena\xeblle M"