古い専用データベースからデータを読み取っています。残念ながら、私は(一部の文字列のみ)をEncoding(mychar_vector)
返すことになり"unknown"
ます。残念ながら、私はクローズド ソースc hli
(ホスト言語インターフェイス) のラッパーを使用しているため、おそらくそれについてできることはあまりありません。そうであれば、ここで間違っていることが証明されてうれしいです...
ただし、文字列を使用して作成しなければならなかったいくつかの置換を除いて、文字列ベクトルを見ると (関連する質問を参照)gsub
、問題ないように見えます。エンコーディングの制御を取り戻したいです。エンコーディングを強制的に UTF-8 に設定する方法はありますか? 私がしようとしました
Encoding(mychar_vector) <- "UTF-8"
# or
mychar_vector <- enc2utf8(mychar_vector)
しかし、これはどれもうまくいきませんでした。確認後、すぐ"unknown"
に返却されました。も調べましiconv
たが、マッピングがないため、「不明」からUTF-8に変換する方法は明らかにありません。
RにUTF-8文字のみが含まれているため、エンコーディングをUTF-8に設定できることを伝える方法はありますか? ベクトルの一部の要素はすでに UTF-8 であることに注意してください。