4

ドイツ語を含む入力ストリームを解析する関数を作成するとします。おもちゃの例の下。私のマシンでは次のように動作します (UTF8 が標準であるため)。

readLines(textConnection("Zürich"))
readLines(textConnection("Z\u00FCrich")) #same thing

UTF-8ただし、現在のロケールエンコーディングでない場合でも機能することを確認したいと思います。たとえば、rApache 内では、デフォルトはascii. したがって、encoding パラメータを渡します。

readLines(textConnection("Zürich", encoding="UTF-8"))
readLines(textConnection("Z\u00FCrich", encoding="UTF-8"))

しかし、これは実際には出力が台無しになります。どうしてこれなの?textConnectionどのプラットフォームまたはロケールでもストリームが適切に読み取られるようにするには、どのように呼び出す必要がありますか?

4

1 に答える 1

7

@flodel による提案は実際にそのトリックを行いました:

readLines(textConnection("Z\u00FCrich", encoding="UTF-8"), encoding="UTF-8")

しかし、なぜこれが必要なのか、私には明らかになりませんでした。

于 2013-07-22T09:22:43.247 に答える