14

テキストファイルをRにインポートすると、最初の列の最初の値に文字「」が追加されることがあります。なぜこれなのか誰か知っていますか?

たとえば、次の値を持つテキストファイル:

2011_21,3130
2010_51,4153
2011_16,3168
2010_20,3945
2012_38,2099
2012_17,2436
2010_40,2090
2011_2 ,1462

Rで次の結果を表示します。

最初に私はファイルを読みました:

ts_data <- read.csv("yr_wk sales.csv", header=FALSE)
head(ts_data)

返されるデータは次のとおりです。

 V1   V2
1 2011_21 3130
2    2010_51 4153
3    2011_16 3168
4    2010_20 3945
5    2012_38 2099
6    2012_17 2436

これを回避する方法は?

4

4 に答える 4

2

コメントで指摘したように、これはByte Order Markです。ここ ( http://cran.r-project.org/doc/manuals/R-data.html ) で対処についての議論があります。

ファイルのエンコーディングがわかっている場合は、それを整理できます。UTF-8 であると仮定すると、次のようになります。

ts_data <- read.table("yr_wk sales.csv", fileEncoding = "UTF-8")
于 2013-03-14T00:19:46.497 に答える