2

データフレームのすべての行を文字列に変換する必要があります。

サンプルデータは次のとおりです。

1.12331,4.331123,4.12335435,1,"asd"
1.123453345,5.654456,4.889999,1.45456,"qwe"
2.00098,5.5445,4.768799,1.999999,"ttre"

このデータを R に読み込み、データフレームを取得しました。

td<-read.table("test.csv", sep=',')

apply(td, 2, as.character)このデータを実行すると、

    V1       V2       V3       V4       V5    
[1,] "1.1233" "4.3311" "4.1234" "1.0000" "asd" 
[2,] "1.1235" "5.6545" "4.8900" "1.4546" "qwe" 
[3,] "2.0010" "5.5445" "4.7688" "2.0000" "ttre"

しかし、数値列に対してのみ同じことを行うと、異なる結果が得られました。

apply(td[,1:4], 2, as.character)

     V1            V2         V3           V4        
[1,] "1.12331"     "4.331123" "4.12335435" "1"       
[2,] "1.123453345" "5.654456" "4.889999"   "1.45456" 
[3,] "2.00098"     "5.5445"   "4.768799"   "1.999999"

その結果、ソース ファイルとまったく同じ値を持つデータフレームが必要になります。私が間違っていることは何ですか?

4

2 に答える 2

4

で設定colClassesread.table()て、すべての列を にすることができますcharacter

 td <- read.table("test.csv", sep=',',colClasses="character")
 td
           V1       V2         V3       V4   V5
1     1.12331 4.331123 4.12335435        1  asd
2 1.123453345 5.654456   4.889999  1.45456  qwe
3     2.00098   5.5445   4.768799 1.999999 ttre

 str(td)
'data.frame':   3 obs. of  5 variables:
 $ V1: chr  "1.12331" "1.123453345" "2.00098"
 $ V2: chr  "4.331123" "5.654456" "5.5445"
 $ V3: chr  "4.12335435" "4.889999" "4.768799"
 $ V4: chr  "1" "1.45456" "1.999999"
 $ V5: chr  "asd" "qwe" "ttre"
于 2013-02-12T11:11:35.110 に答える
2

これを行う最善の方法は、最初にデータを文字として読み取ることです。colClassesread.table への引数を使用してこれを行うことができます。

td <- read.table("test.csv", sep=',', colClasses="character")
于 2013-02-12T11:11:26.213 に答える