1

私はウェブサイトからデータを読んでいます: https://raw.github.com/johnmyleswhite/ML_for_Hackers/master/02-Exploration/data/01_heights_weights_genders.csv

(1) 最初に、次のコードを使用してデータを R に直接読み込もうとしました。

raw_data <- read.table("https://raw.github.com/johnmyleswhite/ML_for_Hackers/master/02-Exploration/data/01_heights_weights_genders.csv", stringsAsFactors=FALSE)

しかし、次のエラーを受け取りました。

Error in file(file, "rt") : cannot open the connection
In addition: Warning message:
In file(file, "rt") : unsupported URL scheme

そのため、データを .csv ファイルにコピーしただけです。このファイルを「Raw_Data.csv」としてディレクトリに保存しました。ただし、データはすべて 1 つの列にあります。

(2) 次のコードを使用して、このファイルを R に読み込みます

raw_data <- read.csv("Raw_Data.csv", stringsAsFactors=FALSE)

私がやりたいのは、この 1 つの列を 3 つに分割し、列名を「性別」、「身長」、「体重」とすることです。私が試したのはこれでした:

for(i in 1:nrow(raw_data)){
    raw_data$Gender[i] <- strsplit(raw_data$Gender[i], ",")[[1]][1]
    raw_data$Height[i] <- strsplit(raw_data$Height[i], ",")[[1]][2]
    raw_data$Weight[i] <- strsplit(raw_data$Weight[i], ",")[[1]][3]
}

ただし、次のエラーが表示されます。

Error in strsplit(raw_data$Gender[i], ",") : non-character argument

よろしくお願いします。

4

2 に答える 2

1

3列でデータをRに読み込むことができました。

データをどのように .csv ファイルに保存したかはわかりませんが、データを直接 Notepad++ ( http://notepad-plus-plus.org/ ) にコピーし、テキスト ファイルとして保存して、 R with read.csv("filename.txt")。

于 2013-09-26T21:25:16.107 に答える
1

引用符のせいかもしれませんが、

試す

raw_data <- read.csv("Raw_Data.csv", stringsAsFactors=FALSE, quotes="\"")
于 2013-09-26T21:40:06.123 に答える