重複の可能性:
Rはデータフレーム内の変数を因子として解釈します。そうではない
R で記述した一部のコードに問題があり、R の要素の理解が不十分なために問題が発生していると思います。
私がやろうとしていること:列番号があり、ビンの説明の別の列を作成したい (例: bin1、bin2 などに対応する 1、2、3 など)。
コードは次のとおりです。
## import data to data frame
rawData = read.table("Data.csv", sep = ",", header = TRUE)
## reduce socre into bins
rawData["s10_BIN"] = NA
for(i in 1:length(rawData[,"foo"]))
{
if(rawData[i,"s10"] > 0 && rawData[i,"s10"] <= .5)
{
rawData[i,"s10_BIN"] = 1
}
else if(rawData[i,"s10"] > .5 && rawData[i,"s10"] <= 1)
{
rawdata[i,"s10_BIN"] = 2
}
else if(rawData[i,"s10"] > 1 && rawData[i,"s10"] <= 1.5)
{
rawData[i,"s10_BIN"] = 3
}
else if(rawData[i,"s10"] > 1.5 && rawData[i,"s10"] <= 2)
{
rawData[i,"s10_BIN_BIN"] = 4
}
else
rawData[i,"s10_BIN"] = 0
}
エラーが発生し続けます
1: In Ops.factor(rawData[i, "s10"], 0) : > not meaningful for factors
2: In Ops.factor(rawData[i, "s10"], 0.5) :
<= not meaningful for factors
私が欠けているものについて誰かが私に洞察を与えることができますか? ありがとう!
編集: データの最初の 2 行は次のとおりです。
rawData[1:2,]
ID PRODUCT GROUP MARKET s10 CLAIMS NUM_CLAIMS s10_BIN
1 1 foo A C NULL -5 2 NA
2 2 foo A D 1.064 1 1 NA
問題はNULL値である可能性があると感じています...