次のような CSV データがあります。
code, label, value
ABC, len, 10
ABC, count, 20
ABC, data, 102
ABC, data, 212
ABC, data, 443
...
XYZ, len, 11
XYZ, count, 25
XYZ, data, 782
...
data
エントリー数はそれぞれ異なりますcode
。(これは私の質問には関係ありません。指摘するだけです。)
data
それぞれのエントリを分析する必要がありますcode
。これには、中央値の計算、グラフのプロットなどが含まれます。これは、data
for eachcode
を分離して数値にする必要があることを意味します。
この種のことよりもこれを行うためのより良い方法はありますか:
x = read.csv('dataFile.csv, header=T)
...
median(as.numeric(subset(x, x$code=='ABC' & x$label=='data')$value))
boxplot(median(as.numeric(subset(x, x$code=='ABC' & x$label=='data')$value)))