次のような CSV データがあります。
code, label, value
ABC, len, 10
ABC, count, 20
ABC, data, 102
ABC, data, 212
ABC, data, 443
...
XYZ, len, 11
XYZ, count, 25
XYZ, data, 782
...
dataエントリー数はそれぞれ異なりますcode。(これは私の質問には関係ありません。指摘するだけです。)
dataそれぞれのエントリを分析する必要がありますcode。これには、中央値の計算、グラフのプロットなどが含まれます。これは、datafor eachcodeを分離して数値にする必要があることを意味します。
この種のことよりもこれを行うためのより良い方法はありますか:
x = read.csv('dataFile.csv, header=T)
...
median(as.numeric(subset(x, x$code=='ABC' & x$label=='data')$value))
boxplot(median(as.numeric(subset(x, x$code=='ABC' & x$label=='data')$value)))