かなり大きなデータセット用の事前にビニングされた頻度表があります。つまり、ビンの 1 つの列ベクトルと、それらのビンに関連付けられたカウントの 1 つの列ベクトルです。さらにビニングを行い、既存のカウントを合計して、R にこのデータのヒストグラムをプロットしてもらいたいと思います。たとえば、事前にビン化されたデータに [(0.01, 5000), (0.02, 231), (0.03, 948)] のようなものがある場合、最初の数値はビンで、2 番目の数値はカウントです。新しいビンの幅として 0.04 を選択すると、[(0.04, 6179)] になると思います。Rでこれを行うための最速かつ最も簡単な方法は何ですか?
3817 次
2 に答える
6
ggplot2 に答えがあるようです。
library(ggplot2)
qplot(bin, data=cbind(bins,counts), weight=counts, geom="histogram")
于 2010-09-24T17:29:39.593 に答える
1
CRANの新しいHistogramToolsパッケージには、まさにこれを行うための便利な関数が多数含まれています。あなたの例では、ヒストグラムの各ポイントで 3 つの隣接するバケットをマージして、バケット数が 1/3 の新しいヒストグラムを生成する場合は、MergeBuckets
関数を使用できます。
install.packages("HistogramTools")
library(HistogramTools)
h <- hist(rexp(1000), breaks=60)
plot(MergeBuckets(h, adj.buckets=3))
または、MergeBuckets() に常に同じ数の隣接するバケットをマージするように指示するのではなく、必要な新しいブレークポイントのリストを明示的に指定することもできます。
于 2013-10-10T18:09:00.270 に答える