私は〜5つの非常に大きなベクトル(〜108 MMエントリ)を持っているので、Rでそれらを使って行うプロット/ものにはかなり時間がかかります。
私はそれらの分布 (ヒストグラム) を視覚化しようとしていますが、あまり時間をかけずに R でヒストグラム分布を重ね合わせる最良の方法は何かと考えていました。最初に分布をヒストグラムに当てはめ、次にすべての分布線が 1 つのプロットに収まるようにプロットすることを考えています。
それを行う方法についていくつか提案はありますか?
私のベクトルは次のとおりです。
x1, x2, x3, x4, x5.
私はこのコードを使用しようとしています: Overlaying histograms with ggplot2 in R
3 つのベクトルに使用しているコードの例 (R はプロットに失敗します):
n = length(x1)
dat <- data.frame(xx = c(x1, x2, x3),yy = rep(letters[1:3],each = n))
ggplot(dat,aes(x=xx)) +
geom_histogram(data=subset(dat,yy == 'a'),fill = "red", alpha = 0.2) +
geom_histogram(data=subset(dat,yy == 'b'),fill = "blue", alpha = 0.2) +
geom_histogram(data=subset(dat,yy == 'c'),fill = "green", alpha = 0.2)
しかし、プロットを作成するには永遠に時間がかかり、最終的にはRから追い出されます.ggplot2を大きなベクトルに効率的に使用する方法についてのアイデアはありますか? 私の場合、5 * 108MMエントリのデータフレームを作成してからプロットする必要があったようですが、私の場合は非常に非効率的です。
ありがとう!