2

私はかなり大きなデータセットを扱っています (25 の数値属性と 4 つの因子属性を含む、1 か月あたり約 400 万行)。製品ごとの各数値属性 (4 つの要因属性の 1 つ) の箱ひげ図を月ごと (過去 36 か月間) 含むグラフを作成したいと考えています。

製品Aの例として:

                    - 
      _             |          -
     _|_            |         _|_
    |   |           |        |   |
    |   |          _|_       |   |
    |   |         |   |      |---|
    |   |         |---|      |   |
    |---|         |   |      |   |
    |_ _|         |   |      |_ _|
      |           |_ _|        |
      |             |          |
      -             |          -
                    -

 --------------------------------------------------------------
    jan '10      feb '10    mar '10 ................... feb '13

しかし、これらは私が扱う非常に大きなデータセットであるため、どのようにアプローチするかについてのアドバイスが欲しい. 私の考え(しかし、これが可能かどうかはわかりません)は、

  • a) 製品ごとの月ごとのデータを抽出する
  • b)その特定の月の箱ひげ図を作成します(製品Aの1月10日としましょう)
  • c)箱ひげ図の要約データをどこかに保存します
  • d) 2013 年 2 月までのすべての月について ac を繰り返す
  • e) 保存されたすべての boxplot 要約データを 1 つに結合する
  • f) 組み合わせた箱ひげ図をプロットする g) 他のすべての製品について af を繰り返す

したがって、私の主な質問は次のとおりです。個別のボックスロットの要約を 1 つに結合し、これから上でスケッチしたような結合グラフを作成することは可能ですか?

どんな助けでも大歓迎です、

ありがとうございました

4

2 に答える 2

2

これは、おそらく何かを調理できる長い例です。

個々のデータセットを読み込みます - 同じデータを上書きするか、使用している大きなデータを考慮して、このステップを関数でラップすることができます。

dset1 <- 1:10
dset2 <- 10:20
dset3 <- 20:30

boxplot 情報を保存します。plot=FALSE

result1 <- boxplot(dset1,plot=FALSE,names="month1")
result2 <- boxplot(dset2,plot=FALSE,names="month2")
result3 <- boxplot(dset3,plot=FALSE,names="month3")

データをグループ化してプロットするbxp

mylist <- list(result1, result2, result3)
groupbxp <- do.call(mapply, c(cbind, mylist))
bxp(groupbxp)

結果:

ここに画像の説明を入力

于 2013-03-01T01:05:39.640 に答える
0

組み合わせた値のアセンブリに対して「fivenum」値の値がどうなるかを絶対的な精度で予測することはできません。2 つのグループがあり、各グループに 75 パーセンタイルがあり、各グループに観測値のカウントがある状況について考えてみてください。パーセンタイルが等しくないとします。パーセンタイルの加重平均をとって、集計値の 75 パーセンタイルを取得することはできません。のヘルプ ページを参照してください?boxplot.stats。ただし、fivenum コレクションの中央値を使用することで、非常に近くなる可能性があると思います。ここから試験を開始することもできます。

 mo.mtx <- tapply(dat$values, dat$month, function( mo.dat) c( fivenum(mo.dat), length(mo.dat) ) 
 matplot( mo.mtx[, 1:5] , type="l" )
于 2013-02-28T23:45:53.997 に答える