私はかなり大きなデータセットを扱っています (25 の数値属性と 4 つの因子属性を含む、1 か月あたり約 400 万行)。製品ごとの各数値属性 (4 つの要因属性の 1 つ) の箱ひげ図を月ごと (過去 36 か月間) 含むグラフを作成したいと考えています。
製品Aの例として:
-
_ | -
_|_ | _|_
| | | | |
| | _|_ | |
| | | | |---|
| | |---| | |
|---| | | | |
|_ _| | | |_ _|
| |_ _| |
| | |
- | -
-
--------------------------------------------------------------
jan '10 feb '10 mar '10 ................... feb '13
しかし、これらは私が扱う非常に大きなデータセットであるため、どのようにアプローチするかについてのアドバイスが欲しい. 私の考え(しかし、これが可能かどうかはわかりません)は、
- a) 製品ごとの月ごとのデータを抽出する
- b)その特定の月の箱ひげ図を作成します(製品Aの1月10日としましょう)
- c)箱ひげ図の要約データをどこかに保存します
- d) 2013 年 2 月までのすべての月について ac を繰り返す
- e) 保存されたすべての boxplot 要約データを 1 つに結合する
- f) 組み合わせた箱ひげ図をプロットする g) 他のすべての製品について af を繰り返す
したがって、私の主な質問は次のとおりです。個別のボックスロットの要約を 1 つに結合し、これから上でスケッチしたような結合グラフを作成することは可能ですか?
どんな助けでも大歓迎です、
ありがとうございました