非常に大きなデータ セット (> 100 万行) があり、同じ日のすべて (たとえば、1 月 1 日すべて、1 月 2 日すべて、...、12 月 31 日すべて) について計算する必要があるパーセンタイルがあります。同じ年、月、日のデータが異なる行が多数あります。以下はデータの例です。
Year Month Day A B C D
2007 Jan 1 1 2 3 4
2007 Jan 1 5 6 7 8
2007 Feb 1 1 2 3 4
2007 Feb 1 5 6 7 8
.
.
2010 Dec 30 1 2 3 4
2010 Dec 30 5 6 7 8
2010 Dec 31 1 2 3 4
2010 Dec 31 5 6 7 8
したがって、1 月 1 日の 95 パーセンタイルを計算するには、すべての年 (例: 2007 ~ 2010) とすべての列 (A、B、C、D) のすべての 1 月 1 日を含める必要があります。これは、1 月 2 日、1 月 3 日、...、12 月 30 日、12 月 31 日のすべてに対して行われます。これは、入れ子になった if ステートメントを使用して、Excel の小さなデータ セットで簡単に行うことができます。例: ={PERCENTILE(IF(月($B$2:$B$1000000)="1月",IF(日($C$2:$C$1000000)="1",$D$2:$G$1000000)), 95%)}
パーセンタイルは、月と日のみを含む新しいデータ テーブルに追加できます。
Month Day P95 P05
Jan 1
Jan 2
Jan 3
.
.
Dec 30
Dec 31
次に、パーセンタイルを使用して、それぞれの日付 (1 月 1 日など) の列名 A、B、C、D の各データ値が P95 より大きいか、P05 より小さいかを評価する必要があります。次に、1 または 0 を含む最初のデータ テーブルに新しい列を追加できます (パーセンタイルよりも大きいか小さい場合は 1、大きくも小さくもない場合は 0)。
Year Month Day A B C D A05 B05 C05 D05 A95 B95 C95 D95
2007 Jan 1 1 2 3 4 1 0 0 0 0 0 0 0
2007 Jan 1 5 6 7 8 0 0 0 0 0 0 1 1
.
.
2010 Dec 31 5 6 7 8 0 0 0 0 0 0 0 1