1

セットアップ: さまざまな年に建てられた多数の建物のエネルギー使用データがあります。Tableau で作成された日付別のエネルギー使用量を分析したいと考えています。私が最初に抱えた問題は、サンプルに含まれる建物の数が、各年の堅牢なセットを作成するのに十分でなく、結果の出力が大量のノイズを示していることでした。多数の高い外れ値がありますが、0 に近い外れ値はないため、分布は右に歪んでいます。そのため、中央値を使用して少数の (そしておそらく誤った) 高い外れ値の影響を減らしたいと考えています。

望ましい解決策: 5 年間の「移動」または「移動」中央値を作成します。これには、指定された年のいずれかの方向の 2 年以内のすべての建物が含まれ、各セットがその年に集中するようになります。

Tableau で試したこと: WINDOW_MEDIAN([ENERGY],-2,2) を使いたかったのですが、集計関数です。そこで、WINDOW_MEDIAN(MEDIAN([ENERGY],-2,2) を試してみました。残念ながら、これにより 5 つの中央値の中央値が得られます (中央値の中央値?! ブー!)。各 5 年のウィンドウで表されるすべての個別の建物 (集約された中央値ではない)。

これを行う方法について何か考えはありますか?ありがとう!

4

2 に答える 2