範囲が次の変数の密度をプロットしたい:
Min. :-1214813.0
1st Qu.: 1.0
Median : 40.0
Mean : 303.2
3rd Qu.: 166.0
Max. : 1623990.0
密度の線形プロットは、範囲 [0,1000] の高い列になり、正の無限大と負の無限大に向かって 2 つの非常に長い裾があります。したがって、変数を対数スケールに変換して、平均の周りで何が起こっているかを確認したいと思います。たとえば、次のようなことを考えています。
log_values = c( -log10(-values[values<0]), log10(values[values>0]))
その結果:
Min. 1st Qu. Median Mean 3rd Qu. Max.
-6.085 0.699 1.708 1.286 2.272 6.211
これに関する主な問題は、値が含まれていないという事実0
です。もちろん、すべての値を からシフトすることはできます0
がvalues[values>=0]+1
、これはデータにいくらかの歪みをもたらします。
この変数を対数目盛に変換する科学的に確実な方法として、どのような方法が認められているでしょうか?