私はこのようなデータを持っています:
df:
Group Point
A 6000
B 5000
C 1000
D 100
F 70
このdfをグラフ化する前に、データフレームの95パーセンタイルを超える値のみを削除するのが好きです。誰かがそれを行う方法を教えてくれますか?
私はこのようなデータを持っています:
df:
Group Point
A 6000
B 5000
C 1000
D 100
F 70
このdfをグラフ化する前に、データフレームの95パーセンタイルを超える値のみを削除するのが好きです。誰かがそれを行う方法を教えてくれますか?
quantile
関数を使用する
> quantile(d$Point, 0.95)
95%
5800
> d[d$Point < quantile(d$Point, 0.95), ]
Group Point
2 B 5000
3 C 1000
4 D 100
5 F 70
または、「dplyr」ライブラリを使用します。
> quantile(d$Point, 0.95)
95%
5800
> df %>% filter(Point < quantile(df$Point, 0.95))
Group Point
1 B 5000
2 C 1000
3 D 100
4 F 70