問題タブ [iqr]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
2387 参照

r - dplyr を使用して R のすべての列に iqr フィルターを適用する

IQR 間のすべての列のデータをフィルタリングします。filter_all(df_name,IQR(.)) を使用してみましたが、同じデータフレームを返します

0 投票する
1 に答える
3701 参照

python - pandas groupby から四分位範囲と中央値を取得し、言及されていないすべての日付をゼロで埋めます

私は次のようなデータフレームを持っています(私のものは非常に大きいことを除いて):

...次に、次の groupby と集計 ( by user1user2およびday)を取得するとします。

1 日は0 ~ 364 (365 日) です。私が欲しいのは、ゼロがカウントされないことを除いて、すべての日の各ユーザーのカウントの四分位範囲 (および中央値) です

除外されたすべての日に明示的なゼロがあれば、人生はもっと楽だったでしょう:

...それならできますdf.reset_index().agg({'quantity':scipy.stats.iqr})が、非常に大きなデータフレーム(上記の例はダミーです)で作業しているため、ゼロでの再インデックスは不可能です。

私はそれを行う方法を知っています: 365 日があることを知っているので、残りの数字をゼロで埋める必要があります:

scipy.stats.iqrその(および中央値)を取得します。ただし、これにはすべてのuser1-user2ペアの反復が含まれます。経験上、かなり時間がかかります。

これに対するベクトル化されたソリューションはありますか? また、中央値も取得する必要があり、同じアプローチが維持されるべきだと思います。

0 投票する
0 に答える
61 参照

r - boxplot: 経時的に一定の iqr

私のサンプルは、いくつかの変数といくつかの期間で構成されるパネル データ セットです。iqr メソッドで外れ値を検出して処理します。つまり、外れ値は、iqr の 3 番目/1 番目の四分位プラス/マイナス 1.5 倍の上/下の観測値です。誰もが知っているように、これは箱ひげ図で視覚化できます。

概念上の理由から、外れ値を検出して処理する場合、サンプル全体が考慮されます。変数の四分位数と iqr は、時系列の合計に基づいています。単純な boxplot 関数で外れ値を視覚化すると、各期間の四分位数と iqr がプロットされます (添付のプロットを参照)。ただし、外れ値の検出と処理方法を正しく示すプロットを作成したいと考えています。つまり、中央値、ボックス、ウィスカーは、時間の経過とともに一定でなければなりません。外れ値が属する年はもう観察できないため、データを 1 つのプロットにまとめたくありません。

ここに画像の説明を入力

ggplot2 で boxplot を作成する必要があると思いますか?