私はRを初めて使用します。主にggplot2
ライブラリを使用して統計を視覚化するために使用します。今、私はデータ準備の問題に直面しています。
指定された列で最高値と最低値を持つデータフレームからいくつかの数(2、5、または10)の行を削除し、それらを別のデータフレームに配置する関数を作成し、2つの要素の組み合わせごとにこれを行う必要があります(私の場合: 各日とサーバー)。
ここまでで、次の手順を実行しました (esoph
サンプル データセットを使用した MWE)。
目的のパラメーターに従ってフレームを並べ替えました (ncontrols
例):
esoph<-esoph[with(esoph,order(-ncontrols)) ,]
各因子値の最初/最後のレコードを表示できます (この例では、年齢範囲ごと):
by(data=esoph,INDICES=esoph$agegp,FUN=head,3)
by(data=esoph,INDICES=esoph$agegp,FUN=tail,3)
基本的に、最高値と最低値はわかりますが、それらを別のデータフレームに抽出する方法と、メインのデータフレームから削除する方法がわかりません。
また、上記の例では、1 つの因子 (年齢範囲) の各値の上位/下位のレコードを確認できますが、実際には、2 つの因子の各値の最高記録と最低記録を知る必要があります。この例では、agegp
とalcgp
.
これらの上記の手順が問題ないかどうかさえわかりません-おそらく使用plyr
するとうまくいくでしょうか? ヒントをいただければ幸いです。