定義
df<-read.table(textConnection('egg 1 20 a
egg 2 30 a
jap 3 50 b
jap 1 60 b'))
st
> df
V1 V2 V3 V4
1 egg 1 20 a
2 egg 2 30 a
3 jap 3 50 b
4 jap 1 60 b
私のデータには因数がないため、因数を文字に変換します。
> df$V1 <- as.character(df$V1)
> df$V4 <- as.character(df$V4)
V1を維持してデータフレームを「折りたたむ」ことを希望します:
- V2の最大
- V3の平均
- V4 のモード (この値は実際には V1 グループ内では変更されないため、最初、最後なども変更される可能性があります。)
これは一般的な質問であることに注意してください。たとえば、私のデータセットははるかに大きく、折りたたむときにさまざまな関数 (さまざまな変数に対して last、first、min、max、variance、st.dev. など) を使用したい場合があります。したがって、関数の引数は非常に長くなる可能性があります。
この場合、次の形式の出力が必要です。
> df.collapse
V1 V2 V3 V4
1 egg 2 25 a
2 jap 3 55 b