パンダに出くわしましたが、やりたい簡単な計算には理想的です。私は SAS のバックグラウンドを持っていて、proc freq に取って代わると考えていました。将来私がやりたいことに合わせて拡張できるようです。しかし、私は単純なタスクに頭を悩ませることができないようです(見るべきかどうか、またはなどpivot/crosstab/indexing
を持っているべきかどうかはわかりません...)。次のことを行う方法について、誰かが私にいくつかの指針を教えてくれますか?Panel
DataFrames
2 つの CSV ファイルがあります (1 つは 2010 年用、もう 1 つは 2011 年用 - 単純なトランザクション データ) - 列はカテゴリと金額です
2010:
AB,100.00
AB,200.00
AC,150.00
AD,500.00
2011:
AB,500.00
AC,250.00
AX,900.00
これらは個別の DataFrame オブジェクトにロードされます。
私がやりたいのは、カテゴリ、カテゴリの合計、およびカテゴリの頻度を取得することです。
2010:
AB,300.00,2
AC,150.00,1
AD,500.00,1
2011:
AB,500.00,1
AC,250.00,1
AX,900.00,1
などを使用する必要があるかどうかを判断できませんpivot/crosstab/groupby/an index
...合計または頻度のいずれかを取得できます-両方を取得できないようです...でやりたいので、もう少し複雑になります月ごとですが、誰かが親切に私に正しいテクニック/方向性を教えてくれれば、そこから行くことができると思います.