私は現在、すべてのメンバーのサブスクリプション日を持つデータフレームに取り組んでいます。月ごとのサブスクリプションを統計したいのですが、デフォルトの動作では、毎月の各日付が個別にカウントされます。
スライスで日付を変更し、毎日01に日付を設定する方法を見つけましたが、パンダ製のものを使用したいと思います。
私がどこに向かうべきかについての提案はありますか?
サブスクリプションの日付がdatetime.datetime
インスタンスの場合、(テストされていない)次のようなものを使用できます(どこにdf
ありますかDataFrame
):
df.groupby(lambda L: (L.year, L.month))
日時がDataFrameのインデックスでない場合は、groupbyを調整する必要があります。
これは役に立ちますか?
メンバーIDとサブスクリプションの日付を保持するシリーズを作成しましょう。
In [21]: s = pandas.Series(range(100), pandas.date_range('2010-10-10', periods=100))
年と月でグループ化し、(年/月)の組み合わせごとのサブスクリプション数をカウントします。
In [22]: grouped = s.groupby([s.index.year, s.index.month])
In [23]: nr_subscriptions = grouped.count()
In [24]: nr_subscriptions.index.names = ['Year', 'Month']
In [25]: nr_subscriptions.names = 'nr_subscriptions'
In [26]: nr_subscriptions
Out[26]:
Year Month
2010 10 22
11 30
12 31
2011 1 17