0

私は現在、すべてのメンバーのサブスクリプション日を持つデータフレームに取り組んでいます。月ごとのサブスクリプションを統計したいのですが、デフォルトの動作では、毎月の各日付が個別にカウントされます。

スライスで日付を変更し、毎日01に日付を設定する方法を見つけましたが、パンダ製のものを使用したいと思います。

私がどこに向かうべきかについての提案はありますか?

4

2 に答える 2

2

サブスクリプションの日付がdatetime.datetimeインスタンスの場合、(テストされていない)次のようなものを使用できます(どこにdfありますかDataFrame):

df.groupby(lambda L: (L.year, L.month))

日時がDataFrameのインデックスでない場合は、groupbyを調整する必要があります。

于 2012-09-13T15:12:43.013 に答える
1

これは役に立ちますか?

メンバーIDとサブスクリプションの日付を保持するシリーズを作成しましょう。

In [21]: s = pandas.Series(range(100), pandas.date_range('2010-10-10', periods=100))

年と月でグループ化し、(年/月)の組み合わせごとのサブスクリプション数をカウントします。

In [22]: grouped = s.groupby([s.index.year, s.index.month])

In [23]: nr_subscriptions = grouped.count()

In [24]: nr_subscriptions.index.names = ['Year', 'Month']

In [25]: nr_subscriptions.names = 'nr_subscriptions'

In [26]: nr_subscriptions
Out[26]: 
Year  Month
2010  10       22
      11       30
      12       31
2011  1        17
于 2012-09-13T15:13:17.067 に答える