companies = users_file2.set_index('Created').Clean_Company2
companies = companies.groupby(pd.TimeGrouper(freq='W')).unique()
weekly = companies[:].apply(pd.Series).stack().drop_duplicates()
weekly = weekly.groupby(level=0).apply(lambda x: x.tolist())
weekly = weekly.apply(lambda x: len(x))
次に、以下を取得するために実行drop_duplicates
しました。weekly
Created
2015-02-08 3
2015-02-15 1
2015-03-01 1
2015-06-21 8
2015-07-05 1
ここで、不足している週を 0 で埋めたいと思います。and で遊んでみましたが、たとえば、次の操作を行うと、いくつかの奇妙なエラーが発生しますresample
。reindex
df.resample('W').fillna(0)
次のエラーが表示されます。
AttributeError: 'int' object has no attribute 'lower'
をコメントアウトするfillna(0)
と、プロットで確認したDatetimeIndexResampler
オブジェクトが目的の動作をしません(何をしているのかわかりません。それを行うとすべての値がバイナリになりますが、すべての週を埋めます)
インデックスは でDateTimeIndex
、値はint64
です。