複数のデータベース ( Oracle、SQL Serverなど)があるため、データベースの代替として Pandas を使用していますが、一連のコマンドを SQL に相当するものにすることができません。
いくつかの列を含む DataFrame にテーブルがロードされています。
YEARMONTH, CLIENTCODE, SIZE, etc., etc.
SQL では、1 年あたりのさまざまなクライアントの数をカウントするには、次のようにします。
SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;
そして結果は
201301 5000
201302 13245
パンダでそれを行うにはどうすればよいですか?