私はこのようなデータフレームを持っています
Measure1 Measure2 Measure3 ...
0 1 3
1 3 2
3 0
生成する列の値の出現回数を数えたいと思います:
Measure Count Percentage
0 2 0.25
1 2 0.25
2 1 0.125
3 3 0.373
と
outcome_measure_count = cdss_data.groupby(key_columns=['Measure1'],operations={'count': agg.COUNT()}).sort('count', ascending=True)
最初の列のみを取得します(実際にはgraphlabパッケージを使用していますが、パンダの方が好きです)
誰かが私を助けることができますか?