python - パンダの一意の値のカウントごとにキーカウントをプロットします

Question

一意のIDカウント（x = unique_id_count、y = key_count）ごとのキーの数をプロットするデータのセットがあり、を利用する方法を学習しようとしています。pandas

この場合：

unique_ids1=キーカウント2

unique_ids2=キーカウント1

from pandas import *
key_items = ("a", "a", "a", "a", "a", "b", "b", "b", "b", "b", "c", "c", "c")
id_data = ("X", "X", "X", "X", "X", "X", "X", "Y", "Y", "Y", "X", "X", "X")

df = DataFrame({'keys': key_items, 'ids': id_data})

データフレームからデータを取り出して再構築し、新しいデータフレームを再構築することで、データを必要なものにマングルすることができました。この場合、パンダなしですべてをPythonで実行する方がおそらく良いでしょう...

unique_values = defaultdict(list)
for items in df.itertuples(index=False):
    key = items[1]
    v = items[0]
    unique_values[key].append(v)

unique_values_count = {}
for k, values in unique_values.iteritems():
    unique_values_count[k] = [len(set(values))]

# reformat for plotting
key_col = ("a", "b", "c")
id_col = [unique_values_count[k][0] for k in key_col]



df2 = DataFrame({"keys":key_col, "unique_id_count": id_col})
df2.groupby("unique_id_count").size().plot(kind="bar")

初期データフレームを使用してこれをより直接的に行うためのより良い方法はありますか？

score 52 · Accepted Answer

52

直接使ってみませんかvalue_counts()

pd.value_counts(df['ids']).plot.bar()

于 2017-07-12T17:00:08.627 に答える

score 29 · Accepted Answer

29

s = df.groupby("keys").ids.agg(lambda x:len(x.unique()))
pd.value_counts(s).plot(kind="bar")

于 2013-02-28T03:25:20.130 に答える

score 4 · Accepted Answer

簡単な解決策は-

df['your_column'].count_values().plot.bar(rot=0)

値が多すぎる場合にバーの数を制限したい場合-

df['your_column'].count_values()[:no_of_values].plot.bar(rot=0)

python - パンダの一意の値のカウントごとにキーカウントをプロットします

3 に答える 3

Related

Reference