python - python pandas groupby: key1 の key2 値の割合

Question

データフレームがあり、それを 2 つのキーでグループ化しましたdf.groupby(['key1',key2'])。key2 エントリごとに、key1 値のパーセントを表示するにはどうすればよいですか?

score 6 · Accepted Answer

Here's an alternative method using one groupby statement.

Group by k1, select column k2 and apply a lambda function. The lambda gets frequency counts for each level of k2 within k1 and then we divide by the count of k1:

In [1]: df.groupby('k1')['k2'].apply(lambda x: pd.value_counts(x)/x.count().astype(float))

Out[1]:
k1
a   x    0.500000
    y    0.500000
b   y    0.666667
    x    0.333333

Performance:

HYRY's method:

100 loops, best of 3: 3.07 ms per loop

My method:

1000 loops, best of 3: 1.98 ms per loop

score 3 · Accepted Answer

"k1" と ("k1", "k2") に対して groupby を 2 回呼び出してから、次のようにしますdiv。

import pandas as pd
k1 = ["a", "a", "a", "a", "b", "b", "b"]
k2 = ["x", "x", "y", "y", "x", "y", "y"]
df = pd.DataFrame({"k1":k1, "k2":k2})

df.groupby(["k1", "k2"]).k2.count().div(
    df.groupby("k1").k1.count().astype(float), level=0)

出力：

k1  k2
a   x     0.500000
    y     0.500000
b   x     0.333333
    y     0.666667

python - python pandas groupby: key1 の key2 値の割合

2 に答える 2

Related

Reference