私はパンダで遊んでいて、次の問題を解決する方法を考え出すのに問題があります。bookId と readerId のデータフレームを指定して、特定の A リーダーについて、A が読んだ本を読んだ他のリーダーの数を取得したいと思います。
これはサンプルのデータフレームです
import pandas as pd
df = pd.DataFrame({'bookId': [1,1,2,2,3,3,3,4,4,4,4,4],
'readerId': [1,2,1,3,1,3,4,1,3,4,5,6]})
誰かがこれを手伝ってくれますか、パンダを使用するときにそれを解決するための直感を教えてくれますか? readerId と count 列を持つ新しいデータフレームが出力になります。
アップデート:
実際には、各本の読者の数を取得するのではなく、私が読んだ本を読んだすべての読者の数を取得したいと考えています。したがって、読者が 3 冊の本を読み、他の 20 人がこれらの本のいずれかを読んだ場合、20 人の読者全員が個別であり、特定の読者の本のリストをすべて読んだわけではない場合、20 人を答えとして本当に望んでいます。