この形式の 2 つのデータフレームがあるとします (それらdf1
を および と呼びますdf2
)。
+------------------------+------------------------+--------+
| user_id | business_id | rating |
+------------------------+------------------------+--------+
| rLtl8ZkDX5vH5nAx9C3q5Q | eIxSLxzIlfExI6vgAbn2JA | 4 |
| C6IOtaaYdLIT5fWd7ZYIuA | eIxSLxzIlfExI6vgAbn2JA | 5 |
| mlBC3pN9GXlUUfQi1qBBZA | KoIRdcIfh3XWxiCeV1BDmA | 3 |
+------------------------+------------------------+--------+
user_id
と に共通するすべての行のデータフレームを取得しようとしていdf1
ますdf2
。(つまり、 auser_id
が と の両方df1
にある場合df2
、出力データフレームに 2 つの行を含めます)
これにアプローチする方法はたくさん考えられますが、どれも扱いにくいと思います。たとえば、各データフレームですべての一意user_id
の を見つけ、それぞれのセットを作成し、それらの交点を見つけ、結果のセットで 2 つのデータフレームをフィルター処理し、フィルター処理された 2 つのデータフレームを連結することができます。
それが最善のアプローチかもしれませんが、Pandas が賢いことはわかっています。これを行う簡単な方法はありますか?私は見ましたmerge
が、それは私が必要としているものではないと思います。