次の動作を行うために、パンダで 2 つのデータフレームを結合しようとしています: 指定された列で結合したいのですが、冗長な列がデータフレームに追加されないようにします。これは、インデックス列のオプションの引数を取らないように見えるということをcombine_first
除いて類似しています。combine_first
例:
# combine df1 and df2 based on "id" column
df1 = pandas.merge(df2, how="outer", on=["id"])
上記の問題は、「id」以外の df1/df2 に共通の列が df1 に (_x,_y
プレフィックス付きで) 2 回追加されることです。どうすれば次のようなことができますか:
# Do outer join from df2 to df1, matching items by "id" but not adding
# columns that are redundant (df1 takes precedence if the values disagree)
df1.combine_first(df2, on=["id"])
これはどのように行うことができますか?