Pythonのパンダデータフレームについて質問があります。2df
つのサブセットに分割した大きなデータフレームがdf1
ありdf2
ます。 df1
一緒にdf2
すべてを構成するわけではなくdf
、それらは相互に排他的な2つのサブセットにすぎません。これをrgplotでrpy2を使用してプロットし、変数がからのものか、からのものかに基づいてプロットに変数を表示したいと思いdf1
ますdf2
。ggplot2にはメルトされたデータフレームが必要なので、この列をggplotに渡すことができるように、各エントリがからであるdf1
か、であるかを示す列を持つ新しいデータフレームを作成する必要があります。df2
私はこのようにそれをやってみました:
# add labels to df1, df2
df1["label"] = len(df1.index) * ["df1"]
df2["label"] = len(df2.index) * ["df2"]
# combine the dfs together
melted_df = pandas.concat([df1, df2])
これで、次のようにプロットできます。
# plot parameters from melted_df and colour them by df1 or df2
ggplot2.ggplot(melted_df) + ggplot2.ggplot(aes_string(..., colour="label"))
私の質問は、これを行うためのより簡単で簡単な方法があるかどうかです。ggplotは一定の融解/非融解dfsを必要とし、常に手動で融解したフォームをdfの個別のサブセットに追加するのは面倒なようです。ありがとう。