次のように、ggplot(多くの場合、長い形式のデータフレームが必要です)で使用するプロットのためにパンダデータフレームを溶かしました:
test = pandas.melt(iris, id_vars=["Name"], value_vars=["SepalLength", "SepalWidth"])
これName
により、アイリス データセットのフィールドがインデックスに保持されますが、列が長い形式にSepalLength
変換されます。SepalWidth
test.ix[0:10]
Out:
Name variable value
0 Iris-setosa SepalLength 5.1
1 Iris-setosa SepalLength 4.9
2 Iris-setosa SepalLength 4.7
3 Iris-setosa SepalLength 4.6
4 Iris-setosa SepalLength 5.0
5 Iris-setosa SepalLength 5.4
6 Iris-setosa SepalLength 4.6
7 Iris-setosa SepalLength 5.0
8 Iris-setosa SepalLength 4.4
9 Iris-setosa SepalLength 4.9
10 Iris-setosa SepalLength 5.4
このデータフレームを元に戻すにはどうすればよいですか? 列を保持したいのですName
が、フィールドの値variable
を別の列に変換します。フィールドは一意ではName
ないため、インデックスとして使用できないと思います。私の印象でpivot
は、これは正しい機能ですが、正しくありません。
test.pivot(columns="variable", values="value")
KeyError: u'no item named '
どうすればこれを行うことができますか? また、長い形式の複数の列があるデータフレームを解凍できますか?つまり、上記test
の列のような複数の列がありvariable
ますか? columns
単一の値ではなく、列のリストを受け入れる必要があることを意味します。ありがとう。