次のように、ggplot(多くの場合、長い形式のデータフレームが必要です)で使用するプロットのためにパンダデータフレームを溶かしました:
test = pandas.melt(iris, id_vars=["Name"], value_vars=["SepalLength", "SepalWidth"])
これNameにより、アイリス データセットのフィールドがインデックスに保持されますが、列が長い形式にSepalLength変換されます。SepalWidth
test.ix[0:10]
Out:
Name variable value
0 Iris-setosa SepalLength 5.1
1 Iris-setosa SepalLength 4.9
2 Iris-setosa SepalLength 4.7
3 Iris-setosa SepalLength 4.6
4 Iris-setosa SepalLength 5.0
5 Iris-setosa SepalLength 5.4
6 Iris-setosa SepalLength 4.6
7 Iris-setosa SepalLength 5.0
8 Iris-setosa SepalLength 4.4
9 Iris-setosa SepalLength 4.9
10 Iris-setosa SepalLength 5.4
このデータフレームを元に戻すにはどうすればよいですか? 列を保持したいのですNameが、フィールドの値variableを別の列に変換します。フィールドは一意ではNameないため、インデックスとして使用できないと思います。私の印象でpivotは、これは正しい機能ですが、正しくありません。
test.pivot(columns="variable", values="value")
KeyError: u'no item named '
どうすればこれを行うことができますか? また、長い形式の複数の列があるデータフレームを解凍できますか?つまり、上記testの列のような複数の列がありvariableますか? columns単一の値ではなく、列のリストを受け入れる必要があることを意味します。ありがとう。