フラット化されたファイルに入力データがあります。このデータをテーブルに分割して正規化したい。pandas
つまり、フラット化されたデータをDataFrame
インスタンスに読み取り、いくつかの関数を適用して結果のDataFrame
インスタンスを取得することによって、それをきちんと行うことができますか?
例:
データは、次のような CSV ファイルの形式でディスク上に提供されます。
ItemId ClientId PriceQuoted ItemDescription
1 1 10 scroll of Sneak
1 2 12 scroll of Sneak
1 3 13 scroll of Sneak
2 2 2500 scroll of Invisible
2 4 2200 scroll of Invisible
2 つの DataFrame を作成したい:
ItemId ItemDescription
1 scroll of Sneak
2 scroll of Invisibile
と
ItemId ClientId PriceQuoted
1 1 10
1 2 12
1 3 13
2 2 2500
2 4 2200
pandas
最も単純なケース (上記の例のように、正規化により多対 1 の関係を持つ 2 つのテーブルが生成される) に対する適切な解決策のみがあれば、現在のニーズには十分かもしれません。ただし、将来的にはより一般的なソリューションが必要になる場合があります。