パンダのマルチレベル DataFame にしたい、かなり大きな Excel ファイル (5k 行) も CSV として与えられました。ファイルは次のように構成されています。
SampleID OtherInfo Measurements Error Notes
sample1 stuff more stuff
36 6
26 7
37 8
sample2 newstuff lots of stuff
25 6
27 7
ここで、測定数は可変です (ゼロの場合もあります)。情報の間に完全な空白の行はなく、他の (文字列) データを含む行の「測定値」列と「エラー」列は空です。これにより、解析が難しくなる可能性があります(?)。この変換を自動化する簡単な方法はありますか? 私の最初のアイデアは、最初にPythonでファイルを解析してから、ループ内のDataFrameスロットにフィードすることですが、それを実装する方法、またはそれが最善の方法であるかどうかさえわかりません。
前もって感謝します!