次のようなファイル:
fieldname_A: eggs
fieldname_B: bacon
~EOR~
..
..
~EOR~
fieldname_A: eggs
fieldname_C: spam
fieldname_Z: baked beans
~EOR~
合計で、40 の異なるフィールド名、約 10,000 のレコード (EOR は End Of Record) で、フィールドの可変セットが含まれています。ほとんどのフィールド コンテンツは短く、中には非常に長いもの (1000 文字以上) もあります。
これをCSV、またはGoogleスプレッドシートに変換するための、きれいできれいなpythonicの方法を探しています。(データはチェックして修正する必要があります。これを行う人は何人かいます。Google ドキュメントは、バージョンの競合や同期の問題を引き起こすことなく、同じデータで作業するための唯一の迅速な方法です。)
多くのレコード (つまり、スプレッドシートの行) に空のフィールドがあるため、Dictwriter は面倒な方法のように思えます。
入力ファイルの形式がよりXMLっぽいので、XMLに変換してExcelに取り込み、Googleスプレッドシートとしてアップロードしようと考えています。
何か案は?