データ ビジュアライゼーションを構築しており、軽量で使いやすい基本データ形式として CSV を使用したいと考えています。私のソース データは重い XML なので、Python と lxml を使用して CSV に変換しています。
私の質問はこれです。次のタグのように、XML 内に複数の子タグがある場合<City>
:
<Country>
<Name>France</Name>
<Cities>
<City><Name>Paris</Name></City>
<City><Name>Lyon</Name></City>
</Cities>
</Country>
<Country>
<Name>Germany</Name>
<Cities>
<City><Name>Berlin</Name></City>
<City><Name>Munich</Name></City>
<City><Name>Aachen</Name></City>
</Cities>
</Country>
CSV ファイルでそれらをどのように表現すればよいですか? 2つの選択肢が考えられます。1 つ目は、CityN までの各都市の列を追加することです。
Country,City1,City2,City3
France,Paris,Lyon,,
Germany,Berlin,Munich,Aachen
2 つ目は、すべての都市に配列を使用することです。
Country,Cities
France,[Paris,Lyon]
Germany,[Berlin,Munich,Aachen]
最適な形式は、データのクエリ方法に依存するだけかもしれませんが、確立された、またはより良い方法があるかどうかを確認するために、ここをチェックすると思いました。