次のタイプと構造のデータを含むファイルがあります。
<data>
<from>A</from>
<to>B</to>
<data>
<name>EXAMPLE ONE</name>
<info>
<some_data>1</some_data>
<more_data>2</more_data>
</info>
<random>
<some_tag>
</foobar>
<foo>
<bar />
</foo>
</random>
</data>
<data>
<name>EXAMPLE TWO</name>
<info>
<some_data>3</some_data>
<more_data>4</more_data>
</info>
<random>
<some_tag>
</foobar>
<foo>
<bar />
</foo>
</random>
</data>
</data>
<data>
<from>C</from>
<to>D</to>
<data>
<name>EXAMPLE</name>
<info>
<some_data>1</some_data>
<more_data>2</more_data>
</info>
<random>
<some_tag>
</foobar>
<foo>
<bar />
</foo>
</random>
</data>
</data>
データは、n 回繰り返すことができ、かつ n 回繰り返される最も内側の<data>...</data>
タグを除いて、ファイル内のこの正確な構造に続きます。データ構造は常にタグで始まり、タグ<data>
で続きます。<from>...</from>
<to>...</to>
私がやりたいことは、データ ブロックの説明としてとを<data>
使用して、最も外側のタグの間のすべてのデータを抽出することです。もちろん、最も内側のタグを互いに分離し、このデータを保存して、最も外側のデータが親データに関連していることが明確になるようにしたいと考えています。<to>
<from>
<data>
どのようにデータを保存したいのか正確にはわかりませんので、例を挙げていただければ幸いです!
私はこれを Python モジュール BeautifulSoup でテストしており、ここで多くの例を検索して読んでいますが、正しい方向に向けることができるものは何も見つかりませんでした。
ありがとう!