RapidXML を使用して XML ツリーを解析することに興味があります。ただし、この XML には、必要のない行の層がいくつかあります。これは、それが遺伝的ツリーの表現であり、多くのレイヤーが「クレード」と呼ばれているためです。これは、私にとって本質的に役に立たない情報です.
たとえば、ドキュメントのサンプルは次のとおりです。
<phylogeny rooted="true" rerootable="false">
<clade>
<clade>
<taxonomy>
<scientific_name>Neomura</scientific_name>
</taxonomy>
<clade>
<taxonomy>
<id provider="uniprot">2759</id>
<scientific_name>Eukaryota</scientific_name>
<rank>superkingdom</rank>
</taxonomy>
............
</clade>
</clade>
</clade>
</phylogeny>
ツリーのこの部分は、真核生物がネオムラの子であり、ネオムラが系統発生の子であることを表しているはずです。ただし、クレードノードの外観を考慮せずに RapidXML を使用して解析すると、いくつかの不要なレイヤーが作成されます。誰もこれを進める方法について何か考えがありますか?