データ再生ユーティリティから作成された一連のXMLファイルがあります。ユーティリティは、正しく形成されたXMLタグを生成します。残念ながら、ユーティリティは完璧ではありません。シリアル化しようとするJavaオブジェクトの一部は失敗し、これらの他の有効なXMLタグの間に(バイナリブロブとして)挿入されるだけです。
例えば...
<track>
<cto>Valid_XML_HERE</cto>@Binary_Blob_of_Junk@<cto>(...)</cto>
</track>
環境はRHEL-5です。これは、Python 2.4、Perl、またはSED/AWKソリューションが使用可能であることを意味します。
がらくたを取り除く方法について何か提案はありますか?