ある種のテンプレートとしてodtファイルを使用し、このテンプレートを作成するためのツールとしてLibreOfficeを使用しています。通常、1つを除いて正常に動作します。
odtファイルにテキストの段落があると仮定します。
There is my text.
XMLファイルは次のように見える場合と見えない場合があります(ランダムに見える)(乱雑で、解析やテンプレートとしてはあまり良くありません):
<text:p text:style-name="P7">There is</text:p><text:p text:style-name="P7"> my text<text:p text:style-name="P7">.</text:p></text:p>
時々それは(再びランダムに見える)このようになります(期待される結果、結局のところ理にかなっています):
<text:p text:style-name="P7">There is my text.</text:p>
余分なxmlタグを取り除く方法はありますか?または、少なくともユーザーはLibreOffice / OpenOfficeで生のドキュメントを表示して、冗長性を手動で削除できますか?
重要なのは、このようなアーティファクトを検出して修正するための簡単なツールをユーザーに提供することです。