WordProcessingML 形式の XML として保存された Word 2003 文書があります。適切なコンテンツに動的に置き換えられるプレースホルダーがいくつか含まれています。しかし、問題は、Word がそれらを別々の単語にランダムに分割しているように見えることです。たとえば、これの代わりに:
<w:t>${dl.d.out.ecs_rev}</w:t>
私はこれを持っています:
...
<w:t>${</w:t>
</w:r>
<w:r wsp:rsidR="005D11C0">
<w:rPr>
<w:sz w:val="20" />
<w:sz-cs w:val="20" />
</w:rPr>
<w:t>dl.</w:t>
</w:r>
<w:r wsp:rsidRPr="00696324">
<w:rPr>
<w:sz w:val="20" />
<w:sz-cs w:val="20" />
</w:rPr>
<w:t>d.out.ecs_rev}</w:t>
...
Word 2003 を使用して「クリーンな」XML ドキュメントを保存する方法はありますか、またはクリーニングを実行できる既存のソリューションはありますか?
プレースホルダーの分離された部分を連結するメソッドをJavaでプログラムしようとしましたが、さまざまな切断の組み合わせの数が比較的多いため、そのためのアルゴリズムは私がしなければならない元のタスクよりもはるかに複雑です.それ自体の問題。