docx4j で生成された html に小さな問題があります。ケースの 95% で、すべて正常に動作します。しかし、ドキュメントにはいくつかの行があり、同じスタイルで複数のスパンに変換されています。例えば:
S44_XYZ_ABC_AABBCCDD のような行があります。ドキュメントにはこのような行が複数あり、変換中に悪い方法で変換されるのは 1 ~ 2% だけです。この行は次のようになります。
<span style=...>S44</span>
<span style=...>_</span>
<span style=...>XYZ</span>
...etc.
生成された html 文字列でこれらのトークンを他のテキストに置き換えているため、これは私にとって問題です。行を再フォーマットして削除し、別のドキュメントからコピーした別の行を変更しようとしましたが、変換は問題ありませんでしたが、うまくいきませんでした。
何らかの docx フォーマット関連の問題であると考えていますが、原因がわかりません。
事前にどうもありがとうございました!