0

docx4j で生成された html に小さな問題があります。ケースの 95% で、すべて正常に動作します。しかし、ドキュメントにはいくつかの行があり、同じスタイルで複数のスパンに変換されています。例えば:

S44_XYZ_ABC_AABBCCDD のような行があります。ドキュメントにはこのような行が複数あり、変換中に悪い方法で変換されるのは 1 ~ 2% だけです。この行は次のようになります。

<span style=...>S44</span>
<span style=...>_</span>
<span style=...>XYZ</span>
           ...etc.

生成された html 文字列でこれらのトークンを他のテキストに置き換えているため、これは私にとって問題です。行を再フォーマットして削除し、別のドキュメントからコピーした別の行を変更しようとしましたが、変換は問題ありませんでしたが、うまくいきませんでした。

何らかの docx フォーマット関連の問題であると考えていますが、原因がわかりません。

事前にどうもありがとうございました!

4

1 に答える 1

1

Word はおそらく、テキスト S44_XYZ_ABC_AABBCCDD を複数のランに分割しました。

これは、文法/スペルチェック、異なる書式設定など、さまざまな理由で実行できます。あなたのケースでなぜそれが起こっているのかを確認するには、docx を解凍し、word/document.xml を見てください。

VariablePrepare.javaを実行して、この原因に対処することができます。

于 2013-09-13T12:44:40.327 に答える