html - docx4j html 変換で 1 行が複数のスパン要素に分割される

Question

docx4j で生成された html に小さな問題があります。ケースの 95% で、すべて正常に動作します。しかし、ドキュメントにはいくつかの行があり、同じスタイルで複数のスパンに変換されています。例えば：

S44_XYZ_ABC_AABBCCDD のような行があります。ドキュメントにはこのような行が複数あり、変換中に悪い方法で変換されるのは 1 ～ 2% だけです。この行は次のようになります。

<span style=...>S44</span>
<span style=...>_</span>
<span style=...>XYZ</span>
           ...etc.

生成された html 文字列でこれらのトークンを他のテキストに置き換えているため、これは私にとって問題です。行を再フォーマットして削除し、別のドキュメントからコピーした別の行を変更しようとしましたが、変換は問題ありませんでしたが、うまくいきませんでした。

何らかの docx フォーマット関連の問題であると考えていますが、原因がわかりません。

事前にどうもありがとうございました！

score 1 · Accepted Answer

Word はおそらく、テキスト S44_XYZ_ABC_AABBCCDD を複数のランに分割しました。

これは、文法/スペルチェック、異なる書式設定など、さまざまな理由で実行できます。あなたのケースでなぜそれが起こっているのかを確認するには、docx を解凍し、word/document.xml を見てください。

VariablePrepare.javaを実行して、この原因に対処することができます。

1 に答える 1