Word ドキュメントと、Apache POI Api を使用してドキュメントを HTML に変換する次のコードがあります。
serializer.setOutputProperty(OutputKeys.ENCODING, "UTF-8");
serializer.setOutputProperty(OutputKeys.METHOD, "html");
serializer.transform(domSource, streamResult);
しかし、番号付け、つまり 1)、a)、i) などと箇条書きの文字が正しく解析されていません。1 のようなゴミ文字が表示されます。エディターでhtmlファイルを開くと、不要なボックスで数字が表示されます。私は多くのことを試しましたが、これの適切な解決策が得られません。
このエンコーディングの問題を解決するために、私を助けてください。
ありがとう