Web アプリケーションに HTML wysiwyg があり、ユーザーは Microsoft Office からコンテンツをコピーして貼り付けます。
Office コンテンツ (TEXT STRING) を HTML コンテンツに変換する Java メソッドが必要です。
私はあなたのコードを書きました
value = value.replaceAll("(?s)<[^>]*>(\\s*<[^>]*>)*", " ").replaceAll("\n\r", " ").replaceAll("\n", " ").replaceAll("\r", " ");
value = value.replaceAll("<xml>.*?</xml>", " ").replaceAll("<style>.*?</style>", " ").replaceAll("\n\r", "<br />").replaceAll("\n", "<br />").replaceAll("\r", "<br />").replace("id=" , "OldId=");
しかし、このコードでは正しいテキストが得られません。
PS: この Web サイトはまさに私がする必要があることを行い ます http://word2cleanhtml.com/