5

重複の可能性:
Word HTMLをクリーンアップするための最良の無料の方法は何ですか?
貼り付けられたMicrosoft入力をクリーンアップするPHP

クライアントがリッチテキストエディターにメモを入力できるようにしましたが、最近ckEditor 3xにアップグレードしました。これにより、デフォルトでMSワードクラス、スタイル、コメントが削除されます(ユーザーがエディターオブジェクトに貼り付ける場合)。これで、準備が整いました。

最近、5年分のメモをクリーンアップする必要がありました。そのうちのいくつかには、MSWordで生成されたHTMLが埋め込まれています。このテキストの本文をループしてクリーンアップする必要があります。

すべてのスパンタグを削除する必要はありません。Microsoftによって作成されたものとして識別されたタグのみを削除します。

HTMLCleanerを使用してみましたが、MSで生成されたHTMLが削除されません。 http://word2cleanhtml.comは私が望んでいることを正確に実行しますが、開発者は現在、公開用のAPIを提供していません(2012年7月9日現在)。

私はここ数週間、そのようなクラスを何度も探していましたが、あまり運がありません。共有したい便利なクラスを見つけた人はいますか?

4

1 に答える 1

7

http://htmlpurifier.org/

これはあなたが望むことをします。

于 2012-07-09T17:49:42.657 に答える