7

MicrosoftWordから生成されたhtml形式の非常に大きなドキュメントがあります。それはすっごく散らかっていて、肥大化したものでいっぱいです(不明なタグ、不明な名前空間など、その他の肥大化したものなど)

それをプレーンなhtmlsytaxに変換する方法はありますか?

4

4 に答える 4

6

HTMLTidyを試してください。MS Wordで生成されたHTMLで非常にうまく機能すると聞いています(少なくともWord 2000までは間違いなく、おそらくもっと新しいバージョンでも)。

于 2009-06-28T07:59:10.527 に答える
2

これは実際にはプログラミングの問題ではありませんが、(少なくとも最近のバージョンの)Wordは「Webページ、フィルター済み」に保存できます。これにより、Office固有のタグとプロパティが削除され、ドキュメントのレンダリングに必要なタグのみが残ります。ウェブブラウザ。したがって、Wordを使用している場合は、Wordを使用してHTMLドキュメントを開き、その形式で保存してみてください。

于 2009-06-28T07:40:24.573 に答える
2

あなたはおそらくHTMLTidyを探しています。これには、ほとんどすべての言語のアダプターがあります。Microsoft Word HTML出力(および他の多くの機能)をクリーンアップするオプションがあります。

于 2009-06-28T07:59:48.967 に答える
1

単語のHTMLをクリーンアップするためにHTMLオンラインツールをクリーンアップしてみてください

于 2011-03-13T10:48:22.163 に答える