22

着信 HTML を消去するために、アプリケーションに HTML Tidy を埋め込みました。しかし、Tidy には大量のバグがあり、それらをソースで直接修正することは、私の最悪の悪夢です。整頓されたソースコードは読めない憎悪です。1000 行以上の関数、貧弱な変数名、スパゲッティ コードなど。本当にひどいものです。

さらに悪いことに、公式の開発は中止されたようです。過去 12 か月で、公式の CVS リポジトリへの書き込みトランザクションが3 回ありました。しかし、それはそれよりもはるかに長い間死んで埋葬されていました...

だから私は、Tidy ができること (そのように感じたときに) を実行できる OSS C または C++ アプリケーション/ライブラリを探しています: 悪い HTML マークアップを修正し、それを有効な XHTML に変換します (これは私が興味を持っている部分です)。そして、あらゆる種類の悪いマークアップを意味します。

そこにそのようなものはありますか?

編集: XML 処理ツールによる DOM ツリーの操作と、XHTML 仕様への一般的な準拠の両方に必要です。私のアプリは、ユーザーからの HTML を受け入れ (多くの場合、あらゆる点で無効です)、有効な XHTML を出力する必要があります。ユーザーが手動で編集し、後で確認しなかったために、通常はブラウザーに表示されない HTML も処理できる必要があります。

Tidy のエラー修正パーサーのドロップイン代替品です。ソースが読みやすく、自分で問題を修正できる場合、またはタイムリーにバグ修正を提供するアクティブな開発者がいる場合は、バグを気にしません。

4

4 に答える 4

1

Pretty Diff を試してみてください。これは非常に優れた美化アルゴリズムであり、入力について何の仮定も行いません。

http://prettydiff.com/?m=beautify&html

于 2011-12-10T12:49:47.147 に答える