HTML::Defang に相当する C/C++ 関数を探していますが、私の Google-fu は何も発見できませんでした。無害なタグをすべて保持し、他のすべてを削除/デファングしたい. 実際のライブラリがないため、defang へのタグ/属性/その他の完全なリストへのポインタをいただければ幸いです。http://en.wikipedia.org/wiki/DOM_Eventsを知っています。ありがとう。
2 に答える
1
Javaでは、JTidyを使用してHTMLをクリーンアップします。ニーズに合うかどうかはわかりませんが、Google for JTidyの場合は、C / C ++実装へのリンクをたどって、希望どおりに動作するかどうかを確認できます。
何をデファングするかについて:HTMLのW3C仕様を見てください。そこにないタグはHTMLに属していません。しかし、繰り返しになりますが、私はあなたの「defang」の概念を誤解している可能性があります。
于 2009-12-17T18:47:27.263 に答える
1
libxml2 は無料で、あなたが望むことをするはずです。
API のこの部分を参照してください: http://www.xmlsoft.org/html/libxml-HTMLparser.html
htmlReadFile()
関数がうまくいくかもしれません。
libxml2 の使用を開始するには、いくつかの例をここで見つけることができます。
于 2010-07-23T23:46:11.550 に答える