0

HTML::Defang に相当する C/C++ 関数を探していますが、私の Google-fu は何も発見できませんでした。無害なタグをすべて保持し、他のすべてを削除/デファングしたい. 実際のライブラリがないため、defang へのタグ/属性/その他の完全なリストへのポインタをいただければ幸いです。http://en.wikipedia.org/wiki/DOM_Eventsを知っています。ありがとう。

4

2 に答える 2

1

Javaでは、JTidyを使用してHTMLをクリーンアップします。ニーズに合うかどうかはわかりませんが、Google for JTidyの場合は、C / C ++実装へのリンクをたどって、希望どおりに動作するかどうかを確認できます。

何をデファングするかについて:HTMLのW3C仕様を見てください。そこにないタグはHTMLに属していません。しかし、繰り返しになりますが、私はあなたの「defang」の概念を誤解している可能性があります。

于 2009-12-17T18:47:27.263 に答える
1

libxml2 は無料で、あなたが望むことをするはずです。

http://www.xmlsoft.org/

API のこの部分を参照してください: http://www.xmlsoft.org/html/libxml-HTMLparser.html

htmlReadFile()関数がうまくいくかもしれません。

libxml2 の使用を開始するには、いくつかの例をここで見つけることができます。

http://www.xmlsoft.org/examples/index.html

于 2010-07-23T23:46:11.550 に答える