XML::LibXML::Readerのドキュメントで、HTML の解析については何も見つかりませんでした。そして、HTML サイトを解析しようとしましたが、うまくいきませんでした。XML::LibXML::Reader は HTML では動作しないという私の結論は正しいですか?
2 に答える
3
それが本当に XHTML でない限り、いいえ。XML は HTML よりもはるかに制限が厳しく、XML パーサーは通常 HTML を解析できません。
HTML::TokeParser (またはその基本クラスHTML::PullParser ) はXML::LibXML::Readerに最も似ています(ただし、すべてが似ているわけではありません)。
HTMLで動作する LibXML に似たものについては、HTML-Treeを参照してください。HTML::TreeBuilder::LibXMLもあります。これは、HTML-Tree をさらに LibXML と互換性のあるインターフェイスでラップします。
于 2010-04-23T08:17:42.397 に答える
1
いいえ、しかしHTML::TreeBuilder::LibXMLは HTML ペーサーに互換性のあるインターフェースを実装しています。
于 2010-04-23T08:22:02.190 に答える