3

私は、Jericho、NekoHtmlなどのさまざまなhtmlパーサーを使用してWebページのhtmlソースコードを解析するJavaプログラムを開発してきました...

今度はPHP言語でパーサーを開発したいと思います。したがって、始める前に、PHPでhtmlコードを解析するために使用できるhtmlパーサーがあることを知りたいと思います。

4

3 に答える 3

2

組み込みクラスのDOMパーサーは非常に優れた機能を果たします。他にも多くのxmlパーサーがあります。

于 2010-02-17T14:56:15.483 に答える
2

DOMDocumentをチェックしてください。

例1ドキュメントの作成

<?php
$doc = new DOMDocument();
$doc->loadHTML("<html><body>Test<br></body></html>");
echo $doc->saveHTML();
于 2010-02-17T14:58:02.290 に答える
1

DOMはこれにかなり適しています。無効なマークアップも処理できますが、マークアップが不完全な場合は文書化されていないエラーや例外がスローされるため、DOMでロードする前にHTMLPurifierまたはその他のライブラリでHTMLをフィルタリングすることをお勧めします。

于 2010-02-17T15:39:43.947 に答える