私は、Jericho、NekoHtmlなどのさまざまなhtmlパーサーを使用してWebページのhtmlソースコードを解析するJavaプログラムを開発してきました...
今度はPHP言語でパーサーを開発したいと思います。したがって、始める前に、PHPでhtmlコードを解析するために使用できるhtmlパーサーがあることを知りたいと思います。
私は、Jericho、NekoHtmlなどのさまざまなhtmlパーサーを使用してWebページのhtmlソースコードを解析するJavaプログラムを開発してきました...
今度はPHP言語でパーサーを開発したいと思います。したがって、始める前に、PHPでhtmlコードを解析するために使用できるhtmlパーサーがあることを知りたいと思います。
DOMDocumentをチェックしてください。
例1ドキュメントの作成
<?php
$doc = new DOMDocument();
$doc->loadHTML("<html><body>Test<br></body></html>");
echo $doc->saveHTML();
DOMはこれにかなり適しています。無効なマークアップも処理できますが、マークアップが不完全な場合は文書化されていないエラーや例外がスローされるため、DOMでロードする前にHTMLPurifierまたはその他のライブラリでHTMLをフィルタリングすることをお勧めします。