PHPで利用できる堅牢で成熟したHTMLパーサーはありますか?PEARをざっと見ただけでは何も起こりませんでした(HTMLを生成するためのクラスがたくさんあり、消費するためのクラスはそれほど多くありません)。Googleは、多くの人がさまざまなパーサープロジェクトを開始して放棄したことを教えてくれました。
XMLパーサーに興味がない(整形式でないHTMLを消費できる場合を除く)、または正規表現を使用して自分でハッキングすることはありません。
意図の明確化: HTMLコンテンツのフィルタリングには興味がなく、HTMLドキュメントから情報を抽出することに興味があります。