重複の可能性:
ページ内のすべての HTML タグを数えます PHP PHP で
HTML を解析および処理する方法は?
HTML ドキュメントで使用されている html タグとメタ タグのリスト、およびドキュメント内で各タグが出現する回数を取得するための情報の解析に問題があります。
たとえば、次の html ドキュメントがあるとします。
<head>
<a href="example.com">example1</a>
<a href="example.com">example2</a>
<a href="example.com">example3</a>
</head>
次に、次のようなリストを取得します
head tag =1
a tag =3
誰かが私に素晴らしい出発点を与えることができれば、私はphpでこれをやろうとしています。
編集:次のpythonコードのようなものを複製しようとしていますが、phpを使用しています
class MyHTMLParser(HTMLParser):
def handle_starttag(self, tag, attrs):
print "Encountered a start tag:", tag
def handle_endtag(self, tag):
print "Encountered an end tag :", tag
def handle_data(self, data):
print "Encountered some data :", data