-1

重複の可能性:
ページ内のすべての HTML タグを数えます PHP PHP で
HTML を解析および処理する方法は?

HTML ドキュメントで使用されている html タグとメタ タグのリスト、およびドキュメント内で各タグが出現する回数を取得するための情報の解析に問題があります。

たとえば、次の html ドキュメントがあるとします。

 <head>
 <a href="example.com">example1</a>
 <a href="example.com">example2</a>
 <a href="example.com">example3</a>
 </head>

次に、次のようなリストを取得します

head tag =1
a tag =3

誰かが私に素晴らしい出発点を与えることができれば、私はphpでこれをやろうとしています。

編集:次のpythonコードのようなものを複製しようとしていますが、phpを使用しています

  class MyHTMLParser(HTMLParser):
  def handle_starttag(self, tag, attrs):
  print "Encountered a start tag:", tag
  def handle_endtag(self, tag):
  print "Encountered an end tag :", tag
  def handle_data(self, data):
 print "Encountered some data  :", data
4

1 に答える 1

2

PHP での DOM の解析については、 http: //www.php.net/manual/en/class.domdocument.phpを参照してください(たとえば、メソッドhttp://www.php.net/manual/en/domdocument.loadhtmlから始めます)。 .php )。その他の APIについては、 http://www.php.net/manual/en/book.dom.phpも参照してください。

于 2012-10-02T02:04:57.860 に答える