0

特定の div タグからテキストをスクレイピングする必要があるが、html タグのないテキストのみをスクレイピングする必要があるプロジェクトに取り組んでいます。

html の例を次に示します。

<div id="divid1" class="divclass1">
<h1>
TEXT INSIDE DIV
</h1>
</div>

H1タグなしでDIV内のテキストをスクレイピングする必要があります。私はこれをさまざまな方法で試しましたが、うまくいきません。

助言がありますか?ありがとう!

4

2 に答える 2

0

PHP Simple HTML DOM Parser を使用します。

http://simplehtmldom.sourceforge.net/

あなたは言えた:

foreach ($html->find('div[divid1] h1') as $e) 
 echo $e->innertext;

これにより、#divid1 内の h1 タグ内のテキストがエコーされます (ただし、タグ自体はエコーされません)。

ドキュメントはシンプルですが、非常に役に立ちます: http://simplehtmldom.sourceforge.net/manual.htm

于 2011-09-28T18:49:30.870 に答える
0

PHP domparser を使用します。これは、この目的に適しています。

http://www.php.net/manual/en/domdocument.loadhtml.php

于 2011-09-26T05:42:20.130 に答える