-1

問題:

PHP で利用できる HTML コードから特定のテキストを抽出しようとしています。

HTML コード:

<a href="/debatt/s-vill-ha-tioarig-skolplikt-och-farre-elever-i-klassen">
    <span class="number">2. </span>Skolplikt och färre elever i klassen
    <br />
    <span class="metadata">I går</span>
</a>

<a href="/sthlm/edholm-backar-om-skolornas-smorforbud">
    <span class="number">3. </span>Edholm backar om skolornas smörförbud
    <br />
    <span class="metadata">16 okt</span>
</a>

望ましい出力:

2. Skolplikt och färre elever i klassen
3. Edholm backar om skolornas smörförbud

両方のコード例の HTML 構造は同じです。シンプルな HTML DOM を介してこれを行うことは可能ですか、それとも正規表現を追求する必要がありますか?

4

2 に答える 2

2

DOMElementHTML をオブジェクトに追加します。それを使用すると、子を選択し、その HTML/テキストを変数に抽出できます。

ドキュメント: http://php.net/manual/en/class.domelement.php


https://stackoverflow.com/a/12950525/711129と同じ答え

于 2012-10-18T09:00:28.580 に答える
1

これを頻繁に行う必要がある場合は、html dom を解析するための非常に便利で簡単なクラスを使用できます。

http://simplehtmldom.sourceforge.net/

于 2012-10-18T09:07:13.290 に答える