0

PHP用のsimplehtmldomlibを使用してhtmlファイルからテキストを取得しようとしています。タグの後のテキスト<br>(TextAfterBreak)だけが必要ですが、<font></font>タグ間のテキスト全体(この場合はTextInsideFontTextAfterBreak)を取得する方法しかわかりません。試しまし たが、終了タグfind("/td/font/br")がないためか、空の文字列が返されますか?</br>どんな助けでも大歓迎です!

ソースhtmlソースファイルスニペットは次のとおりです。

<td>
    <font size="-1" face="Verdana, Helvetica, Arial, sans-serif" color="#330000">
    TextInsideFont
    <br>
    TextAfterBreak
    </font>
</td>

これが私のコードスニペットです:

$element=$row->find("/td/font");
echo $element =$element[0]->plaintext;

そして出力:

TextInsideFontTextAfterBreak

注:htmlファイルのすべてのテーブル行は一意であるため、正規表現や文字列マニピュレーターは機能しません。

4

1 に答える 1

3

explode()データplaintextを削除するため、新しい行の後にそれを追加します。html

$element = $row->find("/td/font");
$element = explode("\n", $element[0]->plaintext);
echo trim($element[1]);
于 2012-09-11T08:45:40.133 に答える