PHP用のsimplehtmldomlibを使用してhtmlファイルからテキストを取得しようとしています。タグの後のテキスト<br>
(TextAfterBreak)だけが必要ですが、<font></font>
タグ間のテキスト全体(この場合はTextInsideFontTextAfterBreak)を取得する方法しかわかりません。試しまし たが、終了タグfind("/td/font/br")
がないためか、空の文字列が返されますか?</br>
どんな助けでも大歓迎です!
ソースhtmlソースファイルスニペットは次のとおりです。
<td>
<font size="-1" face="Verdana, Helvetica, Arial, sans-serif" color="#330000">
TextInsideFont
<br>
TextAfterBreak
</font>
</td>
これが私のコードスニペットです:
$element=$row->find("/td/font");
echo $element =$element[0]->plaintext;
そして出力:
TextInsideFontTextAfterBreak
注:htmlファイルのすべてのテーブル行は一意であるため、正規表現や文字列マニピュレーターは機能しません。