Simple_HTML_Domは、特定のタグ内のものを取得するのに最適ですが、テキストを取得する場合、基本以外のことを行う方法がわかりません。これは、私がスクレイピングしているコードがどのように見えるかの例です。
<span>
Some code stuff.
</span>
FirstWord: 88
<span>
More code stuff.
</span>
ご覧のとおり、FirstWordと88はどのような種類のタグにも含まれていません。これは彼らをつかむのを難しくします。ただし、こすりは次のとおりです。FirstWordは常に同じであり、数だけが変更されます。
したがって、私の考えは、FirstWordの直後に続く数字を取得するようにSimple_HTML_Domに指示することです。問題は、これを行う方法がわからないことです。
どんな助けでも大歓迎です。