私は PHP は得意ですが (専門家とは言えません)、正規表現とスクレイピングに関してはまったくの初心者です。調査を支援し、自分自身を教育するために、少しスクレイピングを行いたかったのですが、問題が発生しました。ページの次の部分から賞品を抽出したい:
<th valign="top"> Prize pool:
</th>
<td> $75,000
</td></tr>
言うまでもなく、賞金プールの値は変わります。賞金を獲得したいのですが、この部分からの賞金だけです (この例では、スクリプトは $75,000 を出力する必要があります)。
これは私がこれまでに持っているものです:
preg_match('/Prize pool:\n<\/th>\n<td>(.*)/i', $file_string, $prize);
ただし、これは次のように出力されます。
Prize pool:
</th>
<td> $75,000