データ:
<tr>
<td>
<a href="somelink">
some. .data...
</a>
</td>
<td>Black</td>
<td>57234</td>
<td>5431.60</td>
<td><font class="down"> -125.02</font></td>
</tr><tr>
<td>
<a href="somelink">
some. .data...
</a>
</td>
<td>Blue</td>
<td>57234</td>
<td>5431.60</td>
<td><font class="up"> -125.02</font></td>
</tr><tr>
<td>
<a href="somelink">
some. .data...
</a>
</td>
<td>Brown</td>
<td>57234</td>
<td>5431.60</td>
<td><font class="down"> -125.02</font></td>
</tr>
...more data...
「いくつか」を抽出したい。。データ...'; '黒'; '57234'; '5431.60'; 一度に。【5番目td
のデータは不要です。】
当初、
<tr><td><a.*>([a-zA-Z0-9 -]+)</a></td><td>(\w+)</td><td>([\d]+\.\d+)</td><td>(\d+\.\d+)</td>
仕事をしていました。(ヒットアンドミスアプローチ経由)
しかし、今は壊れています。
ここで<td>(.*)</td>
orを使用すると、すべての tr の<\w+>(.*)</\w+>
最後の 4 秒からのデータが表示されます。td
しかし、なぜそれが表示されないの<a href...>...</a>
ですか?どうすれば必要なデータを取得できますか?