0

重複の可能性:
PHP で HTML を解析および処理する方法は?

file_get_contents() を使用してリモート Web サイトのコンテンツを取得したい この Web サイトには、興味のあるテキスト、画像、および表があります。そのリモート サイトには次のテーブルがあります。

<table style="width: 100%" class="style36">
    <tr>
        <td style="width: 25%" class="style38">B3</td>
        <td style="width: 60%" class="style38">Las Flores</td>
        <td style="width: 15%" class="style38">0</td>
    </tr>
</table>

各セルの値は動的であり、可能な限り高速で信頼性の高い方法でクエリを実行したいと考えています。

file_get_contents 関数を X 文字からのみ読み取るように制限しようとしましたが、ページが動的であるため、テーブルがどの文字で始まるかを実際に知ることはできません。

前もって感謝します

4

2 に答える 2

0

代わりに使用することをお勧めしcurlます。

ページの出力を取得したら、さまざまなツールを使用してコンテンツを解析できます。ここでは、特に PHP HTML パーサーを探している場合は、Google があなたの味方になります。

PHP には自由に使える DOM 関数がたくさんあるので、独自のDOM関数を作成することもできます。

于 2012-10-27T23:12:42.097 に答える
0

コンセプト コール スクレイピングを見てみましょう。利用可能な Web スクレイピング ライブラリがあるか、preg_match_all() を使用して、正規表現で必要な要素を取得できます。 PHP のスクレイピング ライブラリ - phpQuery? そのリンクをチェックしてください。

于 2012-10-27T23:13:01.780 に答える