3

助けてください!:(

次のことを行うための PHP スクリプトを開発しようとしています。

  • リモート HTML ページを破棄し、選択したデータ (特定のテーブル/div など) を抽出します。
  • 抽出されたデータを使用して、データベース (MySql など) に保存します。

誰でも助けることができますか?

早急なフィードバックに感謝いたします。

4

3 に答える 3

7

cUrlを使用してページを取得します。

シンプルな HTML DOM パーサーを使用して、必要なデータを見つけます。

最終的には、 iconvを使用して、フェッチしたデータをデータベースの文字セットに変換します。

そして、データを保存するための mysql 接続と単純なクエリだけです (エスケープすることを忘れないでください)。

于 2010-08-24T10:31:20.123 に答える
3

ここに仕事をするいくつかのコードがあります:

// Fetch page
$file = fopen($url, "r"); 

$data = '';
while (!feof($file)) {
// Extract the data from the file / url
$data .= fgets($file, 1024);
}

$doc = new DOMDocument();

$doc->loadHtml($data);

// XPath lets you search DOM documents easily
$xpath = new DOMXPath($doc);
$nodelist = $xpath->query('//table[class=mytable]');

これにより、クラス「mytable」を持つすべてのテーブルに対して、反復可能なノード リストが取得されます。

DomDocumentXPathを見てください。

于 2010-08-24T10:40:17.033 に答える
0

偶然にも、最近私は同様のプロジェクトに取り組んできました。私の最終的な解決策は

  1. URLからコンテンツを取得するcUrl
  2. jquery のようなセレクターを使用して、HTML の必要な部分を取得するためのシンプルな HTML DOM パーサー。

どちらも強くお勧めします。

于 2010-08-24T10:40:03.243 に答える