0

CURL を使用してデータを生成しています。サイトは抽出用の他の形式を提供していませんが、私がしたことは単にURLを取得し、HTMLでデータを取得することです。これは私のスクリプトが取得しています. その html データを JSON や XML などの他の形式に変換して、PHP で HTML を簡単に解析できるようにすることはできますか? JSON/XL でデータを取得できない場合、関連性に応じて解析するデータを抽出するにはどうすればよいでしょうか。jsonで取得するためのコードをいくつか取得しました。

function get_json_content($json_url = '') {
    $ch = curl_init($json_url);
    $options = array(
        CURLOPT_RETURNTRANSFER => true,
        CURLOPT_HTTPHEADER => array('Content-type: application/json'),
        CURLOPT_TIMEOUT => 160,
        CURLOPT_FOLLOWLOCATION => 1
    );

    curl_setopt_array($ch, $options);               // Setting curl options
    $result = curl_exec($ch);                       // Getting jSON result string
    return $result;
}

$json_url = 'http://www.evertek.com/viewpart.asp?auto=78053&cat=45#.UKZWHme5JI4';
$get_result = get_json_content($json_url);
die($get_result);

これ$get_resultはhtmlで受信しています。私のモットーは、データの形式に関係なく、適切な形式でデータを抽出または解析することです。PHPで使用できるようにデータを簡単に解析したいだけです。

4

2 に答える 2

0

CURL が返すものだけを使用でき、CURL は与えられたもの (この場合は HTML) しか取得できません。

HTML を扱うのは難しくありません。次の回答をご覧ください: How do you parse and process HTML/XML in PHP?

于 2012-11-22T18:13:02.000 に答える
0

完全な Web サイトからデータを取得しようとするのは簡単なことではありません。Web サイトがサポートする API を使用して、操作しやすい有意義な方法でデータを提供することをお勧めします。

Web サイトのスクレイピングに関するいくつかのチュートリアルを確認する必要があります。そうしないと、html を解析して不要な情報を削除する必要があります。

于 2012-11-22T18:15:58.050 に答える