-6

例:URLがhttp://www.google.comの場合

file_get_contents内容を取得する方法と、またはメソッドで解析する方法を知っていますcurl

だから、私の質問は次のとおりです。そのWebページのコンテンツを取得してソースファイルを解析する方法。

例: ビューソース: http://www.google.com

上記のソース ファイルを解析しようとすると、解析のためにファイルの内容が最初に読み込まれていないことがわかりました。

そのため、次の点について助けが必要です。

view-source:http://www.google.comページのコンテンツをロードする方法。

4

3 に答える 3

2

file_get_contents("http://www.google.com"); によって Web ページのコンテンツを取得します。not file_get_contents("view-source: http://www.google.com ");

次に、次のように解析します。

$html = file_get_contents("http://www.google.com");
$doc = new DOMDocument();
$doc->loadHTML($html);

PHP DOM API で解析できない場合は、PHP Simple HTML DOM Parser を試すことができます。http://simplehtmldom.sourceforge.net/

于 2012-10-18T08:19:49.617 に答える
2

file_get_contentsview-sourceクロム ブラウザでは、同じもの (ページの HTML コード) を返す必要があります。その HTML (PHP、.net など) の背後にあるコードを取得しようとしている場合は、取得できません。

view-sourceまたはによって返されたコードとまったく同じものを表示しています。これは Chrome ブラウザのみの機能であり、有効な URL アドレス スキームではありません。cUrlfile_get_contents

于 2012-10-18T08:13:22.130 に答える
2

あなたは書いた:「例:view-source:http ://www.google.com

上記のソース ファイルを解析しようとすると、ファイルの内容が読み込まれていないことがわかりました」

ここに問題view-source:があります。これは chrome の機能であり、有効な URL ではありません。そのため、コンテンツがロードされません。PHP 関数には、ソースをロードできる有効な URL: http://www.google.comが必要です。

于 2012-10-18T08:13:25.547 に答える