php - 任意のソースファイルの内容を取得する方法

Question

file_get_contents内容を取得する方法と、またはメソッドで解析する方法を知っていますcurl。

だから、私の質問は次のとおりです。そのWebページのコンテンツを取得してソースファイルを解析する方法。

例: ビューソース: http://www.google.com

上記のソースファイルを解析しようとすると、解析のためにファイルの内容が最初に読み込まれていないことがわかりました。

そのため、次の点について助けが必要です。

view-source:http://www.google.comページのコンテンツをロードする方法。

score 2 · Accepted Answer

file_get_contents("http://www.google.com"); によって Web ページのコンテンツを取得します。not file_get_contents("view-source: http://www.google.com ");

次に、次のように解析します。

$html = file_get_contents("http://www.google.com");
$doc = new DOMDocument();
$doc->loadHTML($html);

PHP DOM API で解析できない場合は、PHP Simple HTML DOM Parser を試すことができます。http://simplehtmldom.sourceforge.net/

score 2 · Accepted Answer

file_get_contentsview-sourceクロムブラウザでは、同じもの (ページの HTML コード) を返す必要があります。その HTML (PHP、.net など) の背後にあるコードを取得しようとしている場合は、取得できません。

view-sourceまたはによって返されたコードとまったく同じものを表示しています。これは Chrome ブラウザのみの機能であり、有効な URL アドレススキームではありません。cUrlfile_get_contents

score 2 · Accepted Answer

あなたは書いた：「例：view-source：http ://www.google.com

上記のソースファイルを解析しようとすると、ファイルの内容が読み込まれていないことがわかりました」

ここに問題view-source:があります。これは chrome の機能であり、有効な URL ではありません。そのため、コンテンツがロードされません。PHP 関数には、ソースをロードできる有効な URL: http://www.google.comが必要です。

php - 任意のソース ファイルの内容を取得する方法