php - どの言語でも、ウェブページをキャプチャして画像ファイルに保存できますか? (インストールなし、activeX なし)

Question

WindowsサーバーでPHP(おそらく6.0以上)を使えばWebページをキャプチャできると聞きました。

サンプルコードを入手してテストしました。しかし、正しく実行するコードはありません。

Web ページをキャプチャする正しい方法を知っている場合は、Web アプリケーションに画像ファイルを保存しますか?

教えて下さい。

score 5 · Accepted Answer

browsershots api http://browsershots.org/を使用できます

xml-rpc インターフェイスを使用すると、ほぼすべての言語を使用してアクセスできます。

http://api.browsershots.org/xmlrpc/

score 1 · Accepted Answer

PHP ソリューションを求められましたが、Perl を使用した別のソリューションを共有したいと思います。WWW::MechanizeとLWP::UserAgentおよびHTML::Parserは、画面のスクレイピングに役立ちます。

参照用のドキュメント:

score -2 · Accepted Answer

Web ページの html をダウンロードすることは、一般にスクリーンスクレイピングとして知られています。これは、プログラムで特定のページからデータを抽出する場合に役立ちます。HTTP リソースを要求する最も簡単な方法は、ツール呼び出しcURLを使用することです。cURL はスタンドアロンの UNIX ツールとして提供されますが、ほぼすべてのプログラミング言語で使用できるライブラリがあります。このページを Unix コマンドラインからキャプチャするには、次のように入力します。

curl http://stackoverflow.com/questions/1077970/in-any-languages-can-i-capture-a-webpageno-install-no-activex-if-i-can-plz

PHP では、同じことができます。

<?php 
$ch = curl_init() or die(curl_error()); 
curl_setopt($ch, CURLOPT_URL,"http://stackoverflow.com/questions/1077970/in-any-languages-can-i-capture-a-webpageno-install-no-activex-if-i-can-plz"); 
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); 
$data1=curl_exec($ch) or die(curl_error()); 
echo "<font color=black face=verdana size=3>".$data1."</font>"; 
echo curl_error($ch); 
curl_close($ch); 
?>

Web サイト全体をコピーする前に、robots.txt ファイルをチェックして、ロボットがサイトをスパイダーすることを許可しているかどうかを確認する必要があります。また、HTML なしでデータを取得できる API が利用可能かどうかを確認することをお勧めします。

php - どの言語でも、ウェブページをキャプチャして画像ファイルに保存できますか? (インストールなし、activeX なし)

3 に答える 3

Related

Reference