WindowsサーバーでPHP(おそらく6.0以上)を使えばWebページをキャプチャできると聞きました。
サンプルコードを入手してテストしました。しかし、正しく実行するコードはありません。
Web ページをキャプチャする正しい方法を知っている場合は、Web アプリケーションに画像ファイルを保存しますか?
教えて下さい。
WindowsサーバーでPHP(おそらく6.0以上)を使えばWebページをキャプチャできると聞きました。
サンプルコードを入手してテストしました。しかし、正しく実行するコードはありません。
Web ページをキャプチャする正しい方法を知っている場合は、Web アプリケーションに画像ファイルを保存しますか?
教えて下さい。
browsershots api http://browsershots.org/を使用できます
xml-rpc インターフェイスを使用すると、ほぼすべての言語を使用してアクセスできます。
PHP ソリューションを求められましたが、Perl を使用した別のソリューションを共有したいと思います。WWW::MechanizeとLWP::UserAgentおよびHTML::Parserは、画面のスクレイピングに役立ちます。
参照用のドキュメント:
Web ページの html をダウンロードすることは、一般にスクリーン スクレイピングとして知られています。これは、プログラムで特定のページからデータを抽出する場合に役立ちます。HTTP リソースを要求する最も簡単な方法は、ツール呼び出しcURLを使用することです。cURL はスタンドアロンの UNIX ツールとして提供されますが、ほぼすべてのプログラミング言語で使用できるライブラリがあります。このページを Unix コマンド ラインからキャプチャするには、次のように入力します。
curl http://stackoverflow.com/questions/1077970/in-any-languages-can-i-capture-a-webpageno-install-no-activex-if-i-can-plz
PHP では、同じことができます。
<?php
$ch = curl_init() or die(curl_error());
curl_setopt($ch, CURLOPT_URL,"http://stackoverflow.com/questions/1077970/in-any-languages-can-i-capture-a-webpageno-install-no-activex-if-i-can-plz");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$data1=curl_exec($ch) or die(curl_error());
echo "<font color=black face=verdana size=3>".$data1."</font>";
echo curl_error($ch);
curl_close($ch);
?>
Web サイト全体をコピーする前に、robots.txt ファイルをチェックして、ロボットがサイトをスパイダーすることを許可しているかどうかを確認する必要があります。また、HTML なしでデータを取得できる API が利用可能かどうかを確認することをお勧めします。