Selenium2、Selenium Web ドライバー、および PHP バインディング スクリプトを使用する、複雑なスクリーン スクレイピング スクリプトを作成しました。そのため、最終的には、Selenium を駆動する PHP スクリプトを作成し、次に URL を取得します。 、いくつかのJavascriptを解析し、フォームに記入し、何とか何とか何とかして、最終的に私が求めているHTMLを返します. それはすべて私のローカル コンピューター上で (開発および概念実証環境として) うまく機能します。
そう。
本番環境では、このスクリプトを毎日 3 回自動的に実行する必要があります。サーバー上ですべてをセットアップする方が良いかどうかを判断しようとしています (つまり、Linux 用の Firefox、次に Java、次に Selenium2 などを実行する方法を理解する... 私にとっては些細なことではありません;くそー、ジム、私はコーダーであり、システム管理者ではありません!)、または、 Sauce Labs の OnDemand のようなサードパーティの Selenium テスト サービス、またはこれらの他のクラウドベースの Selenium サービスのいずれかを使用できるかどうか.
これらのサードパーティのソリューションは、すべて「単体テスト」用に設定されているように見えますが、これは私が行っていることではありません。私はそのこと、PHPUnitの使用、ビルドでのテストなどについて知りません。単純な PHP スクリプトを 1 日 3 回実行し、Selenium と通信してブラウザーを駆動し、画面のスクレイピングを行いたいだけです。
これらのサードパーティのソリューションの 1 つは、私が達成しようとしていることに対して良いアイデアですか、それとも私の (比較的単純な) 目標からやり過ぎ/遠すぎますか?