一部のWebサイトのコンテンツを取得してBLOBストレージに保存するWebクローラーを作成したいと思います。Azureでそれを行う正しい方法は何ですか?ワーカーロールを開始し、Thread.Sleepメソッドを使用して1日1回実行する必要がありますか?
また、このワーカーロールを使用する場合、2つのインスタンスを作成するとどのように機能するのでしょうか。「ComputeEmulatorUI」を使用すると、コマンド「Trace.WriteLine」が両方のインスタンスで同時に機能することに気付きました。誰かがこの点を明確にできますか。
phpを使用して同じクローラーを作成し、cronジョブを設定して1日1回スクリプトを開始しましたが、コンテンツ全体を取得するのに6時間かかったため、Azureを使用します。