ループを使用して、rcurl
複数のページからデータをスクレイプしています。これは、特定の時間には正常に動作しているように見えますが、サーバーが応答しないためにタイムアウトが発生すると失敗します。
timeout=30
タイムアウトエラーをトラップするを使用していますが、タイムアウト後にプログラムが停止します。タイムアウトが発生したときにプログラムが次のページに進むようにしたいのですが、これを行う方法がわかりませんか?
url = getCurlHandle(cookiefile = "", verbose = TRUE)
これは、タイムアウトの原因となる私が使用しているステートメントです。興味があれば、喜んでコードを共有します。
webpage = getURLContent(url, followlocation=TRUE, curl = curl,.opts=list( verbose = TRUE, timeout=90, maxredirs = 2))
ウッドワードjj