Web ページからさまざまなテーブルに対応する URL を Web スクレイピングしました (RSelenium を使用)。これらの URL は、「URL」というオブジェクトに保存しました。次のステップで、各テーブルをテキスト形式で、以下のループで指定したディレクトリに書き出す必要があります。しかし、何らかの理由でループが 5 回の反復後に停止し、その理由がわかりません。アイデアやヒントはありますか?
for (i in 1:length(URL)){
remDr$navigate(URL[i])
date <- Sys.Date()
file <- paste("./WebScraping Connecting/Connecting_","_", date, ".txt", sep="")
y2 <- remDr$getPageSource()
y2 <- unlist(y2)
y3 <- readHTMLTable(y2, header=TRUE)
l <- unlist(lapply(y3[[1]], paste, collapse=" "))
for (j in 2:length(y3)){
l1 <- unlist(lapply(y3[[j]], paste, collapse=" "))
if (!is.null(l1)){
l <- rbind(l, l1)
}
}
write(as.vector(l), file=file)
更新: 3 回繰り返した後でもループが停止することがあります。手でループを回せばうまくいくようです。ただし、次の警告メッセージが表示されます。
In rbind(l, l1) :
number of columns of result is not a multiple of vector length (arg 1)