サイトからデータを取得する必要があります: http://www.srh.noaa.gov/data/obhistory/KSPA.html
私のコードは R で正常に動作しますが、サーバーで crontab をスケジュールする前に、Putty でデータを実行すると、繰り返しエラーが生成されました:「htmlParseStartTag: タグが誤って配置されました。属性名の解析中にエラーが発生しました。予期しない終了タグ: フォーム」
関連する投稿のいくつかは php です。私はその言語に詳しくありません。R 言語で問題を解決する方法を知っている人はいますか? ありがとう。
ここに私のRコードがあります:
LocIDs <- c("KSPA","KALX","K3A1","KTOI")
library(XML)
urls <- paste("http://www.srh.noaa.gov/data/obhistory/",LocIDs,".html", sep="")
data <- lapply(urls, function(x) {
dat <- tryCatch(readHTMLTable(x,header=F,which=4,stringsAsFactors=F),error=function(e) NULL)
dat$LocID = substr(x, 40, 43) # Add a column of LocID(4 characters)
dat <- dat[-c(1:3),c(1,2,7,8,11,14,17)]
dat <- head(dat, -3) # Delete first & last 3 column of table names
return(dat)
})
#Structure list to data.frame
library(plyr)
data3 <- do.call(rbind.fill, data)