0

サイトからデータを取得する必要があります: http://www.srh.noaa.gov/data/obhistory/KSPA.html

私のコードは R で正常に動作しますが、サーバーで crontab をスケジュールする前に、Putty でデータを実行すると、繰り返しエラーが生成されました:「htmlParseStartTag: タグが誤って配置されました。属性名の解析中にエラーが発生しました。予期しない終了タグ: フォーム」

関連する投稿のいくつかは php です。私はその言語に詳しくありません。R 言語で問題を解決する方法を知っている人はいますか? ありがとう。

ここに私のRコードがあります:

LocIDs <- c("KSPA","KALX","K3A1","KTOI")
library(XML)   

urls <- paste("http://www.srh.noaa.gov/data/obhistory/",LocIDs,".html", sep="")

data <- lapply(urls, function(x) {
dat <- tryCatch(readHTMLTable(x,header=F,which=4,stringsAsFactors=F),error=function(e) NULL)
 dat$LocID = substr(x, 40, 43)           # Add a column of LocID(4 characters)
 dat <- dat[-c(1:3),c(1,2,7,8,11,14,17)]
 dat <- head(dat, -3)                    # Delete first & last 3 column of table names
 return(dat)                                                                   
})                                                                              

#Structure list to data.frame
library(plyr)
data3 <- do.call(rbind.fill, data)
4

0 に答える 0