1

以下のコードでWebページを解析しようとしましたが、最後の行で「HTTPリソースの読み込みに失敗しました」という出力になりました。対処方法を教えてもらえますか?ありがとう!コードは次のとおりです。

library(XML);library(RCurl)
page=getForm("http://jobsearch.monster.com/search",query="data science")
doc = htmlParse(page, asText = TRUE)
joblinks = getNodeSet(doc, "//div[@class = 'jobTitleContainer']//a/@href")
htmlParse(joblinks[[1]])
4

1 に答える 1

-1

2 つのことで ?htmlParseisURLフラグが示されます。デフォルトでは FALSE です。これを TRUE に設定します。

次に、URL がjoblinks[[1]] 機能していないようです。これはあなたのコードの問題ではないようRです。あなたが引っ張っている情報だけです:

# works
htmlParse("http://stackoverflow.com/questions/13852853/failed-to-load-http-source-in-r", isURL=TRUE)

# doesnt work 
htmlParse("http://jobview.monster.com/Cleaning-Supervisor-Job-1513-Rebel-Southwest-OH-117109119.aspx", isURL=TRUE)
于 2012-12-13T04:33:13.410 に答える