Indeed.com の求人掲示板から、テーブル内の会社と求人のリストを取得しようとしています。
http://www.indeed.com/jobs?q=proprietary+trader&の URL ベースを使用して rvest パッケージを使用しています。
install.packages("gtools")
install.packages('rvest")
library(rvest)
library(gtools)
mydata = read.csv("setup.csv", header=TRUE)
url_base <- "http://www.indeed.com/jobs?q=proprietary+trader&"
names <- mydata$Page
results<-data.frame()
for (name in names){
url <-paste0(url_base,name)
title.results <- url %>%
html() %>%
html_nodes(".jobtitle") %>%
html_text()
company.results <- url %>%
html() %>%
html_nodes(".company") %>%
html_text()
results <- smartbind(company.results, title.results)
results3<-data.frame(company=company.results, title=title.results)
}
new <- results(Company=company, Title=title)
そして、連結をループします。何らかの理由で、すべてのジョブを取得するわけではなく、企業とジョブを混合します。