Drupalビューによって生成されたテーブルからデータをスクレイピングするという私が持っているタスクには、他のWebスクレイピングソリューションはどれもうまくいかないようです。表示されたページのソースには間違いなくテーブルが表示されていますが、使用しようとしている現在のコードは、表示された 15 行の表形式の情報のリストではなく、空のテーブルを返すだけです。
私は明らかに何か間違ったことをしており、R を使用したコーディングスキルの初心者です。どんな助けも大歓迎です!
私のRコード:
library("RCurl")
library("XML")
projects <- getURL("http://www.mysite.com/projects", userpwd ="username:password")
# parse the document for R representation:
projects.doc <- htmlParse(projects)
# get the table
projects.tabs <- readHTMLTable(projects.doc, stringsAsFactors = FALSE)