0

これらのノードからリンクを取得する方法:

script <- getURL("www.r-bloggers.com")
doc <- htmlParse(script)
li <- getNodeSet(doc, "//ul[@class='xoxo blogroll']")

ヒントを事前にありがとう。

4

1 に答える 1

3

a要素を抽出して呼び出すことができxmlGetAttrます。

library(RCurl)
library(XML)
script <- getURL("www.r-bloggers.com")
doc <- htmlParse(script)
li <- getNodeSet(doc, "//ul[@class='xoxo blogroll']//a")
sapply(li, xmlGetAttr, "href")

xpathApply直接使用することもできます。

xpathSApply(doc, 
  "//ul[@class='xoxo blogroll']//a", 
  xmlGetAttr, "href"
)
于 2012-04-05T03:47:47.530 に答える