0

Rを使用して、このリンクwww.jamesaltucher.com/sitemap.xmlのリンクタイトルをスクレイピングしています

これは私のコードです。

library(XML)
library(RCurl)
url.link <- 'http://www.jamesaltucher.com/sitemap.xml'
blog <- getURL(url.link)
blog          <- htmlParse(blog, encoding = "UTF-8")
titles  <- xpathSApply (blog ,"//a",xmlValue)             ## titles

Mytitlesは空のリストです。

スクリーンショットを参照してください。

ここに画像の説明を入力

xpath を間違って使用しましたか?

4

2 に答える 2

1

はい。loc要素ではなく要素を探していaます。

titles  <- xpathSApply (html ,"//loc",xmlValue)
于 2013-11-07T03:54:15.203 に答える
0

web_page <- readLines(" http://vueloeyewear.com/shop/retro/black-cia/ ")

author_lines <- web_page[grep("strong", web_page)]

author_lines <- author_lines [7:15]

test <- gsub(", ","",toString(author_lines))

テスト <- gsub("
","

"、テスト)

author_lines <- htmlParse(テスト)

xpathSApply (author_lines,"//p",xmlValue)

これを見てください。 //Loc は実際のタグを意味します..

于 2015-05-02T17:54:54.173 に答える