まず第一に、私はWebスクレイピングの初心者です。
したがって、このウェブサイトで作業してください。私はエピソードについて議論する次の Web ページへのリンクを取得しようとします。SelectorGadget を使用して、トピックのあるフレームを含む html の一部のみを取得することができました
html.s1e01 <- html("http://asoiaf.westeros.org/index.php/forum/41-e01-winter-is-coming/")
html.s1e01.page <- html_nodes(html.s1e01, ".ipsBox")
今、トピックへのすべてのリンクを取得したいので、試しました
html_attr(html.s1e01.page, "href")
しかし、私は得るNA
。インターネットで同様の例を見ましたが、うまくいくはずです。なぜそうしないのか、何か提案はありますか?