パッケージRSeleniumを使用して、サイトhttp://stats.statbroadcast.com/statmonitr/?id=102197からテキスト「VIRGINIA TECH」をスクレイピングしたいと思います。
スクレイピングしたい特定のテキストのcssセレクターは次のとおりです。
.valigntop:nth-child(1) .width6-3-4.marginr
リモートドライバーを開いてサイトに移動した後、次のことを試します。
webElem <- remDr$findElement(using = "css selector", '.valigntop:nth-child(1) .width6-3-4.marginr')
doc <- remDr$getPageSource()[[1]]
current_doc <- read_html(doc)
current_doc <- html_text(current_doc)
これは、必要なテキスト「VIRGINIA TECH」ではなく、大きなテキスト ブロックを返します。
私が欲しいものをこすり落とした後:
current_doc
[1] "VIRGINIA TECH"
どんな助けでも大歓迎です。さらに情報が必要な場合はお知らせください。