-2

私は Web スクレイピングに慣れていませんが、いくつかのコンテンツを取得することができました。しかし、今回の問題は単純に見えますが、Web ページでシンボル、名前、市場を含む文字列を取得できません。つまり、URL に「Merck KGaA (MRK.DE) -XETRA」という文字列を取得したいと考えています。いくつかのテーブルを返す次のコードを試しましたが、探している部分を取得できません:

url <- 'https://finance.yahoo.com/q?s=MRK.DE&ql=0'
require(httr)
require(XML)
table <- readHTMLTable(content(GET(url)),header=TRUE)
4

1 に答える 1

1

これはおそらく最も効率的なスクリプトではありませんが、間違いなく機能します。

library(rvest)
library(magrittr)
library(stringr)

html(url) %>%
  html_nodes("h2") %>%
  extract2(3) %>%
  as('character') %>%
  str_replace('<h2>', '') %>%
  str_replace('</h2>', '')

[1] "Merck KGaA (MRK.DE)"
于 2014-12-15T15:00:07.277 に答える