12

Rselenium を使用して Web ページに移動しています。次のコードはそうしています。接続にVPNが必要な会社でURLを使用しているため、URLを提供していません:

RSelenium::startServer()
require(RSelenium)
remDr <- remoteDriver()
remDr$navigate("some url")

Web ページに移動すると、html ソース内に次の表が表示されます。

<font size="2">
<table border="1">
<tbody>
<tr>
<td> item1 </td>
<td> 0 </td>
<td> 0.05 </td>
<td> 2.43 </td>
<td align="center"> Pct </td>
<td align="center"> 1 </td>
</tr>
</tbody>
</table>

問題は、このテーブルの内容をどのように引き出すことができるかということです。URL が存在しないと仮定してください。それ以外の場合は、XML 関数 readHTMLTable(remDr$getCurrentUrl()) を使用できます。しかし、これは何らかの理由で機能しません。remoteDriver ハンドル (remDr) のみを使用する必要があります。お時間をありがとうございました

4

2 に答える 2

18

何かのようなもの:

library(XML)
doc <- htmlParse(remDr$getPageSource()[[1]])
readHTMLTable(doc)

html にアクセスし、含まれているテーブルを処理できるようにする必要があります。

于 2015-04-29T01:53:19.163 に答える