xpath - セカンドの選び方
Xpathを使用する要素

Question

このWeb ページから完全なレビューを収集しようとしています。(完全なレビュー - [もっと読む] ボタンをクリックした後)。これは RSelenium を使用して行っています。<p>コードを使用して、最初の要素からテキストを選択して抽出できます

reviewNodes <- mybrowser$findElements(using = 'xpath', "//p[@id][1]")

これは、テキストのレビューを減らすためのものです。

ただし、コードを使用して全文レビューを抽出することはできません

reviewNodes <- mybrowser$findElements(using = 'xpath', "//p[@id][2]")

また

reviewNodes <- mybrowser$findElements(using = 'xpath', "//p[@itemprop = 'reviewBody']")

空のリスト要素を示しています。何が悪いのかわかりません。私を助けてください..

score 0 · Accepted Answer

リストを扱うときは、まず CSS セレクターなどを使用してリスト項目を見つける必要があります。

div.srm

これらの要素に基づいて、たとえば CSS セレクターを使用して、リスト項目内を検索できます。

p[itemprop='reviewBody']

もちろん、単一の式でそれを行うこともできますが、それはそれほどきちんとしたものではありません:

div.srm p[itemprop='reviewBody']

またはXPathで（これはお勧めしません）：

//div[@class='srm']//p[@itemprop='reviewBody']

これらのいずれもうまくいかない場合、問題は別の場所にあるはずです。

xpath - セカンドの選び方Xpathを使用する要素