22

私はrvestスクレイピングを行うためにRで使用しています。HTML と CSS はある程度知っています。

URI のすべての製品の価格を取得したい:

http://www.linio.com.co/tecnologia/celulares-telefonia-gps/

ページを下にスクロールすると、新しいアイテムがロードされます。

私がこれまでに行ったこと:

Linio_Celulares <- html("http://www.linio.com.co/celulares-telefonia-gps/")

Linio_Celulares %>%
  html_nodes(".product-itm-price-new") %>%
  html_text()

そして、私は必要なものを手に入れましたが、最初の25個の要素(デフォルトでロードされます)だけです。

 [1] "$ 1.999.900" "$ 1.999.900" "$ 1.999.900" "$ 2.299.900" "$ 2.279.900"
 [6] "$ 2.279.900" "$ 1.159.900" "$ 1.749.900" "$ 1.879.900" "$ 189.900"  
[11] "$ 2.299.900" "$ 2.499.900" "$ 2.499.900" "$ 2.799.000" "$ 529.900"  
[16] "$ 2.699.900" "$ 2.149.900" "$ 189.900"   "$ 2.549.900" "$ 1.395.900"
[21] "$ 249.900"   "$ 41.900"    "$ 319.900"   "$ 149.900" 

質問: この動的セクションのすべての要素を取得するにはどうすればよいですか?

私は、すべての要素が読み込まれるまでページをスクロールしてから、html(URL) を使用できると思います。しかし、これは大変な作業のようです (別のセクションでこれを行う予定です)。プログラムによる回避策が必要です。

4

2 に答える 2