0

まず、これを一般的にどのように達成できるかを知りたいと思います。次に、誰かがカピバラを使用してこれを達成する方法を知っているかもしれません。

例:画像自体ではなく、ランダムな画像を返すスクリプトを指しています<img src="http://example.com/getrandomimage">srcページが読み込まれ、スクリプトが実行され、画像が表示されます。値は簡単に取得できsrcますが、リンクにアクセスして画像をダウンロードすると、スクリプトが再度実行され、まったく異なる画像が返されます。そして、すでにページにあるものが必要です。

4

1 に答える 1

0

このプロセスは、JS や Capybara を使用した場合と非常によく似ていると思います。私はそれを2つのステップに分けます:

  1. <img>タグを見つけるセレクターを作成します。JS では次のようになります。

    myImg = document.getElementByTagName("img")
    
  2. .src返されたノードで 呼び出します。

    result = myImg.src
    

Capybara は XPath と CSS セレクターに限定されていると思います。したがって、スクレイピングしようとしているページによっては、タグを見つけるために、HTML タグまたは CSS 属性である種のパターンを特定する必要があります<img>

于 2013-08-01T02:38:45.277 に答える