html - Web ページから有用な src= のない (ランダムな) 画像を抽出する

Question

まず、これを一般的にどのように達成できるかを知りたいと思います。次に、誰かがカピバラを使用してこれを達成する方法を知っているかもしれません。

例:画像自体ではなく、ランダムな画像を返すスクリプトを指しています<img src="http://example.com/getrandomimage"> 。srcページが読み込まれ、スクリプトが実行され、画像が表示されます。値は簡単に取得できsrcますが、リンクにアクセスして画像をダウンロードすると、スクリプトが再度実行され、まったく異なる画像が返されます。そして、すでにページにあるものが必要です。

score 0 · Accepted Answer

このプロセスは、JS や Capybara を使用した場合と非常によく似ていると思います。私はそれを2つのステップに分けます：

<img>タグを見つけるセレクターを作成します。JS では次のようになります。
```
myImg = document.getElementByTagName("img")
```
.src返されたノードで呼び出します。
```
result = myImg.src
```

Capybara は XPath と CSS セレクターに限定されていると思います。したがって、スクレイピングしようとしているページによっては、タグを見つけるために、HTML タグまたは CSS 属性である種のパターンを特定する必要があります<img>。

html - Web ページから有用な src= のない (ランダムな) 画像を抽出する

1 に答える 1

Related

Reference