0

私は、リモートサイトから特定の画像をスクレイプし、テキストフィールドに貼り付けるときにそれらを表示する画像スクレーパーを開発しました。ロジックには、.jpg.jpegで終わる画像の検索が含まれます。pngなど

多くのサイトがJavaScriptを介して画像を生成するか、表示された画像の一部として画像拡張子がないという問題が発生しています。次のようなサイトの例

www.express.comとwww.underarmour.comには、この問題とその他多くの問題があります。

設定されたURLから画像を検索し、それに応じてファイル拡張子のない画像を表示するには、どの関数を使用できますか?

再度、感謝します。

4

2 に答える 2

1

URL が からのものでない限り、<img src="...">特定の URL から何が得られるかを知る方法はありません。http://example.com/index.html実際には、zip ファイルを提供する PHP スクリプトである可能性があります。

実際に URL にアクセスしてヘッダーとダウンロードされたデータを確認するまで、URL が何を提供するかを確実に伝えることは不可能です。

于 2012-08-01T19:50:02.613 に答える
1

次の 2 つのオプションがあると思います。

  1. URL が画像であるかどうかについて、いくつかのヒューリスティックを生成します (URL の一部/images/を見つけるなど)。

  2. すべての URL を読み込み、返されたデータが画像であるかどうかを確認します (例を使用getimagesize())

2 番目のバージョンはより一般化されていますが、帯域幅とリソースの両方が非常に重くなります。

于 2012-08-01T19:51:07.600 に答える