そこで、digg で見られる機能を最もよく再現する方法についてのアイデアを探しています。基本的には、関心のあるページの URL を送信し、DOM を掘り下げてクロールしてすべての IMG タグを見つけ (特定の高さ/幅を超えるいくつかのタグのみを選択する可能性が高い)、それらからサムネイルを作成し、どれを尋ねるかを尋ねます。あなたは提出物を代表したいと考えています。
そこでは多くのことが行われていますが、私は主に、送信されたページから画像を取得するための最良の方法に関心があります。
そこで、digg で見られる機能を最もよく再現する方法についてのアイデアを探しています。基本的には、関心のあるページの URL を送信し、DOM を掘り下げてクロールしてすべての IMG タグを見つけ (特定の高さ/幅を超えるいくつかのタグのみを選択する可能性が高い)、それらからサムネイルを作成し、どれを尋ねるかを尋ねます。あなたは提出物を代表したいと考えています。
そこでは多くのことが行われていますが、私は主に、送信されたページから画像を取得するための最良の方法に関心があります。
Webページの解析を試みることはできますが、HTMLは非常に混乱している可能性があるため、近いが不完全なものを使用するのが最適です。
src = "..."のコンテンツを探してキャプチャするだけで、そこにたどり着きます。相対画像参照と絶対画像参照を処理するためのいくつかの基本的な操作で、そこにいます。
明らかに、サードパーティからオンデマンドでWebアセットを取得するときはいつでも、悪用されないように注意する必要があります。
cURL+regexpをお勧めします。
すべての画像タグの検索に役立つPHP Simple HTML DOM Parserを使用することもできます。