1

私は<img />どの src 属性が javascript スクリプトによって動的に設定されているかを知ってい<img src="http://1.2.3.4/some_image.jpg?m=3681368312" />ます<img src="http://1.2.3.4/some_image.jpg?m=1234234" />。Python を使用してこの画像を読み込んで保存したいと考えています。問題は、html をロードするときに src 属性が空であることです。後で設定されるため、ロードすると<img src="" />. 2 つ目の問題は、アドレスの IP 部分が時間の経過とともに変化する可能性があることです。私は自分のソリューションを一般的なものにして、プロバイダー側​​の何かが変更されたときにコードを変更する必要がないことを望んでいます。この動的に変化するコンテンツをロードする方法はありますか?

編集:

もちろん、私はJavaScriptの動作をリバースエンジニアリングすることができます - jsスクリプトを解析し、現在ロードされているIPを取得し、ランダムなトークンを生成しますが、これは避けたいです...

4

1 に答える 1

0

JavaScript をリバース エンジニアリングせずに「src」または「img」を取得するには、「ブラウザ」で実行する必要があります。

Python では、このために PyQt4 (QtCore、QtGui、QtWebKit) を使用します。

例を次に示します: https://github.com/JulienPalard/PyWebScrap

于 2013-01-27T16:06:12.040 に答える