10

私はブラウザを開き、それをIPアドレスにポイントし、たくさんのことをして閉じます。

この間にアクセスされたすべての URL を知りたいです。つまり、読み込まれた広告、任意の URL に対して行われた CSS 呼び出しなどです。

これが私が使用しているコードです

from selenium import webdriver

browser = webdriver.Firefox(profile) # Get local session of firefox
browser.get(url) # Open a url and wait for it to finish
4

2 に答える 2

1

Python ソリューションではありませんが、フィドラー プラグインを Firefox に追加できます。約1年前にまったく同じことをする必要がありました。Selenium を使用してブラウザーとすべての UI を開き、バックグラウンドで Fiddler がすべてのトラフィック (http と https) をキャプチャしました。これにはすべての JS CSS src もリストされており、後でインスペクターでデバッグして、送信された要求と受信した応答を確認できます。

于 2014-11-16T04:09:05.110 に答える
1

私は、Firefox プラグインの Firebug と Netexport をロードすることでそれを行いました。1 つ目は、すべての情報交換を確認できるツールで、2 つ目はすべての情報をファイル (.har 拡張子) に書き込むことができます。したがって、基本的に、セレンはプラグインとウェブサイトをロードし、必要な時間待機する必要があり、終了すると、結果を含むファイルが取得されます。

于 2014-08-08T09:11:07.040 に答える