ページを開こうとしたときにブラウザが GET リクエストを実行するすべての URL のリストを取得できるようにしたいと考えています。たとえば、cnn.com を開こうとすると、ブラウザが再帰的に要求する最初の HTTP 応答内に複数の URL があります。
ページをレンダリングしようとしているわけではありませんが、ページがレンダリングされるときに要求されるすべての URL のリストを取得しようとしています。ダウンロードされた css に画像が存在する可能性があるため、http 応答コンテンツを単純にスキャンするだけでは十分ではありません。とにかくPythonでこれを行うことができますか?