ブラウザ リソースの展開動作をシミュレートする方法を探しています。
私が対処しようとしているフローは次のとおりです。
- 初期 URL にアクセスする (例: http://example.dmn/index.htm )
- 受信した html 応答を解析します (例: index.htm)
- インデックス解析の結果としてブラウザーが取得するリソースを見つけます。たとえば、次のようになります。
- 画像
- 閃光
- 埋め込みビデオ/オーディオ
- フレーム/iFrame
- 見つかった新しいリソースごとにプロセスを再帰的に繰り返します
リンク (href) をたどることは期待していません。ページが最初にアクセスされたときにブラウザーによって自動的に取得されるページ リソースのみです。
このシミュレーションを実行する方法について提案はありますか?
役立つ可能性のあるPythonプロジェクト/ライブラリはありますか?
ありがとう