クライアントで生成されたクレイジーな JavaScript メニューを使用するサイトをミラーリングしようとしています。どちらも、JS コードが実行されるまでリンクが存在しないため、サイト全体のダウンロードに失敗しますwget
。httrack
私に何ができる?
メインのインデックス ページをブラウザに読み込んでみました。これで JS コードが実行され、メニューが構築され、結果の DOM を HTML ファイルにダンプして、このファイルからミラーリングできます。リンクは既にソースにあるため、より多くのファイルがダウンロードされます。しかし、明らかに、ミラーリングは、解釈されていない JS メニューを含む、新しくダウンロードされた他のページですぐに壊れます。
ダウンロードしたすべてのページのメニュー部分をメニューの静的バージョンに置き換えることを考えましたが、ダウンロードしたファイルを外部コマンドで実行できるフラグが見つかりませwget
ん。httrack
単純なフィルタリング プロキシを作成することもできますが、それは極端に聞こえ始めます。他のアイデア?