javascript - JavaScript メニューでサイトをミラーリングする方法は?

Question

クライアントで生成されたクレイジーな JavaScript メニューを使用するサイトをミラーリングしようとしています。どちらも、JS コードが実行されるまでリンクが存在しないため、サイト全体のダウンロードに失敗しますwget。httrack私に何ができる？

メインのインデックスページをブラウザに読み込んでみました。これで JS コードが実行され、メニューが構築され、結果の DOM を HTML ファイルにダンプして、このファイルからミラーリングできます。リンクは既にソースにあるため、より多くのファイルがダウンロードされます。しかし、明らかに、ミラーリングは、解釈されていない JS メニューを含む、新しくダウンロードされた他のページですぐに壊れます。

ダウンロードしたすべてのページのメニュー部分をメニューの静的バージョンに置き換えることを考えましたが、ダウンロードしたファイルを外部コマンドで実行できるフラグが見つかりませwgetん。httrack単純なフィルタリングプロキシを作成することもできますが、それは極端に聞こえ始めます。他のアイデア？

score 1 · Accepted Answer

私の場合は役に立ちませんが、誰かにとっては役立つかもしれません。これは、単純なフィルタリングプロキシが Perl でどのように見えるかです。

#!/usr/bin/env perl

use HTTP::Proxy;
use HTTP::Proxy::BodyFilter::simple;

my $proxy = HTTP::Proxy->new(port => 3128);
$proxy->push_filter(
    mime => 'text/html',
    response => HTTP::Proxy::BodyFilter::simple->new(
        sub { ${ $_[1] } =~ s/foo/bar/g }
    )
);
$proxy->start;

javascript - JavaScript メニューでサイトをミラーリングする方法は?

2 に答える 2

Related

Reference