5

Perl/LWPでWebクローラーを構築しています。WebCrawlerは、次のようなASP.NETグリッド内のリンクをどのようにたどることができますか。

<a id="ctl00_MainContent_listResult_Top_LnkNextPage" href="javascript:__doPostBack('ctl00$MainContent$listResult$Top$LnkNextPage','')">Next</a>
4

3 に答える 3

1

これを実行できるはずのjavascriptおよびajaxプラグインを備えたWWW::Scripterと呼ばれるWWW::Mechanizeサブクラスがあるようです。その特定のアプローチを試していません。

もう1つの選択肢はWWW::Seleniumです。これはうまく機能しますが、オーバーヘッド/セットアップが多すぎる可能性があります。

于 2009-06-14T23:08:39.757 に答える
0

WWW-Mechanize-Firefox を使用すると、Firefox で可能なすべてのリンクを取得/たどることができます。

mozrepl アドオンを firefox にインストールする必要があります。perl モジュールはそのアドオンに接続され、firefox を使用してリンクを開きます。

http://metacpan.org/pod/WWW::Mechanize::Firefox

例: http://metacpan.org/pod/WWW::Mechanize::Firefox::Examples

于 2013-01-15T09:40:09.880 に答える