Perl/LWPでWebクローラーを構築しています。WebCrawlerは、次のようなASP.NETグリッド内のリンクをどのようにたどることができますか。
<a id="ctl00_MainContent_listResult_Top_LnkNextPage" href="javascript:__doPostBack('ctl00$MainContent$listResult$Top$LnkNextPage','')">Next</a>
Perl/LWPでWebクローラーを構築しています。WebCrawlerは、次のようなASP.NETグリッド内のリンクをどのようにたどることができますか。
<a id="ctl00_MainContent_listResult_Top_LnkNextPage" href="javascript:__doPostBack('ctl00$MainContent$listResult$Top$LnkNextPage','')">Next</a>
これを実行できるはずのjavascriptおよびajaxプラグインを備えたWWW::Scripterと呼ばれるWWW::Mechanizeサブクラスがあるようです。その特定のアプローチを試していません。
もう1つの選択肢はWWW::Seleniumです。これはうまく機能しますが、オーバーヘッド/セットアップが多すぎる可能性があります。
WWW-Mechanize-Firefox を使用すると、Firefox で可能なすべてのリンクを取得/たどることができます。
mozrepl アドオンを firefox にインストールする必要があります。perl モジュールはそのアドオンに接続され、firefox を使用してリンクを開きます。
http://metacpan.org/pod/WWW::Mechanize::Firefox
例: http://metacpan.org/pod/WWW::Mechanize::Firefox::Examples