私は、SeleniumRCサーバーと対話してWebページにアクセスしてソースをダウンロードするWWW::Seleniumモジュールを使用して簡単なperlスクリプトを作成しました。HTMLページでこれを行うことができます。ただし、ソースをダウンロードしたいXMLページがあります。これは、「get_source_html()」関数では明らかに不可能です。以下は私がやりたいことのスクリプトです:
#!/usr/bin/perl -sw
use WWW::Selenium;
print "\n setting up Selenium...\n";
my $sel = WWW::Selenium->new( host => "localhost",
port => 4444,
browser => "*firefox",
browser_url => "http://www.google.com",
);
print " starting Selenium...\n";
$sel->start;
$sel->open('someXMLpage...');
$sel->wait_for_page_to_load();
my $xml = $sel->get_html_source();
print $xml;
ご覧のとおり、get_html_sourceは、ページがhtmlではないというエラーを返すため、明らかに問題です。ページの種類に関係なく、ブラウザに表示されている現在のページをダウンロードする方法はありますか(Firefoxの[ソースの表示]をクリックするか、さらに良い方法:get_source()関数など)?また、使用する必要のあるURLは「.xml」ファイルのようなものではないことに注意してください。それが何かを意味する場合、ページはその場で生成されます...
どんな知恵も大歓迎です!