Mojo::UserAgent (クックブックを参照)には組み込みの Cookie jar があり、 IO::Socket::SSLがインストールされている場合は SSL を実行できます。CSS3セレクターを使用して返された結果を簡単にトラバースできるDOM パーサーがあります。それでも十分でない場合は、すべてをノンブロッキングで使用できます (それが必要な場合)。
Mojo::UserAgent および上記のその他のツールは、Mojoliciousツール スイートの一部です。これは Perl ライブラリであり、PHP よりも汎用的な言語であるため、このタスクには Perl をお勧めします。
これは、クラス myclass を持つ div 内にあるすべてのリンクからテキストを取得するための非常に単純な例です。
use Mojo::UserAgent;
my $ua = Mojo::UserAgent->new;
$ua->post( 'http://mysite.com/login' => form => { ... } );
my @link_text =
$ua->get( 'http://mysite.com/protected/page' )
->res
->dom('div.myclass a')
->text
->each;
実際、このシェル コマンドを実行するだけで十分に作業を開始できます (権限によって異なります)。
curl -L cpanmin.us | perl - -n Mojolicious IO::Socket::SSL