perl - HTTP 経由で Web ページをオンラインで読み取る Perl について

Question

約 5G サイズの巨大な Web ページがあります。そして、ファイル全体をダウンロードせずに、Webページのコンテンツを直接（リモートで）読むことができれば幸いです。ファイルハンドラーを使用しOpenて HTTP コンテンツを開きました。しかし、与えられたエラーメッセージはNo such files or directory. を使用しようとしましたが、コンテンツ全体LWP::Simpleを使用するとメモリ不足でした。このコンテンツをリモートで、1 行ずつ読むget方法があるのだろうか。openご協力ありがとうございました。

score 0 · Accepted Answer

LWP::UserAgent を使用してみてください。このrequestメソッドを使用すると、CODE 参照を指定できます。これにより、入ってくるデータを処理できます。

#!/usr/bin/perl -w

use strict;
use warnings;

use LWP::UserAgent ();
use HTTP::Request ();

my $request = HTTP::Request->new(GET => 'http://www.example.com/');
my $ua = LWP::UserAgent->new();

$ua->request($request, sub {
        my ($chunk, $res) = @_;
        print $chunk;
        return undef;
});

技術的には、関数は undef ではなくコンテンツを返す必要がありますが、undef を返すと機能するようです。ドキュメントによると：

「コンテンツ」関数は、呼び出されたときにコンテンツを返す必要があります。content 関数は、空の文字列を返してコンテンツがなくなったことを知らせるまで繰り返し呼び出されます。

大きなファイルでこれを試したことはありません。任意のサイズのチャンクとして入ってくるデータを処理するには、独自のコードを作成する必要があります。

perl - HTTP 経由で Web ページをオンラインで読み取る Perl について

2 に答える 2

Related

Reference