3

パッケージ RCurl を使用して、さまざまな URL のコンテンツをダウンロードする必要があります (認証などを使用)。ダウンロード速度を最適化するために、各ページの最初の 20 行だけが必要で、コンテンツ全体のサイズが非常に大きくなる可能性があるため、ダウンロードされた応答の出力行/文字を制限したいと考えています。

readLines を使用すると、これをすばやく行うことができます。

readLines("http://www.nytimes.com/", n = 20L)

ただし、RCurl を使用し、最大文字パラメーターを指定すると、期待した結果が得られません。

test <- getURL("http://www.nytimes.com/", write = basicTextGatherer(max = 1000))
> nchar(test)
[1] 125709

RCurl のFAQ ページによると、カスタマイズされたコールバック関数でうまくいくはずですが、その方法は正確にはわかりません。

4

0 に答える 0