15

RCurl を使用してバイナリ ファイルをダウンロードする例の多くは次のようなものです。

library("RCurl")
curl = getCurlHandle()
bfile=getBinaryURL (
        "http://www.example.com/bfile.zip",
        curl= curl,
        progressfunction = function(down, up) {print(down)}, noprogress = FALSE
)
writeBin(bfile, "bfile.zip")
rm(curl, bfile)

ダウンロードが非常に大きい場合は、すべてをメモリにフェッチするのではなく、ストレージ メディアに同時に書き込む方がよいと思います。

RCurl のドキュメントには、チャンクごとにファイルを取得し、ダウンロード時に操作する例がいくつかありますが、それらはすべてテキスト チャンクを参照しているようです。

実際の例を教えてください。

アップデート

ユーザーは、バイナリ ファイルのオプションを指定して R ネイティブdownload fileを使用することを提案しています。mode = 'wb'

多くの場合、ネイティブ関数は実行可能な代替手段ですが、このネイティブ関数が適合しない多くのユースケース (https、cookie、フォームなど) があり、これが RCurl が存在する理由です。

4

2 に答える 2

20

これは実際の例です:

library(RCurl)
#
f = CFILE("bfile.zip", mode="wb")
curlPerform(url = "http://www.example.com/bfile.zip", writedata = f@ref)
close(f)

ファイルに直接ダウンロードされます。返される値は (ダウンロードされたデータの代わりに) リクエストのステータス (エラーが発生しない場合は 0) になります。

への言及CFILEは、RCurl マニュアルでは少し簡潔です。将来的には、より多くの詳細/例が含まれることを願っています。

便宜上、同じコードが関数としてパッケージ化されています (進行状況バー付き)。

bdown=function(url, file){
    library('RCurl')
    f = CFILE(file, mode="wb")
    a = curlPerform(url = url, writedata = f@ref, noprogress=FALSE)
    close(f)
    return(a)
}

## ...and now just give remote and local paths     
ret = bdown("http://www.example.com/bfile.zip", "path/to/bfile.zip")
于 2013-03-21T09:24:26.973 に答える
2

ええと.. use mode = 'wb' :) ..これを実行して、私のコメントに従ってください。

# create a temporary file and a temporary directory on your local disk
tf <- tempfile()
td <- tempdir()

# run the download file function, download as binary..  save the result to the temporary file
download.file(
    "http://sourceforge.net/projects/peazip/files/4.8/peazip_portable-4.8.WINDOWS.zip/download",
    tf ,
    mode = 'wb' 
)

# unzip the files to the temporary directory
files <- unzip( tf , exdir = td )

# here are your files
files
于 2013-01-20T18:10:51.840 に答える