Azure Jupyter/iPython Notebook にカスタム データセットをダウンロードする必要があります。私の最終的な目標は、R パッケージをインストールすることです。これを行うには、パッケージ (データセット) をコードでダウンロードする必要があります。この投稿のコメント セクションで Andrie de Vries によって概説されている手順に従いました: Jupyter Notebooks with R in Azure ML Studio。
パッケージを ZIP ファイルとしてアップロードすることは問題ありませんでしたが、ノートブックでコードを実行するとエラーが発生しました。
curl のエラー (x$DownloadLocation, handle = h, open = conn): ピア トレースバックからデータを受信する際の失敗:
- download.datasets(ws, "plotly_3.6.0.tar.gz.zip")
- lapply(1:nrow(データセット), function(j) get_dataset(データセット[j, . ], ...))
- FUN(1L[[1L]], ...)
- get_dataset(データセット[j, ], ...)
- curl(x$DownloadLocation, ハンドル = h, オープン = 接続)
そこで、コードを次のように単純化しました。
library("AzureML")
ws <- workspace()
ds <- datasets(ws)
ds$Name
data <- download.datasets(ws, "plotly_3.6.0.tar.gz.zip")
head(data)
「plotly_3.6.0.tar.gz.zip」は、データ型「Zip」のデータセットの名前です。残念ながら、これは同じエラーになります。データ型の問題を除外するために、データ型が「データセット」の別のデータセットもダウンロードしようとしました。また、同じエラー。
ここで、ダウンロードするデータセットを AzureML Studio のサンプル データセットの 1 つに変更します。「text.preprocessing.zip」のデータ型は Zip です
data <- download.datasets(ws, "text.preprocessing.zip")
"Flight Delays Data" のデータ型は GenericCSV です
data <- download.datasets(ws, "Flight Delays Data")
どちらのサンプル データセットも問題なくダウンロードできます。
では、保存した自分のデータセットをダウンロードできないのはなぜですか?
download.datasets 関数のドキュメントに役立つものは見つかりませんでした。rdocumentation.orgにも、cran.r-project.org (page 17-18)にもありません。