Webサイトのコンテンツ(HTMLページのセット)をディスクに書き出すことなくメモリに直接ダウンロードすることは可能ですか?
それぞれ24Gがインストールされているマシンのクラスターがありますが、ディスククォータによって数百MBに制限されています。wget
内容をディスクに保存せずに、出力をある種のメモリ内構造にリダイレクトすることを考えていました。他のオプションは、の独自のバージョンを作成することwget
ですが、パイプを使用してそれを行う簡単な方法があるかもしれません
また、このダウンロードを並行して実行するための最良の方法は何でしょうか(クラスターには> 20ノードがあります)。この場合、ファイルシステムは使用できません。