パブリック AWS データ セットの一部をダウンロードできるかどうか、およびその方法を知りたいです。
具体的には、Common Crawl Corpusから一部をダウンロードして、ローカル テストを実行したいと考えています。
パブリック AWS データ セットの一部をダウンロードできるかどうか、およびその方法を知りたいです。
具体的には、Common Crawl Corpusから一部をダウンロードして、ローカル テストを実行したいと考えています。
できるようです。ブラウザでAmazon が提供する公開 URLにアクセスすると、セット全体とサブセットのリンクが表示されます。
ブラウザ、S3 クライアント ツール、またはライブラリを使用してダウンロードできます。