0

AmazonCloudFrontがAmazonElasticMapReduceで作成するアクセスログを処理したいと思います。

クラウドフロントからさまざまなファイルがロードされた回数に関する簡単な統計が必要なので、このための簡単なPIGスクリプトを作成する必要があると思いました。

私が抱えている最初の問題は、cloudfrontがgzipで圧縮されたログを書き込むことです。私が知る限り、pigで.gzを読み取ることはできませんか?

これをどのように行うべきかについての提案はありますか?私はelasticmapreduceに非常に慣れていないので、この種のジョブを構成する方法に関するヒントを歓迎します。

4

2 に答える 2

2

申し訳ありませんが、これはデフォルトで機能します。ログを処理する前に解凍する必要はありません。私の悪い。

于 2010-11-01T22:58:10.670 に答える
0

Qloudstatに興味があるかもしれません。CloudFrontアクセスログの統計をサービスとして提供します。

于 2011-12-01T11:20:02.000 に答える