Pig 0.11 でスクリプトを実行するのが遅いと感じている人はいますか? Pig 0.11 と Pig 0.8 を使用して、同じ環境でスクリプトを実行しました。Pig 0.8 は常に高速でした。
コメント ?
Pig 0.11 でスクリプトを実行するのが遅いと感じている人はいますか? Pig 0.11 と Pig 0.8 を使用して、同じ環境でスクリプトを実行しました。Pig 0.8 は常に高速でした。
コメント ?
あなたのLOAD
ステートメントUSING PigStorage()
が多くのファイルと一致するためでしょうか?PigStorage()
Pig 0.11 では、デフォルトで HDFS 上のスキーマ ファイルをチェックして、一致するファイルを探します。これにより、大量のファイルを読み取っている場合、非常に遅くなる可能性があります。
を使用しx = LOAD '...' USING PigStorage('...','-noschema')
ます。-noschemaを使用すると、スキーマ ファイルの検索が回避され、速度が回復するはずです。
詳細はこちら。