snappy で圧縮された pig にロードしようとしているファイルがあります。このジラの問題で説明されているように、設定オプションをうなり声で設定しましたが、結果に圧縮されたデータがまだ含まれています。
ジョブを実行すると、次のように表示されます: org.apache.hadoop.io.compress.snappy.LoadSnappy - Snappy ネイティブ ライブラリが利用可能です
仕事のために、単純な
a = load '/path/to/snappy/file' using PigStorage() as (x, y, z) を実行します
次に:
データをダンプする
圧縮データを出力します。
データを正しく読み取るために何ができるか知っている人はいますか? 前もって感謝します。