hadoop - impala外部テーブルでファイルヘッダーをスキップするには?

翻译自：https://stackoverflow.com/questions/21935155 2014-02-21T12:58:45.253

2591 次

4

HDFS に 78 GB サイズのファイルがあります

その上に Impala 外部テーブルを作成して、利用可能なデータのグループ化と集計を実行する必要があります

問題ファイルにヘッダーが含まれています。

質問ファイルの読み取り中にファイルからヘッダーをスキップし、残りのデータに対してクエリを実行する方法はありますか。

ファイルをローカルにコピーして問題を解決する方法はありますが、ヘッダーを削除してから、更新されたファイルを HDFS に再度コピーしますが、ファイルサイズが大きすぎるため実行できません。

どなたか心当たりのある方教えてください...

任意の提案をいただければ幸いです....

前もって感謝します

2 に答える 2