19

以下は、私が作成したハイブテーブルです。

CREATE EXTERNAL TABLE Activity (
  column1 type, </br>
  column2 type
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
LOCATION '/exttable/';

HDFS の場所 /exttable には、多数の CSV ファイルがあり、各 CSV ファイルにはヘッダー行も含まれています。選択クエリを実行すると、結果にヘッダー行も含まれます。

ヘッダー行または最初の行を無視できる HIVE の方法はありますか?

4

6 に答える 6

25

Hive バージョン 0.13.0 以降を使用している場合は、テーブル プロパティで "skip.header.line.count"="1" を指定してヘッダーを削除できます。

パッチの詳細については、https ://issues.apache.org/jira/browse/HIVE-5795 を参照してください。

于 2014-04-17T21:39:21.433 に答える
0

ハイブのバージョンが tblproperties ("skip.header.line.count"="1") をサポートしていない場合は、以下の UNIX コマンドを使用して最初の行 (列ヘッダー) を無視し、HDFS に入れることができます。

 sed -n '2,$p' File_with_header.csv > File_with_No_header.csv
于 2015-06-16T10:05:34.217 に答える
-2

csv ファイルからヘッダーを削除するには、次のコマンドを使用します。

sed -i 1d filename.csv 
于 2016-08-16T22:43:02.223 に答える