csvファイルからHiveにデータをインポートしています。私のテーブルには文字列とintの両方が含まれています。ただし、私の入力ファイルでは、intの周囲に空白があるため、次のようになります。
some string, 2 ,another string , 7 , yet another string
残念ながら、ファイルを提供するプログラムのフォーマットを制御することはできません。
(例)を使用してデータをインポートする場合:
CREATE TABLE MYTABLE(string1 STRING, alpha INT, string2 STRING, beta INT, string3 STRING)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
次に、すべての整数がNULLに設定されます。これは、余分な空白が解析を失敗させるためだと思います。これを回避する方法はありますか?