function - ハイブでUNIXエポック時刻を日付文字列に変換する方法

Question

タイムスタンプ列を含むログファイルがあります。タイムスタンプは UNIX エポック時間形式です。

年、月、日のパーティションを持つタイムスタンプに基づいてパーティションを作成したいと考えています。

これまでのところ、これを行っていますが、エラーがスローされています。

PARSE ERROR cannot recognize input '(' in column type

これが私のコードです。

from (
      from raw_data
            MAP  ${PREFIX}raw_data.line
            USING 's3://scripts/clean.py'
            AS (timestamp STRING, name STRING)
      ) map_out
INSERT OVERWRITE TABLE date_base_data_temp PARTITION(year(timestamp), month(timestamp)), day(timestamp))) 
    select map_out.name;

score 56 · Accepted Answer

おっと、それは醜く見えます。Hive でこの関数を使用してみてください。

SELECT from_unixtime(unix_timestamp) as new_timestamp from raw_data ...

または、タイムスタンプがms秒の代わりにある場合:

SELECT from_unixtime(unix_timestamp DIV 1000) as new_timestamp from raw_data ...

UNIX タイムスタンプを YYYY-MM-DD HH:MM:SS 形式に変換すると、次の関数を使用して年、月、日を取得できます。

SELECT year(new_timestamp) as year, month(new_timestamp) as month, day(new_timestamp) as day ...

score 12 · Accepted Answer

Hive と SparkSQL の最近のリリースでは、日付のデータ型と型キャストオプションを使用できます。以下は、Spark SQL だけでなく Hive でも機能するはずです。

SELECT cast(from_unixtime(epoch_datetime) as date) from myHiveTable

function - ハイブでUNIXエポック時刻を日付文字列に変換する方法

5 に答える 5

Related

Reference