さまざまなユーザーの通話の詳細を含むファイルを処理しています。call_duration
データ ファイルには、形式の値を含むフィールド がありますhh:mm:ss
。例:00:49:39
など00:20:00
各ユーザーの 1 か月あたりの通話時間の合計を計算したいと思います。
で時刻形式をストックできるデータ型がハイブに表示されませんhh:mm:ss
。(現在、ステージングテーブルにこのデータを文字列として持っています)。
ユーザーごとに sum() グループ化できるように、時間を秒に変換するUDFを作成することを考えています。call_duration
同様の状況に直面した人はいますか?UDFを作成する必要がありますか? より良い方法はありますか?
事前にどうもありがとう