現在の時刻を含む余分な行を追加しながら、HQL を使用してハイブ テーブルからいくつかのデータを抽出しています。
次のようなもの: myTable から col1、col2、col3、unix_timestamp() を選択します。
すべてのレコードが 4 列目に同じ値を持つことを期待していました。
私は次のようなものを期待していました:
col1Value, col2Value, col3Value, col4Value, timeT
col1Value, col2Value, col3Value, col4Value, timeT
col1Value, col2Value, col3Value, col4Value, timeT
col1Value, col2Value, col3Value, col4Value, timeT
col1Value, col2Value, col3Value, col4Value, timeT
col1Value, col2Value, col3Value, col4Value, timeT
しかし、私はこのようなものを得ています:
col1Value, col2Value, col3Value, col4Value, timeT1
col1Value, col2Value, col3Value, col4Value, timeT1
col1Value, col2Value, col3Value, col4Value, timeT1
col1Value, col2Value, col3Value, col4Value, timeT2
col1Value, col2Value, col3Value, col4Value, timeT2
col1Value, col2Value, col3Value, col4Value, timeT2
col1Value, col2Value, col3Value, col4Value, timeT2
col1Value, col2Value, col3Value, col4Value, timeT3
col1Value, col2Value, col3Value, col4Value, timeT3
データセットはそれほど大きくなく、単一のマッパーのみが使用されます。だから私の質問は:
単一のマシンで、選択されたすべての行 (ハイブのマッパーの各行) に対して unix_timestamp() が評価されますか?それとも 1 つの値が評価され、すべての行に使用されますか?
MapR M5/hive 0.9.0 を使用しています