hadoop - データを台無しにする HIVE オーダー

Question

Hive 0.8 と Hadoop 1.03 では、次の表を検討してください。

CREATE TABLE table (
  key int,
  date timestamp,
  name string,
  surname string,
  height int,
  weight int,
  age int) 
CLUSTERED BY(key) INTO 128 BUCKETS
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ',';

それから私は試しました：

select *
from table
where key=xxx
order by date;

結果はソートされますが、列名の後のすべてが間違っています。実際、すべての行のそれぞれのフィールドの値がまったく同じで、姓の列がありません。名前と姓のビットマップインデックスとキーのインデックスもあります。

クエリに何か問題がありますか、それとも order by に関するバグを調査する必要がありますか (特定のものが見つかりません)。

score 0 · Accepted Answer

ハイブへのデータのロード中にエラーが発生したようです。挿入を妨げる可能性のある特殊文字が CSV ファイルに含まれていないことを確認してください。

そして、キープロパティによってクラスター化されました。このキーは CSV のどこから取得されますか? または他のソース？これがユニークだと確信していますか？

hadoop - データを台無しにする HIVE オーダー

1 に答える 1

Related

Reference