0

Hive 0.8 と Hadoop 1.03 では、次の表を検討してください。

CREATE TABLE table (
  key int,
  date timestamp,
  name string,
  surname string,
  height int,
  weight int,
  age int) 
CLUSTERED BY(key) INTO 128 BUCKETS
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ',';

それから私は試しました:

select *
from table
where key=xxx
order by date;

結果はソートされますが、列名の後のすべてが間違っています。実際、すべての行のそれぞれのフィールドの値がまったく同じで、姓の列がありません。名前と姓のビットマップ インデックスとキーのインデックスもあります。

クエリに何か問題がありますか、それとも order by に関するバグを調査する必要がありますか (特定のものが見つかりません)。

4

1 に答える 1

0

ハイブへのデータのロード中にエラーが発生したようです。挿入を妨げる可能性のある特殊文字が CSV ファイルに含まれていないことを確認してください。

そして、キー プロパティによってクラスター化されました。このキーは CSV のどこから取得されますか? または他のソース?これがユニークだと確信していますか?

于 2012-10-31T10:41:48.513 に答える