ハイブsort by
とorder by
コマンドは、ソートされた順序でデータをフェッチするために使用されます。
例えば:
並び替え
hive> SELECT E.EMP_ID FROM Employee E SORT BY E.empid;
並べ替え
hive> SELECT E.EMP_ID FROM Employee E order BY E.empid;
sort by
Hive SQL でのとorder by
クエリの違いは何ですか?
ハイブsort by
とorder by
コマンドは、ソートされた順序でデータをフェッチするために使用されます。
例えば:
並び替え
hive> SELECT E.EMP_ID FROM Employee E SORT BY E.empid;
並べ替え
hive> SELECT E.EMP_ID FROM Employee E order BY E.empid;
sort by
Hive SQL でのとorder by
クエリの違いは何ですか?
Hive は、リデューサーごとにデータを並べ替える SORT BY をサポートしています。"order by" と "sort by" の違いは、前者は出力の全体的な順序を保証するのに対し、後者はレデューサー内の行の順序のみを保証することです。複数のレデューサーがある場合、「並べ替え」により、部分的に順序付けされた最終結果が得られる場合があります。
注: 単一列の SORT BY 単独と CLUSTER BY の違いについては、混乱を招く可能性があります。違いは、CLUSTER BY はフィールドごとに分割し、SORT BY は複数のレデューサーが存在する場合、データをレデューサー間で均一に分散 (およびロード) するためにランダムに分割することです。
基本的に、各レデューサーのデータは、ユーザーが指定した順序に従って並べ替えられます。次の例は、
SELECT キー、値 FROM src SORT BY キー ASC、値 DESC
SORT BY
通常のSQL実装には存在しません。詳細はおそらくHiveのドキュメントに記載されていますが、Gaurangの回答は、それがレデューサーごとであることを示していSORT BY
ます。
ORDER BY
(私の知る限り)すべてのSQL実装に含まれています。ウィキペディアにはそれを説明する記事があります。
SQLには「sortBy」のようなものはありません
SQL でのデータのORDER BY
ソートには、結果セット内のレコードをソートできる句が使用されます。SELECT
また、ステートメントでのみ使用できます。
例えば:
SELECT columns FROM tables WHERE predicates ORDER BY column ASC/DESC;
このORDER BY
句は、指定された列に基づいて結果セットをソートします。
ASC
昇順を示します。
DESC
降順を示します。
デフォルトはASC