問題タブ [hive-partitions]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
hive - ハイブインタビューの質問のパーティション.
1) パーティション化された列にデータがない場合、それをクエリすると、どのようなエラーが発生しますか?
2)一部の行にパーティション化された列がない場合、それらの行はどのように処理されますか? データの損失はありますか?
3)数値列でバケット化を行う必要があるのはなぜですか? 文字列列も使用できますか? どのようなプロセスで、何に基づいてバケット列を選択しますか?
4) 内部テーブルの詳細もメタストアに保存されますか? または、外部テーブルの詳細のみが保存されますか?
5) レデューサーではなくマッパー側でのみ実行される、またはその逆のクエリのタイプは何ですか?
hive - ハイブのパーティション列で許可されているデータ型は何ですか?
STRUCT のような複雑な型をパーティション列の型にすることはできないと確信しています。しかし、すべてのプリミティブ型が有効かどうかはわかりません。多くのドキュメントを読みましたが、何も見つかりませんでした。
hive - 1 つのパーティションのデータをハイブの複数のパーティションに挿入/コピーする方法は?
ハイブ テーブルにデータがありday='2019-01-01'
ます。同じデータを 2019 年 1 月全体にコピーしたいと考えています。(つまり'2019-01-02'
、'2019-01-03'
... '2019-01-31'
)
フォローしようとしていますが、データは「2019-01-02」にのみ挿入され、「2019-01-03」には挿入されません。