問題タブ [hive-serde]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
hadoop - テーブル内のさまざまな値タイプの Hive の CSV Serde 形式
CSV ファイルには、以下の乱雑な形式のユーザー調査が含まれており、文字列、int、範囲などのさまざまなデータ型が含まれています。
中国、20~30 歳、男性、xxxxx、yyyyy、モバイル開発者。zzzz-vvvv; 「$40,000-50,000」、コンサルティング
日本、30~40 歳、女性、xxxxx、ソフトウェア開発者、zzzz-vvvv; "$40,000-50,000"、開発
. . . . .
以下のコードは、CSV ファイルを各列にそれぞれの値が正しく割り当てられた Hive テーブルに変換するために使用されます。
このコードは正常に機能し、各列はそれぞれの値で個別に割り当てられました。すべての Select クエリで真の結果が得られます。
上のテーブル ("2016table") から別のテーブル ("2016sort") を少ない列で作成しようとすると、異なる列で値が混在しています。
そのために使用されるコード
しかし、このコードは値を台無しにします。2016sortからgender1を選択すると、性別列の値と他の列の値が混在します。
何が欠けているかを理解するのを手伝ってくれる人はいますか!
hive - Hive で ProtoBuf シリアル化された HBase 列を逆シリアル化する方法は?
ProtoBuf を使用してクラスをシリアル化し、HBase 列に格納しました。単純な集計の Map Reduce ジョブの数を減らしたいので、データをクエリするための SQL のようなツールが必要です。Hive を使用する場合、HBaseStorageHandler を拡張して、各テーブルに独自の Serde を作成することは可能ですか? または、他の適切な解決策が利用可能です。
更新しました:
HBaseテーブルを次のように作成しました
「ハイブ: ユーザー」、「私」を作成します。
Java APIからユーザーデータを挿入し、
私のスキャン結果は次のとおりです。
Hive でテーブルを照会すると、レコードが表示されません。これが、テーブルを作成するために使用したコマンドです。
ハイブ テーブルにクエリを実行すると、hbase から挿入されたレコードが表示されません。
ここで何が間違っているのか教えてください。