問題タブ [hive-serde]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
791 参照

hadoop - テーブル内のさまざまな値タイプの Hive の CSV Serde 形式

CSV ファイルには、以下の乱雑な形式のユーザー調査が含まれており、文字列、int、範囲などのさまざまなデータ型が含まれています。

中国、20~30 歳、男性、xxxxx、yyyyy、モバイル開発者。zzzz-vvvv; 「$40,000-50,000」、コンサルティング

日本、30~40 歳、女性、xxxxx、ソフトウェア開発者、zzzz-vvvv; "$40,000-50,000"、開発

. . . . .

以下のコードは、CSV ファイルを各列にそれぞれの値が正しく割り当てられた Hive テーブルに変換するために使用されます。

このコードは正常に機能し、各列はそれぞれの値で個別に割り当てられました。すべての Select クエリで真の結果が得られます。

上のテーブル ("2016table") から別のテーブル ("2016sort") を少ない列で作成しようとすると、異なる列で値が混在しています。

そのために使用されるコード

しかし、このコードは値を台無しにします。2016sortからgender1を選択すると、性別列の値と他の列の値が混在します。

何が欠けているかを理解するのを手伝ってくれる人はいますか!

0 投票する
1 に答える
976 参照

hive - Hive で ProtoBuf シリアル化された HBase 列を逆シリアル化する方法は?

ProtoBuf を使用してクラスをシリアル化し、HBase 列に格納しました。単純な集計の Map Reduce ジョブの数を減らしたいので、データをクエリするための SQL のようなツールが必要です。Hive を使用する場合、HBaseStorageHandler を拡張して、各テーブルに独自の Serde を作成することは可能ですか? または、他の適切な解決策が利用可能です。

更新しました:

HBaseテーブルを次のように作成しました

「ハイブ: ユーザー」、「私」を作成します。

Java APIからユーザーデータを挿入し、

私のスキャン結果は次のとおりです。

Hive でテーブルを照会すると、レコードが表示されません。これが、テーブルを作成するために使用したコマンドです。

ハイブ テーブルにクエリを実行すると、hbase から挿入されたレコードが表示されません。

ここで何が間違っているのか教えてください。