hadoop - Hive を使用して protobuf 列を逆シリアル化する

Question

私はハイブに本当に慣れていないので、質問に誤解がある場合は申し訳ありません。

Hadoop シーケンスファイルを Hive テーブルに読み込む必要があります。シーケンスファイルは、Hive に付属の SerDe2 を使用して逆シリアル化できるリサイクルバイナリデータです。

問題は次のとおりです。ファイル内の 1 つの列が Google protobuf でエンコードされているため、thrift SerDe がシーケンスファイルを処理するときに、protobuf でエンコードされた列が適切に処理されません。

Hive で、thrift シーケンスファイル内にネストされたこの種の protobuf でエンコードされた列を処理して、各列を適切に解析できるようにする方法があるのだろうか?

可能な限りの助けをありがとう！

score 0 · Accepted Answer

proto buff フォーマットを逆シリアル化するには、他の serde を使用する必要があると思います。

これを参照してもいいかもしれませんが、

1 に答える 1