メンバー変数として複数のプリミティブとコレクションを持つ複雑な Java (JAXB) オブジェクトを考えてみましょう。Reducer フェーズは、そのようなオブジェクトを < K, V > のペアとして HDFS に出力します。ここで、K は ID であり、V はオブジェクトのシリアル化された形式 (SequenceFileOutputFormat) です。
これらの Java シリアライズ オブジェクトを HDFS/ローカル ロケーションから Hive/Impala にロードすることは可能ですか?
MongoDB には、すぐに使用できる json ドキュメントとして JAXB オブジェクトを格納する機能があります。Hive または Impala で同じことを達成するための助けをいただければ幸いです。