Hadoop を使用して JSON を CSV ファイルに変換し、Hive でそれらにアクセスしています。
現時点では、Mapper は JSON-Smart を使用して JSON を解析する独自のデータ構造を埋めています。次に、レデューサーはそのオブジェクトを読み取り、コンマで区切ってファイルに書き込みます。これを高速化するために、データ構造に書き込み可能なインターフェイスを既に実装しています...
ここで、データ構造オブジェクトに Avro を使用して、柔軟性とパフォーマンスを向上させたいと考えています。書き込み可能なオブジェクトではなく Avro オブジェクトを交換するようにクラスを変更するにはどうすればよいですか?