Hadoop とビッグデータ テクノロジは初めてです。parquet ファイルを avro ファイルに変換し、そのデータを読み取るのが好きです。いくつかのフォーラムを検索したところ、AvroParquetReader の使用が提案されました。
AvroParquetReader<GenericRecord> reader = new AvroParquetReader<GenericRecord>(file);
GenericRecord nextRecord = reader.read();
しかし、AvroParquetReader を含める方法がわかりません。まったくインポートできません。
spark-shell を使用してこのファイルを読み取ることができ、それを何らかの JSON に変換し、その JSON を avro に変換できます。しかし、私はより簡単な解決策を探しています。